Explainable AI / XAI (wyjaśnialność decyzji modeli AI), definicja i kontekst biznesowy, yesfor

DARPA uruchomiła program XAI w 2017 jako odpowiedź na rosnące zaufanie do modeli ML w zastosowaniach krytycznych. Cztery lata później program wygenerował biblioteki, metryki i taksonomię, która stała się standardem branżowym. NIST opublikował w 2021 dokument Four Principles of Explainable AI który stał się referencją w regulacjach.

Cztery zasady NIST

Explanation. System dostarcza wyjaśnienie wraz z decyzją. Nie tylko "kredyt odmówiony", ale "kredyt odmówiony z powodu czynników X, Y, Z, w tej kolejności wagi".

Meaningful. Wyjaśnienie jest zrozumiałe dla docelowego odbiorcy. Wyjaśnienie dla klienta różni się od wyjaśnienia dla regulatora.

Explanation Accuracy. Wyjaśnienie faktycznie odzwierciedla, co model robił. Post-hoc rationalization nie jest XAI.

Knowledge Limits. System wskazuje, kiedy nie wie albo nie jest pewny. Brak udawania pewności.

Trzy klasy technik

IBM Research AI Explainability 360 Library z 2023 standaryzuje implementacje.

Modele inherently interpretable. Decision trees, linear regression, generalized additive models. Sama struktura modelu jest wyjaśnieniem. Najbezpieczniejsze dla zastosowań krytycznych, ale niższa jakość predykcji niż sieci neuronowe.

Post-hoc model-agnostic methods. LIME (Local Interpretable Model-agnostic Explanations), SHAP (SHapley Additive exPlanations). Działają na dowolnym modelu, wyjaśniają decyzję dla konkretnego przypadku przez aproksymację lokalną. Najpopularniejsze w enterprise w 2025.

Attention visualization for LLM. Wizualizacja, które fragmenty inputu LLM "patrzy" generując konkretną odpowiedź. Pomocne dla debugowania, ograniczone jako prawdziwe wyjaśnienie (badania Stanford 2023 podają w wątpliwość wiarygodność attention jako proxy dla decyzji modelu).

Polski kontekst

Rekomendacja S Komisji Nadzoru Finansowego z 2023 wymaga od banków używających modeli scoring kredytowego dokumentacji wyjaśnialności na poziomie indywidualnej decyzji klienta. Czyli klient odmówiony musi otrzymać czynniki decyzji, nie tylko fakt odmowy.

AI Act z lutego 2026 rozszerza ten wymóg na wszystkie systemy wysokiego ryzyka. Sankcje za brak XAI w obszarze regulowanym: do 35 milionów euro.

Koszt wdrożenia XAI

Dodanie SHAP do istniejącego modelu: 50-150 tysięcy złotych jednorazowo (engineering, testy). Inherently interpretable models od początku: brak dodatkowego kosztu, ale typowo 5-15 procent niższa jakość predykcji. Wybór jest trade-offem między dokładnością a wyjaśnialnością, zależnym od kontekstu.

Decyzję XAI strategy dla planowanych wdrożeń podejmujemy w ramach AI Readiness Audit.