Bezpieczeństwo i etyka
Explainable AI / XAI (wyjaśnialność decyzji modeli AI)
Zestaw technik umożliwiających zrozumienie, dlaczego model AI podjął konkretną decyzję. Wymagana przez AI Act dla systemów wysokiego ryzyka, przez sektor finansowy przez Rekomendację KNF, przez sektor medyczny przez MDR. Bez XAI model jest czarną skrzynką niedopuszczalną w kontekstach regulowanych.
Źródło pierwotne: DARPA XAI Program 2017-2021, NIST Four Principles of Explainable AI 2021, IBM Research AI Explainability 360 Library 2023
DARPA uruchomiła program XAI w 2017 jako odpowiedź na rosnące zaufanie do modeli ML w zastosowaniach krytycznych. Cztery lata później program wygenerował biblioteki, metryki i taksonomię, która stała się standardem branżowym. NIST opublikował w 2021 dokument Four Principles of Explainable AI który stał się referencją w regulacjach.
Cztery zasady NIST
Explanation. System dostarcza wyjaśnienie wraz z decyzją. Nie tylko "kredyt odmówiony", ale "kredyt odmówiony z powodu czynników X, Y, Z, w tej kolejności wagi".
Meaningful. Wyjaśnienie jest zrozumiałe dla docelowego odbiorcy. Wyjaśnienie dla klienta różni się od wyjaśnienia dla regulatora.
Explanation Accuracy. Wyjaśnienie faktycznie odzwierciedla, co model robił. Post-hoc rationalization nie jest XAI.
Knowledge Limits. System wskazuje, kiedy nie wie albo nie jest pewny. Brak udawania pewności.
Trzy klasy technik
IBM Research AI Explainability 360 Library z 2023 standaryzuje implementacje.
Modele inherently interpretable. Decision trees, linear regression, generalized additive models. Sama struktura modelu jest wyjaśnieniem. Najbezpieczniejsze dla zastosowań krytycznych, ale niższa jakość predykcji niż sieci neuronowe.
Post-hoc model-agnostic methods. LIME (Local Interpretable Model-agnostic Explanations), SHAP (SHapley Additive exPlanations). Działają na dowolnym modelu, wyjaśniają decyzję dla konkretnego przypadku przez aproksymację lokalną. Najpopularniejsze w enterprise w 2025.
Attention visualization for LLM. Wizualizacja, które fragmenty inputu LLM "patrzy" generując konkretną odpowiedź. Pomocne dla debugowania, ograniczone jako prawdziwe wyjaśnienie (badania Stanford 2023 podają w wątpliwość wiarygodność attention jako proxy dla decyzji modelu).
Polski kontekst
Rekomendacja S Komisji Nadzoru Finansowego z 2023 wymaga od banków używających modeli scoring kredytowego dokumentacji wyjaśnialności na poziomie indywidualnej decyzji klienta. Czyli klient odmówiony musi otrzymać czynniki decyzji, nie tylko fakt odmowy.
AI Act z lutego 2026 rozszerza ten wymóg na wszystkie systemy wysokiego ryzyka. Sankcje za brak XAI w obszarze regulowanym: do 35 milionów euro.
Koszt wdrożenia XAI
Dodanie SHAP do istniejącego modelu: 50-150 tysięcy złotych jednorazowo (engineering, testy). Inherently interpretable models od początku: brak dodatkowego kosztu, ale typowo 5-15 procent niższa jakość predykcji. Wybór jest trade-offem między dokładnością a wyjaśnialnością, zależnym od kontekstu.
Decyzję XAI strategy dla planowanych wdrożeń podejmujemy w ramach AI Readiness Audit.