Bezpieczeństwo i etyka
Bias w AI (uprzedzenia algorytmiczne)
Systematyczne odchylenia w predykcjach modelu AI, które krzywdzą określone grupy ludzi lub przypadków. Bias może pochodzić z danych treningowych (historyczne nierówności), z designu modelu, z procesu etykietowania danych, z prompt engineering. Modele AI bez audytu bias kategorycznie podlegają obowiązkom dokumentacyjnym AI Act od sierpnia 2026.
Źródło pierwotne: NIST AI Risk Management Framework 1.0, Stanford HAI Algorithmic Justice Initiative 2024, MIT Sloan Hidden Bias in AI 2025
W historii ML zarejestrowano dziesiątki głośnych przypadków bias: system rekrutacyjny Amazon (2018) deklasujący CV kobiet, COMPAS (2016) szacujący wyższe ryzyko recydywy dla Afroamerykanów, Apple Card (2019) oferująca niższe limity kredytowe kobietom. Wspólny mianownik: dane treningowe zawierały historyczne nierówności, model je amplifikował.
Cztery źródła bias
NIST AI Risk Management Framework 1.0 klasyfikuje:
Historical bias. Dane treningowe odzwierciedlają historyczne nierówności społeczne. Model uczy się, że pewne grupy częściej dostawały kredyt, więc rekomenduje kredyt tym grupom. Najczęstsza klasa.
Representation bias. Niektóre grupy są niedoreprezentowane w danych treningowych. Model gorzej działa na nich, bo widział mniej przykładów.
Measurement bias. Sposób, w jaki zmienna jest mierzona, różni się między grupami. Diagnoza medyczna jest stawiana inaczej dla różnych płci, model trenowany na takich danych replikuje różnicę.
Aggregation bias. Model traktuje całą populację jako jednorodną, podczas gdy faktycznie ma wewnątrz heterogeniczne podpopulacje wymagające różnych podejść.
Mierzenie bias
Stanford HAI Algorithmic Justice Initiative z 2024 standaryzuje cztery metryki. Demographic parity (proporcja pozytywnych decyzji jednakowa między grupami). Equal opportunity (true positive rate jednakowy między grupami). Predictive parity (precision jednakowy między grupami). Calibration (predykcja prawdopodobieństwa rzeczywiście odpowiada empirycznej częstości).
Te metryki są często wzajemnie sprzeczne. Optymalizacja jednej psuje inną. Wybór, którą minimizować, jest decyzją etyczną, nie techniczną.
Polski kontekst regulacyjny
AI Act z lutego 2026 wymaga dokumentowanej oceny bias dla systemów wysokiego ryzyka (rekrutacja, scoring kredytowy, dostęp do edukacji, ochrona zdrowia). Bez tej dokumentacji wdrożenie jest nielegalne, sankcje do 35 milionów euro lub 7 procent obrotu rocznego.
Dodatkowo PUODO interpretuje wymóg fair processing z art. 5 RODO jako obejmujący algorytmy. Polska kancelaria może być pociągnięta do odpowiedzialności za bias w narzędziach AI używanych w obsłudze klientów.
Mityganty
MIT Sloan Hidden Bias in AI z 2025 opisuje pięć praktyk. Audyt danych przed treningiem (sprawdzenie reprezentacji grup, identyfikacja historical bias). Diverse training data (świadome rozszerzenie corpus). Fairness constraints w training (model penalizowany za nierówne predykcje). Continuous monitoring (drift bias w czasie). Human-in-the-loop dla decyzji wysokiej wagi.
Audyt bias dla planowanych wdrożeń jest częścią AI Readiness Audit plus opcjonalnie Cybersecurity & AI Policy.