Rozmowy nie zablokujesz firewallem. Jak hakerzy używają języka naturalnego do ataków na firmowe AI

Agnieszka Serafinowicz

Dodane: 9 godzin temu

Firmy na wyścigi wdrażają sztuczną inteligencję, zapominając o jednej kluczowej kwestii. Tradycyjne zapory sieciowe, które od dwóch dekad chroniły nasze dane, są całkowicie ślepe na ataki wymierzone w modele językowe.

Hakerzy nie muszą już łamać skomplikowanych zabezpieczeń w kodzie – wystarczy, że odpowiednio „porozmawiają” z firmowym chatbotem, by wyciągnąć wrażliwe informacje lub ominąć autoryzację. W świecie, w którym komendy wydaje się zwykłym tekstem, cyberbezpieczeństwo musi wymyślić się na nowo.

Haker zamiast kodu używa słów

Pod względem tempa wdrożeń sztuczna inteligencja wyprzedziła rewolucję mobilną i rozwój chmury obliczeniowej. Szacuje się, że tylko w tym roku aż 80 proc. przedsiębiorstw zaimplementuje rozwiązania oparte na AI. Niestety, biznesowemu entuzjazmowi rzadko towarzyszy odpowiednia ochrona. Dotychczasowe systemy typu firewall czy WAF analizują wyłącznie z góry określone wzorce w ruchu sieciowym. Tymczasem komunikacja z modelami językowymi (LLM) opiera się na elastycznym języku naturalnym.

To sprawia, że rozmowy z botem po prostu nie da się przefiltrować starymi metodami. Efekty tego technologicznego długu widać w statystykach – już teraz 75 proc. dyrektorów ds. bezpieczeństwa (CISO) raportuje incydenty związane ze sztuczną inteligencją. Dla przeciętnego pracownika to wyraźny sygnał ostrzegawczy: zaufanie do narzędzi AI w firmie musi być ograniczone, bo bezmyślnie „wklejona” tam wiedza bywa niezwykle łatwa do wydobycia przez osoby z zewnątrz.

Od Asany po Lenovo. Kiedy algorytm ufa bezgranicznie

Zagrożenia nie są jedynie czysto teoretyczne, a nowa powierzchnia ataku wymusza naukę zupełnie nowych pojęć. Głośny incydent w firmie Lenovo udowodnił, jak groźny bywa atak typu prompt injection. Hakerzy wprowadzili do firmowego chatbota komendę, która całkowicie zmieniła jego pierwotną rolę. Systemy bazowe ślepo zaufały maszynie, w ogóle nie weryfikując jej poleceń, co doprowadziło do przejęcia uprawnień. Problem nie leżał w luce oprogramowania, ale w fakcie, że sztuczna inteligencja sama decydowała o autoryzacji.

Z kolei w przypadku platformy Asana błąd w izolacji danych sprawił, że wewnętrzne informacje wyciekały w postaci płynnego tekstu w ramach zwykłych konwersacji innych użytkowników. W środowiskach AI hakerzy wykorzystują takie wysublimowane techniki, jak zatruwanie danych (data poisoning) jeszcze na etapie trenowania modelu czy kompresja tokenów, w której złośliwe instrukcje ukryte są w formatach czytelnych wyłącznie dla maszyny.

Wiadro na tsunami, czyli dlaczego ręczne testy to fikcja

Wobec nowych zagrożeń branża IT musi masowo sięgnąć po tzw. AI red-teaming, czyli zautomatyzowane, nieustanne bombardowanie własnych systemów symulowanymi atakami. Ręczne wpisywanie złośliwych promptów w okno czatu, by sprawdzić jego odporność, przypomina dzisiaj próbę zatrzymania tsunami za pomocą wiadra. Nowoczesne, agentowe systemy AI generują nieskończoną liczbę kombinacji odpowiedzi, które zmieniają się w ułamki sekund w zależności od całego kontekstu rozmowy.

Zespoły bezpieczeństwa muszą dziś testować nie statyczny interfejs, ale żywą, ewoluującą wymianę zdań. Sytuację potęgują wchodzące w życie przepisy – chociażby unijny AI Act wprost wymusza na firmach prowadzenie rygorystycznych testów odpornościowych (adversarial testing) dla systemów wysokiego ryzyka. Wnioski są brutalne: bez zautomatyzowanych testów zachowania modelu pod presją, wdrażanie sztucznej inteligencji na masową skalę przypomina jazdę sportowym autem bez zamontowanych hamulców.