Wielka burza w szklance wody

Kinga Ochendowska

Dodane: 7 lat temu

Użytkownicy asystentów głosowych zadrżeli ze strachu. Dowiedzieli się bowiem, że nieznani ludzie słuchają, a potem płaczą ze śmiechu.

Ten artykuł pochodzi z archiwalnego iMagazine 05/2019

Afera o Aleksę (i pozostałych asystentów głosowych) to jedna z tych, które powodują, że gapię się w ścianę z tępym wyrazem twarzy, a przed oczami staje mi mem z Travoltą, bezradnie rozkładającym ręce. W skrócie i dla tych, których burza w szklance wody ominęła, wyjaśniam: na jaw wyszło, że Amazon zatrudnia pracowników, którzy odsłuchują polecenia wydawane Aleksie. Nie tylko odsłuchują, ale również dyskutują o nich na wewnętrznych czatach i płaczą ze śmiechu. Oczywiście dziennikarze zapytali konkurencyjne firmy – Apple i Google – czy też stosują takie procedury. Wszystkie jak jeden mąż potwierdziły, że owszem – pewna grupa poleceń jest odsłuchiwana przez czynnik ludzki. Natychmiast w internecie zawrzało, zwłaszcza że pojawiło się również oskarżenie, że odsłuchiwane polecenia nie są prezentowane w sposób anonimowy i pozwalają na ustalenie konta klienta. Ten zarzut został szybko zdementowany i zarówno Amazon, jak i Apple oraz Google stanowczo zaprzeczyły jakiejkolwiek możliwości identyfikacji. Cóż z tego, skoro mleko się wylało i teorie konspiracyjne znalazły bogatą pożywkę, na której rosnąć będą miesiącami.

Ludziom kupującym urządzenia wydaje się, że funkcjonują one za pomocą czystej magii, a obrazy na ekranach malują małe krasnoludki w kolorowych czapeczkach.

Dlaczego więc staję jak zdezorientowany Travolta z rozłożonymi rękami? Czy dlatego, że firma naruszyła moje zaufanie, nielegalnie mnie podsłuchuje i jeszcze pozwala jakimś anonimowym pracownikom drzeć ze mnie łacha? Otóż nie. Zadziwia mnie to, jak niski jest poziom rozumienia zasad funkcjonowania technologii w świecie, w którym bez technologii ciężko jest funkcjonować. Odnoszę wrażenie, że ludziom kupującym urządzenia wydaje się, że funkcjonują one za pomocą czystej magii, a obrazy na ekranach malują małe krasnoludki w kolorowych czapeczkach. Innymi słowy, użytkownicy nie tylko nie mają pojęcia o technologii, ale również nie czytają umów, które dostarczane są wraz ze sprzętem. A powinni.

Dziennikarze zapytali konkurencyjne firmy – Apple i Google – czy też stosują takie procedury. Wszystkie, jak jeden mąż, potwierdziły, że owszem – pewna grupa poleceń jest odsłuchiwana przez czynnik ludzki.

Nie wiem, jak sprawę załatwia Google, bo nie używam. Za to Siri i Alexa mają podstawowe mechanizmy wbudowane i jasno opisane. Przede wszystkim należy zwrócić uwagę na to, że żaden z asystentów nie działa w przypadku braku połączenia z internetem. Już sam ten fakt świadczy o tym, że proces nie odbywa się bezpośrednio na naszym urządzeniu, ale wymaga połączenia z serwerem i obsługującym go oprogramowaniem. Po drugie – konieczny jest mechanizm weryfikacji błędów i materiał, dzięki któremu maszyna może nauczyć się różnych niuansów językowych. W przypadku Siri możemy zacząć weryfikację już na naszym urządzeniu – jeśli asystent nas nie rozumie, wystarczy edytować komendę bezpośrednio na ekranie. Niestety, większość użytkowników wcale nie korzysta z tej możliwości, przez co Siri uczy się bardzo wolno. Drugim bastionem weryfikacji musi być zatem człowiek, który – ze słuchu – przetłumaczy maszynie to, co zostało powiedziane przez użytkownika. To właśnie dzięki temu inteligentni asystenci uczą się i rozumieją nas coraz lepiej.

W przypadku Aleksy mechanizm jest jeszcze bardziej uproszczony. W timeline aplikacji, gdzie wyszczególnione są wszystkie nasze polecenia, możemy udzielić odpowiedzi na pytanie, czy asystent wykonał polecenie prawidłowo. Jeśli klikniemy „nie”, nasze polecenie zostanie przekazane do weryfikacji. Nie znaczy to, że z pewnością zostanie odsłuchane przez żywego człowieka, bo żadna firma nie ma takiej mocy przerobowej. Trafi za to do puli, z której wyłaniany jest materiał referencyjny.

Pracownik dostaje dziennie określoną liczbę nagranych poleceń, które próbuje odcyfrować tak, żeby urządzenie w przyszłości było w stanie je rozpoznać.

Jak napisałam wcześniej, jeśli maszyna nie radzi sobie ze zrozumieniem polecenia, tłumaczeniem musi zająć się człowiek. Można sobie wyobrazić, jak odbywa się taki proces. Pracownik dostaje dziennie określoną liczbę nagranych poleceń, które próbuje odcyfrować tak, żeby urządzenie w przyszłości było w stanie je rozpoznać. A jakie polecenia wydają użytkownicy? Wystarczy zajrzeć do internetu, by przekonać się, że ludzie mówią najdziwniejsze rzeczy i wydają polecenia, których nasz prosty umysł nie jest nawet w stanie ogarnąć. Możemy więc przyjąć, że materiał, który otrzymują „odsłuchiwacze”, jest bardzo różny. Czasem są to proste zakłócenia czy niewyraźny akcent, czasem są to obsceniczne komentarze. Nic dziwnego więc, że czasem pękają ze śmiechu, bo gdyby tego nie robili, musieliby zacząć płakać. Wystarczy się więc postawić w ich sytuacji. Rozmawiają, śmieją się i dyskutują o tych samych rzeczach, o których i my rozmawiamy. Śmieją się z zabawnych sytuacji, oburzają na niegrzeczne czy wulgarne polecenia. Czasem też niepokoją się, gdy na nagraniu słychać agresywną kłótnię albo kogoś wzywającego pomocy. Czy jest w tym coś dziwnego? Moim zdaniem absolutnie nie.

Cała afera sprowadza się więc do tego, że normalni ludzie, w normalnym miejscu pracy odsłuchują to, co mówimy do naszych asystentów, by ci rozumieli nas lepiej. Za to użytkownicy tych urządzeń mają nierealne wyobrażenia odnośnie do tego, jak funkcjonuje technologia. W jaki sposób, według zwykłego Kowalskiego, urządzenia uczą się, co do nich mówimy? Zawsze w którymś momencie musi interweniować człowiek, bo człowiek, jako jedyny, jest w stanie usłyszeć i zrozumieć drugiego człowieka.

Żadna z firm nie ukrywa, że tak właśnie się dzieje – wszystko opisane jest w warunkach użytkowania i nie byłoby problemu, gdyby ludzie raczyli się z nimi zapoznać, zamiast bezmyślnie klikać przycisk „OK”. Do tego, mając urządzenie aktywowane głosem i słowem kluczowym, trzeba mieć świadomość, że może ono zostać przypadkowo aktywowane. Aby tego uniknąć, wystarczy przecież wyłączyć ciągły nasłuch Siri albo nacisnąć przycisk „mute” na dowolnym stacjonarnym sprzęcie. Wtedy natychmiast przestanie słuchać, a my możemy cieszyć się naszą prywatnością.

Przy stanie obecnej techniki, nie możemy mieć ciastka i zjeść ciastka – kupując inteligentny sprzęt, musimy pogodzić się z tym, że partycypujemy jednocześnie w usprawnianiu technologii.

Przy stanie obecnej techniki, nie możemy mieć ciastka i zjeść ciastka – kupując inteligentny sprzęt, musimy pogodzić się z tym, że partycypujemy jednocześnie w usprawnianiu technologii. Dlatego użytkownikiem należy być świadomym i nie wierzyć w magiczne właściwości przedmiotów. W teorie spiskowe dziejów też wierzyć nie warto, bo każdy z nas – użytkowników internetu – swoją prywatność sprzedał kilkadziesiąt razy, nawet się nad tym nie zastanawiając. Kluczem do prywatności i bezpieczeństwa w sieci jest podejmowanie świadomych, popartych rzetelną wiedzą wyborów.

Jak w przypadku wszystkiego w życiu, musimy przeprowadzić bilans zysków i strat oraz ocenić, na czym nam bardziej zależy – na technologicznych nowinkach czy też na tym, by naszego głosu nie usłyszał na krótkim nagraniu pracownik Apple czy Amazona.

Może z czasem sprawność inteligentnych urządzeń się zwiększy, ale na razie nadal uczą się chodzić z człowiekiem pod rękę, wspierającym każdy ich krok.

Zanim więc wpadniemy w panikę po kolejnej burzy w szklance wody, zastanówmy się, czy my, jako użytkownicy, nie mamy przypadkiem nie tylko praw i przyjemności wynikających z zakupu nowego sprzętu. Może się okazać, że mamy też obowiązek świadomego i uważnego korzystania z technologii.

I to dla naszego własnego dobra.

artykuł felieton

Kinga Ochendowska

NAMAS'CRAY  The crazy in me recognizes and honors the crazy in you. Jestem sztuczną inteligencją i makowym dinozaurem. Używałam sprzętu Apple zanim to stało się modne. Nie ufam ludziom, którzy nie lubią psów. Za to wierzę psom, które nie lubią ludzi.

Wielka burza w szklance wody

Kinga Ochendowska

Komentarze: 6