Mastodon
Zdjęcie okładkowe wpisu Siri oraz inni asystenci głosowi początkiem świata Igrzysk Śmierci?

Siri oraz inni asystenci głosowi początkiem świata Igrzysk Śmierci?

4
Dodane: 8 lat temu

Jeśli w ciągu najbliższych lat Apple, Google czy Amazon nie opracują głosowych asystentów wspierających kilkadziesiąt języków, jako cywilizacja wkroczymy w ciemne wieki historii technologii, w którym kilka nacji otrzyma ogromną przewagę nad resztą świata.

Zapowiedzi Apple dotyczące rozwoju Siri, a przede wszystkim otwarcie API dla aplikacji firm trzecich, pozwalają założyć, że tak, jak to się już wielokrotnie zdarzyło w przeszłości, decyzja firmy z Cupertino doprowadzi do szybkiego rozwoju interakcji człowiek-komputer w skali globalnej. Nadal nie padły jednak deklaracje co do uruchomienia Siri wspierającej więcej niż kilka języków. Jeśli ta sytuacja nie zmieni się w ciągu kilku najbliższych lat, wkroczymy w erę, w której kilka nacji będzie dysponować technologiczną (a więc także gospodarczą i kulturową) przewagą nad pozostałymi krajami.

Kluczem do popularyzacji PC w ostatnich dekadach XX wieku – niezależnie od kręgu kulturowego – był prosty, intuicyjny interfejs graficzny wykorzystujący model WIMP (windows, icons, mouse, pointer). Dzięki temu użytkownik mógł wykonać proste czynności, nawet jeśli elementy interfejsu zostały opisane w obcym dla niego języku. Do dziś w krajach rozwijających się są przeprowadzane eksperymenty, polegające na dostarczeniu laptopów czy tabletów społecznościom, które nigdy nie miały kontaktu z wysokimi technologiami. Po kilku tygodniach okazuje się zwykle, że młodsze pokolenia są w stanie opanować obsługę tych urządzeń w imponującym zakresie.

Pionierzy HCI, tacy jak Douglas Engelbart czy Alan Kay, powtarzali, że interfejsy graficzne tworzą platformę komunikacji między człowiekiem a maszyną, pozwalającą na zwiększenie potencjału ludzkiego umysłu, dzięki delegowaniu wielu różnorodnych zadań na komputer. Komputery towarzyszą na co dzień milionom ludzi po tym, jak zrezygnowano z wiersza poleceń na korzyść wizualnej reprezentacji danych. Interfejsy graficzne drastycznie obniżyły barierę wejścia użytkowników w świat technologii konsumenckich. Wróćmy jednak do 2016 roku.

Z pewną ostrożnością można założyć, że interfejsy głosowe wykorzystujące język naturalny staną się w przewidywalnej przyszłości istotnym, jeśli nie dominującym, modelem komunikacji człowiek-komputer. Od kilku lat widzimy jednak niepokojącą tendencję – w pierwszej kolejności opracowuje się wersje asystentów, którzy wspierają dominujące języki, czytaj – języki, którymi posługują się obywatele liczących się gospodarek. Polacy należą do grupy, która odczuwa negatywne skutki tego trendu. W przypadku ekosystemu Apple nie możemy bowiem korzystać ze wszystkich jego możliwości. Polska oraz wiele innych krajów otrzymuje de facto okrojony produkt. Tymczasem powstają nowe aplikacje – boty komunikacyjne, asystenci głosowi – w coraz większym stopniu zintegrowane z systemami operacyjnymi. Nie mamy dostępu do tych nowości – nie możemy więc wdrażać się w sprawną obsługę tych rozwiązań równie szybko, co Amerykanie, Chińczycy, Francuzi, nie możemy też tworzyć lokalnych aplikacji. Sytuacja staje się poważna, jeśli przeskalujemy ten problem przez dziesiątki milionów użytkowników na całym świecie. Wygląda na to, że razem z miliardami ludzi nie załapaliśmy się na ten pociąg.

Jaron Lanier, amerykański ekspert technologii, argumentuje w książce „Who Owns the Future?”, że dominującą pozycję gospodarczą i kulturową osiągną w najbliższych dekadach te organizacje oraz państwa, które zapewnią sobie dostęp do najlepszych technologii – będą posiadać tak zwane Siren Servers – kluczowe centra danych i metod ich przetwarzania. Jeśli w rywalizację o ten status wpiszemy mimowolne odcięcie całych kultur i państw od interfejsów głosowych, sytuacja nie będzie przedstawiać się już tak trywialnie. Brak Siri wspierającej lokalne języki w milionach telefonów i komputerów może przynieść realne straty ekonomiczne, ale także mniej namacalne uwstecznienie w stosowaniu technologii w codziennym życiu. Przewagę kompetencyjną, a więc potencjał innowacyjności, od którego zależy przyszła pozycja kraju, zachowają społeczeństwa zaznajomione wcześniej z asystentami głosowymi.

Sytuacja ta nie jest oczywiście wynikiem rozplanowanego na wiele dekad naprzód spisku obliczonego na podtrzymania hegemoni świata anglo-amerykańskiego. Społeczeństwa mniej zamożnych krajów padają ofiarami twardej rynkowej logiki – innowacje trafiają w pierwszej kolejności na najistotniejsze rynki. Zakładam, że prędzej czy później Siri będzie wspierać także i język polski. Mam jednocześnie nadzieję, iż będziemy w stanie szybko odrobić kulturową i technologiczną stratę, jaka dzieli nas od użytkowników, którzy komunikują się na co dzień z asystentami głosowymi w swoich ojczystych językach.


Ten artykuł pochodzi z archiwalnego iMagazine 07/2016

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .

Komentarze: 4

Dzięki za artykuł. Porusza ważną wg mnie kwestię.

Mam prośbę: przed publikacją poświęćcie parę minut na wklejenie tekstu do jakiegokolwiek edytora z korektą pisowni – liczba literówek i błędów interpunkcyjnych jest naprawdę spora.

Dzięki.

Skonsultowałem się z korektą i autor niestety wgrał wersję własną, bez korekty. Postaramy się to poprawić ASAP. Dzięki za uwagi.

Super! Wasza reakcja to pełen profesjonalizm. :)
Dzięki i pozdrawiam!