Mastodon
Zdjęcie okładkowe wpisu „Czy on mnie lubi?” Żenujące rozmowy z ChatGPT wyciekają do… Google Search Console

„Czy on mnie lubi?” Żenujące rozmowy z ChatGPT wyciekają do… Google Search Console

0
Dodane: 1 dzień temu

Prywatne, wrażliwe, a czasem po prostu żenujące rozmowy użytkowników z ChatGPT od miesięcy wyciekają w jedno z najdziwniejszych możliwych miejsc: Google Search Console (GSC).

Dla wyjaśnienia GSC to nie Google Search, czyli wyszukiwarka Google. GSC jest narzędziem, którego specjaliści SEO, marketerzy cyfrowi i administratorzy stron (webmasterzy) używają do monitorowania, jakie frazy kierują ruch na ich stronę. Z tej definicji jasno widać, że Google Search Console nie ma nic wspólnego z podglądaniem prywatnych rozterek użytkowników ChatGPT. A jednak… Oto co się stało.

Problem w tym, że zamiast typowych, krótkich zapytań, administratorzy stron zaczęli znajdować w swoich panelach GSC dziwaczne, długie na 300 znaków zapytania. Były to surowe prompty, które niczego nieświadomi użytkownicy wpisywali do ChatGPT, oczekując, że rozmowa pozostanie prywatna.

Co wyciekło? Od analiz miłosnych po plany firmowe

Jason Packer, przywoływany przez serwis ArsTechnica analityk, właściciel firmy konsultingowej Quantable zajmującej się analityką ruchu w sieci, który jako pierwszy nagłośnił sprawę, przeanalizował na jednej tylko stronie około 200 takich dziwnych zapytań.

Wśród nich znalazł się absurdalnie długi strumień świadomości użytkowniczki, która prosiła ChatGPT o analizę zachowania chłopaka, by dowiedzieć się, czy mu się podoba. Inny wyciek pochodził od menedżera biura, który, planując ogłoszenie o powrocie do pracy stacjonarnej, podzielił się z AI wewnętrznymi informacjami biznesowymi.

Jak to możliwe? Śledztwo ujawnia scraping Google

Scraping to automatyczna technika, w której boty jakiejś organizacji – w opisywanym przypadku, należące do OpenAI – przeczesują wyszukiwarkę, by masowo wyciągać z niej dane, zamiast korzystać z oficjalnego API. Ot taka „szara strefa AI”.

Otóż Jason Packer, wraz z konsultantem Slobodanem Maniciem, postanowili zbadać, jak doszło do wycieku. Ich odkrycia, opisane na blogu Quantable, to prawdopodobnie „pierwszy ostateczny dowód na to, że OpenAI bezpośrednio skrapuje Google Search przy użyciu faktycznych zapytań użytkowników”.

Wszystko wskazuje na to, że błąd w ChatGPT powodował, że do zapytania użytkownika automatycznie doklejany był fragment adresu URL:

 https://openai.com/index/chatgpt/

Następnie, całe to absurdalnie długie zapytanie, takie jak np.:

https://openai.com/index/chatgpt/ chłopak się ze mną droczy, czy to znaczy, że mu się podobam, bo ostatnio...

było wysyłane jako zwykłe zapytanie do wyszukiwarki Google.

Dowodem na to ma być właśnie Google Search Console. Gdyby OpenAI korzystało z API Google lub innego prywatnego połączenia, te zapytania nigdy nie pojawiłyby się w GSC jako zwykły ruch z wyszukiwarki. Ponieważ jednak OpenAI używało scrapingu, Google traktowało te zapytania jak każde inne, a strony, które miały wysoką pozycję na frazy „openai”, „index” i „chatgpt”, otrzymywały w swoich panelach GSC wgląd w… prywatne rozmowy użytkowników.

OpenAI: „To była drobna usterka”

W odpowiedzi na pytania ArsTechnica, OpenAI potwierdziło, że „było świadome” problemu i „naprawiło usterkę”, która „tymczasowo wpłynęła na niewielką liczbę zapytań”. Firma odmówiła jednak odpowiedzi na pytanie, czy nadal scrapuje wyszukiwarkę Google, używając promptów użytkowników. Google również odmówiło komentarza.

To nie pierwszy raz, gdy prywatne rozmowy z ChatGPT trafiają do wyszukiwarki Google. Poprzedni skandal (z sierpnia br.) polegał jednak na tym, że Google indeksowało czaty, które użytkownicy sami aktywnie udostępnili (to wymaga intencjonalnego kliknięcia przycisku „Udostępnij” w ChatGPT), choć często nie zdawali sobie sprawy z publicznych konsekwencji.

Tym razem, jak podkreśla Packer, sytuacja jest znacznie poważniejsza. Nikt nie klikał „udostępnij”. Użytkownicy mieli pełne prawo sądzić, że ich rozmowa jest prywatna, a i tak, z powodu błędu lub celowego działania OpenAI, ich poufne prompty były wysyłane do Google i udostępniane przypadkowym administratorom stron.

Analitycy wciąż nie wiedzą, czy „naprawa” OpenAI polegała na całkowitym zaprzestaniu skrobania Google, czy tylko na usunięciu błędu, który doklejał URL do promptów (co poniekąd pozwoliło wyśledzić nietypowe „zapytania” w Google Search Console). Nie wiadomo też, jak duża była owa „niewielka liczba” zapytań, biorąc pod uwagę, że z ChatGPT korzysta 700 milionów ludzi tygodniowo.

Na koniec mogę mieć tylko jedną radę. Miejcie na uwadze, że AI to nie konfesjonał.

„To byłaby zdrada”. Dr Milagros Miceli, światowa ekspertka od AI ujawnia, dlaczego nie korzysta z ChatGPT

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .