Jak działa Gemini Spark?

Agnieszka Serafinowicz

Dodane: 2 miesiące temu

Google uruchomiło w USA funkcję Gemini Spark, dostępną dla subskrybentów Google AI Ultra. Jak to właściwie działa?

To nie jest kolejne narzędzie do generowania tekstu – to autonomiczny agent AI, który pracuje w tle, wykonuje skomplikowane zadania za użytkownika i potrafi obsługiwać zewnętrzne aplikacje, nawet gdy nie siedzimy przed komputerem.

Trzy filary automatyzacji

W odróżnieniu od klasycznego czatu, Gemini Spark opiera się na trzech mechanizmach, które zmieniają sposób obsługi cyfrowego życia:

Zadania (Tasks): to nadrzędne cele, które wyznaczamy agentowi, np. „zaplanuj moją podróż służbową do Londynu”.
Harmonogramy (Schedules): definiują one, kiedy agent ma podjąć akcję. Może to być konkretna godzina lub reakcja na zdarzenie (np. „jeśli mój lot zostanie opóźniony, przebookuj hotel i wyślij nową trasę do maila”).
Umiejętności (Skills): to zestawy instrukcji, które uczą Gemini, jak obsługiwać konkretne narzędzia i w jaki sposób wykonywać specyficzne prace.

System pozwala na monitorowanie postępów w czasie rzeczywistym. Widzimy listę planowanych, wykonywanych i już ukończonych etapów pracy. W razie potrzeby, w dowolnym momencie możemy „przejąć stery” i samodzielnie obsłużyć zdalną przeglądarkę, w której agent właśnie dokonuje rezerwacji lub porządkuje dane.

Co Gemini Spark potrafi w praktyce?

Amerykanie już mogą to sprawdzać i dzielą się doświadczeniem w Sieci. Wnioski? Potencjał tego narzędzia najlepiej widać w integracji z ekosystemem Google Workspace. Agent nie tylko przeszuka skrzynkę Gmail, ale też samodzielnie posprząta niechciane newslettery czy odpowie na maile w oparciu o nasze wytyczne.

W codziennej pracy Gemini Spark potrafi:

Zarządzać kalendarzem: sprawdzi dostępność terminów, wyśle zaproszenia na spotkania, a w razie kolizji – samodzielnie zaproponuje nowe sloty czasowe.
Tworzyć dokumenty: napisze tekst w Dokumentach Google, przygotuje prezentację w Slajdach czy sformatuje arkusz w Arkuszach Google na podstawie prostego polecenia.
Przeglądać sieć: agent potrafi obsługiwać zdalną przeglądarkę, co pozwala mu na dodawanie produktów do koszyka w sklepach czy wyciąganie danych z wielu stron internetowych, a następnie formatowanie ich w czytelny raport z przypisami do źródeł.

Czy to koniec ręcznej obsługi komputera?
I tu dostrzegamy ścianę. Mimo bardzo drogiego pakietu (Gemini AI Ultra) na ten moment system ma swoje limity. Użytkownik może mieć uruchomionych maksymalnie 15 zadań jednocześnie – kolejne prośby trafią do kolejki, aż agent zwolni zasoby. Dla nas istotne jest też to, że Gemini Spark jest w fazie beta i na razie dostępny wyłącznie dla użytkowników z USA. Kiedy będzie w Polsce? To wie tylko Google.

To jednak wyraźny sygnał, w jakim kierunku zmierza gigant z Mountain View. Zamiast ręcznego klikania w dziesiątki zakładek, mamy delegować pracę do agenta, który „zna się na narzędziach”. Jeśli narzędzie okaże się tak skuteczne, jak sugeruje Google, czeka nas spora zmiana w sposobie, w jaki używamy komputera – przestaniemy być operatorami aplikacji, a staniemy się menedżerami własnych agentów AI.