Google aktualizuje Gemini. Lepsze formatowanie, rozumienie obrazów i nowe wersje dla deweloperów
Google poinformowało o wprowadzeniu aktualizacji dla swojego modelu sztucznej inteligencji, Gemini. Zmiany obejmują dwie oddzielne ścieżki. Poniżej szczegóły.
Pierwsza ze ścieżek dotyczy ulepszeń dostępnych już teraz dla użytkowników aplikacji Gemini, korzystających z modelu 2.5 Flash , a druga to udostępnienie nowych, testowych wersji modeli dla deweloperów.
Co nowego w aplikacji Gemini?
Użytkownicy, którzy w aplikacji Gemini wybiorą model 2.5 Flash, mogą już zauważyć trzy kluczowe ulepszenia. Po pierwsze, odpowiedzi generowane przez AI mają teraz lepszą organizację i formatowanie, z wykorzystaniem nagłówków, list i tabel, co ułatwia ich zrozumienie.
Po drugie, Gemini ma lepiej radzić sobie z wyjaśnianiem złożonych zagadnień, na przykład podczas pomocy w zadaniach domowych, dzięki ulepszonym zdolnościom rozumowania i prezentowaniu odpowiedzi krok po kroku.
Po trzecie, poprawiono zdolność rozumienia obrazów – można teraz przesyłać bardziej szczegółowe zdjęcia lub diagramy, a Gemini je wyjaśni, uporządkuje lub streści. Jako przykład podano możliwość stworzenia fiszek na podstawie zdjęcia notatek.
Nowości dla deweloperów: Flash i Flash-Lite
Równolegle Google udostępniło deweloperom nowe, poglądowe wersje modeli Gemini 2.5 Flash i 2.5 Flash-Lite, które są dostępne w platformach AI Studio i Vertex AI. Firma zaznacza, że nie są to nowe wersje stabilne, a ich celem jest zebranie opinii, które pomogą w kształtowaniu przyszłych, oficjalnych wydań.
Nowa wersja testowa modelu
Wersja gemini-2.5-flash-preview-09-2025 charakteryzuje się lepszym wykorzystaniem narzędzi, co przekłada się na wyższą wydajność w złożonych, wieloetapowych zadaniach. Model ten ma być również znacznie bardziej efektywny kosztowo, osiągając lepsze rezultaty przy mniejszym zużyciu tokenów. Z kolei lżejszy model,
Z kolei odmiana gemini-2.5-flash-lite-preview-09-2025, ma znacznie lepiej radzić sobie z wykonywaniem skomplikowanych poleceń, generować bardziej zwięzłe odpowiedzi oraz oferować wyższą jakość tłumaczeń i lepsze rozumienie dźwięku oraz obrazu.