Google ulepsza edycję zdjęć w Gemini. AI ma teraz zachowywać tożsamość osób

Agnieszka Serafinowicz

Dodane: 6 miesięcy temu

Google ogłosiło wprowadzenie znaczącej aktualizacji funkcji edycji obrazów w aplikacji Gemini. Nowy model, opracowany przez laboratorium DeepMind, ma rozwiązać jeden z największych problemów generatorów AI – zachowanie spójnego wyglądu postaci na modyfikowanych i nowo tworzonych (generowanych przez AI) zdjęciach.

Jednym z największych wyzwań dla narzędzi opartych na sztucznej inteligencji było do tej pory wierne odwzorowanie konkretnych osób. Często po edycji, np. zmianie tła lub ubrania, twarz na zdjęciu była „podobna, ale nie identyczna”. Najnowsza aktualizacja Gemini ma to zmienić. Jak informuje Google, algorytmy zostały udoskonalone, aby precyzyjnie zachowywać rysy twarzy i wygląd osób, a nawet zwierząt, niezależnie od wprowadzanych zmian.

Apple rozmawia z Google o wsparciu Siri przez Gemini AI

Zaktualizowane narzędzie wprowadza kilka nowych, praktycznych funkcji. Użytkownicy mogą teraz przesłać zdjęcie i za pomocą poleceń tekstowych zmieniać strój czy scenerię, w której znajduje się dana osoba. Możliwe stało się także łączenie kilku fotografii w jedną spójną scenę, na przykład umieszczenie portretu swojego i swojego psa na zupełnie nowym, wygenerowanym tle. Gemini pozwala również na edycję wieloetapową, czyli stopniowe dodawanie lub zmienianie elementów na obrazie.

Wśród ciekawszych nowości znalazła się funkcja „miksowania stylów”. Pozwala ona na przeniesienie wzoru lub tekstury z jednego obrazu na obiekt znajdujący się na drugim. W materiałach Google jako przykład podano możliwość zaprojektowania sukienki z wzorem skrzydeł motyla lub stworzenie kaloszy, których faktura imituje płatki kwiatów. Wszystkie te operacje mają odbywać się z zachowaniem oryginalnego wyglądu kluczowych obiektów.

Google podkreśla również dbałość o transparentność. Firma zapewnia, że wszystkie obrazy, które zostały stworzone lub zmodyfikowane w aplikacji Gemini, będą oznaczane. Na każdej grafice umieszczony zostanie widoczny znak wodny, a dodatkowo w pliku zaszyty będzie niewidoczny cyfrowy znacznik SynthID, który pozwoli jednoznacznie zidentyfikować materiał jako wygenerowany przez AI. Zaktualizowane funkcje są dostępne dla użytkowników od dziś.