Google Cloud rozszerza dostępność modeli Veo i Imagen 3

Agnieszka Serafinowicz

Dodane: 11 miesięcy temu

Google Cloud ogłosił, że stworzony przez Google DeepMind generatywny model Veo opracowany do generowania wideo na podstawie tekstu i obrazów, będzie dostępny w wersji prywatnego podglądu dla użytkowników Vertex AI. To nie jedyna nowość.

Oprócz tego firma poinformowała, że od przyszłego tygodnia generatywny model do tworzenia fotorealistycznych (i nie tylko) obrazów – Imagen 3 – zostanie udostępniony użytkownikom Vertex AI na całym świecie.

Szersza dostępność modelu Veo oznacza, że użytkownicy, którzy otrzymają dostęp do tej kreatywnej, generatywnej sztucznej inteligencji wyspecjalizowanej w tworzeniu klipów wideo, będą mogli eksperymentować z generowaniem krótkich filmów, które będą odpowiadać ich kreatywnej wizji, łącząc opisy tekstowe i obrazy referencyjne w pożądany wynik.

Nie ma też żadnego problemu, aby jednocześnie wykorzystywać potencjał obu udostępnionych w ramach Vertex AI modeli. W artykule opublikowanym właśnie na oficjalnym blogu Google Cloud znajdziemy zresztą wycinki wideo prezentujące efekty wideo powstałe na podstawie statycznych obrazów wygenerowanych przez Imagen 3 połączonych z opisem tekstowym, wyjaśniającym generatywnej sztucznej inteligencji Veo, w jaki sposób ma animować ruch obiektów w kadrze.

We wspomnianym wpisie znajdziecie również prezentacje klipów wygenerowanych przez Veo wyłącznie na podstawie opisu tekstowego. Z kolei jeżeli chodzi o Imagen 3, to autorzy wpisu podkreślają, że Imagen 3 oferuje nie tylko generowanie obrazów z opisu tekstowego, ale model nadaje się również do częściowej edycji/generowania fragmentów już istniejących ilustracji i zdjęć (edycja na masce). Możliwe jest również generatywne edytowanie/zmiana tła istniejącego zdjęcia, skalowanie obrazu.

Pod względem komercyjnym znaczenie ma też to, że Imagen 3 umożliwia włączenie własnej marki, stylu, logo, tematu lub cech produktu podczas generowania nowych obrazów. Zaprezentowano też przykład pokazujący referencyjne zdjęcie sukienki, a następnie wygenerowane przez Imagen 3 zdjęcie nieistniejącej modelki z założonym strojem (zamieściłam je na otwarciu niniejszego materiału). Tu mam wątpliwości. Nie chciałabym kupować strojów w oparciu o generatywne zdjęcia. Pozornie wygląda to ładnie, ale nie jest prawdą. To nie jest konkretny produkt przymierzony przez rzeczywistą osobę. Przypuszczam, że nie będzie się zgadzać nic: ani wymiary, ani krój, itp. Efekt estetyczny jest w porządku, ale w kontekście wyboru ciuchów, szczególnie przy zakupach online to po prostu fałszowanie rzeczywistości.

Poniżej jeszcze przykład marketingowego wykorzystania modelu Veo: