Gemini ożywi twoje zdjęcia. Nowa funkcja zamieni fotografie w wideo z dźwiękiem
Google wprowadza nową funkcję do swojego narzędzia AI, Gemini. Od teraz użytkownicy będą mogli przekształcać statyczne fotografie w dynamiczne, ośmiosekundowe klipy wideo. Za generowanie filmów odpowiada zaawansowany model Veo 3, który został udostępniony szerszemu gronu odbiorców w maju tego roku.
Proces tworzenia wideo ze zdjęcia jest prosty. Wystarczy w oknie Gemini wybrać opcję „Wideo”, a następnie przesłać wybraną fotografię. Kolejnym krokiem jest opisanie w polu tekstowym, w jaki sposób obraz ma zostać ożywiony oraz jakie dźwięki mają towarzyszyć animacji. Sztuczna inteligencja na podstawie tych wytycznych wygeneruje krótki film. Google sugeruje, że funkcja ta świetnie sprawdzi się do animowania codziennych przedmiotów, ożywiania rysunków i obrazów czy dodawania ruchu do scen natury.
Nowa możliwość jest częścią szerszej strategii Google związanej z rozwojem narzędzi do generowania wideo. Firma poinformowała, że w ciągu ostatnich siedmiu tygodni użytkownicy stworzyli już ponad 40 milionów filmów przy użyciu modelu Veo 3 za pośrednictwem aplikacji Gemini oraz Flow, specjalistycznego narzędzia AI do tworzenia filmów. Funkcja przekształcania zdjęć w wideo jest obecnie wdrażana dla subskrybentów planów Google AI Pro oraz Ultra w wybranych krajach.
Google podkreśla również swoje zaangażowanie w kwestie bezpieczeństwa i odpowiedzialnego korzystania z technologii. Wszystkie filmy generowane przez AI są oznaczane widocznym znakiem wodnym, informującym o ich pochodzeniu. Dodatkowo, w plikach zaszywany jest niewidoczny cyfrowy znak wodny SynthID. Firma zapewnia, że prowadzi szeroko zakrojone testy (tzw. red teaming) w celu identyfikacji i eliminacji potencjalnych zagrożeń oraz egzekwuje politykę dotyczącą niedozwolonych treści.
Google wprowadza w Polsce Veo 3. Sztuczna inteligencja wygeneruje dla ciebie wideo z dźwiękiem