Wypróbowałem Kreator Obrazów Bing z DALL-E 3
W maju br. informowałem Was o dostępności czatu Bing opartego na generatywnym modelu GPT-4, dostępnym dla wszystkich. Już wówczas wiadomo było, że usługa Microsoftu pozwala również na generowanie obrazów przez AI. Jednak teraz kreacja obrazu napędzana jest już przez model DALL-E 3. Czy jest różnica? To nie różnica, to przepaść.
Korzystanie z nowej funkcji Kreator Obrazów (w interfejsie przeglądarki Edge funkcjonuje ona wciąż pod anglojęzyczną nazwą Image Creator) jest banalnie proste. Nie musicie nawet używać przeglądarki Edge. Jedyny warunek to zalogowanie się w usłudze na swoje konto Microsoft (założenie takiego konta jest bezpłatne). OK, do czego zmierzam?
Jedną ze świeższych funkcji Kreatora Obrazów w Bing jest integracja AI odpowiedzialnej za kreację obrazów z najnowszym modelem DALL-E 3, który został opublikowany przez OpenAI we wrześniu 2023. Napiszę krótko, jakość generowanych obrazów „zrywa kask”. Z DALL-E 3 korzystać mogą również użytkownicy najnowszego ChatGPT, z tym że wersji płatnej (ChatGPT Plus, za 20 dolarów miesięcznie). Microsoft udostępnił ten sam model gratis.
To co widzicie powyżej, to obraz, jaki wygenerował dla mnie Kreator Obrazów jakieś 4 miesiące temu. Potrzebowałem jakiegoś obrazka domu z panelami fotowoltaicznymi, zależało mi żeby było widać, że chodzi o Polskę, więc zażądałem od AI by jeszcze uwzględniła naszą flagę. Wyszło jak sami widzicie średnio. OK, widać, że dom jest domem, to coś na dachu można uznać za panele, ale flaga to jakiś żart, co to za pseudo gwiazdki na niej? Choć w ogólnym zarysie obrazek nie jest zły, jego wady psują cały efekt. Takie samo polecenie powtórzyłem AI teraz, gdy usługa Kreator jest już zintegrowana z DALL-E 3. Oto efekt:
Powiedzieć, że jest „jakaś różnica” to jak nic nie powiedzieć. Flaga w porządku, wiatrak też normalny, a nie jakieś pokręcone widmo na horyzoncie (jak na starszym, wcześniejszym obrazku). Domek mniejszy, ale tę kwestię można przecież doprecyzować w poleceniu. Ogólnie efekt mi się spodobał i zachęcił do dalszych prób. Ponoć AI ma problem z dłońmi ludzi, prawda? Już nie. Przynajmniej nie w przypadku Binga z DALL-E 3. Spójrzcie na kolejny obraz:
Ta miła parka nie wywołuje wrażenia creepy. Jest raczej sympatyczna. AI potrafi już nie tylko kreować dłonie, ale też poprawnie odwzorowywać inne szczegóły anatomiczne, takie jak np. oczy czy małżowiny uszu, które wcześniej były kreślone tak, że mimowolnie odczuwaliśmy tę charakterystyczną dezorientację nazywaną „doliną niesamowitości”. Pewnie niektórzy dopatrzą się krzywych ząbków. Szczerze? Moje są bardziej krzywe.
Moim zdaniem jeżeli choć trochę interesujecie się AI i kreacją obrazów na podstawie tekstu, warto wypróbować nowego Kreatora Obrazów. Uprzedzam tylko, że serwery Microsoftu ostro się grzeją i często usługa (przynajmniej u mnie) nie jest dostępna. Cóż, nie dziwię się, że zainteresowanie duże, tym bardziej że DALL-E 3 pod szyldem Microsoftu jest dostępny gratis. Acha, uśmiechająca się Pani na zdjęciu poniższym to też produkcja Kreatora Obrazów. Udanej zabawy.
Na koniec jeszcze tylko Wam przypominam, że jest już najnowsze wydanie iMagazine. Darth Vader lubi to.