Mastodon
Zdjęcie okładkowe wpisu ChatGPT Images: OpenAI obiecuje przełom w spójności grafik. GPT Image 1.5 już dostępny

ChatGPT Images: OpenAI obiecuje przełom w spójności grafik. GPT Image 1.5 już dostępny

0
Dodane: 6 godzin temu

Czy to koniec walki o to, by postać na wygenerowanym zdjęciu wyglądała tak samo po zmianie tła? OpenAI udostępnia moduł „ChatGPT Images” napędzany modelem GPT Image 1.5. Producent deklaruje, że jest szybciej i precyzyjniej, choć ostateczny werdykt wydadzą użytkownicy.

Gigant AI ogłosił właśnie dostępność nowego modułu ChatGPT Images. To kolejna iteracja w rozwoju generatywnej sztucznej inteligencji. Nowy model, oznaczony jako GPT Image 1.5, jest dostępny od dzisiaj dla wszystkich użytkowników oraz w API.

Precyzja – obietnica a rzeczywistość

Największą nowością promowaną przez OpenAI jest tzw. „reliable adherence” (niezawodne przestrzeganie intencji). W teorii ma to rozwiązać największą bolączkę generatorów: przypadkowe zmienianie elementów, których nie chcieliśmy ruszać. OpenAI obiecuje, że model potrafi zachować oświetlenie, kompozycję i – co kluczowe – wygląd postaci pomiędzy kolejnymi edycjami.

W materiałach demonstracyjnych wygląda to imponująco: od zdjęcia dwóch mężczyzn na imprezie, przez zmianę ich w postacie anime, aż po nowe tło – twarze zachowują swoje cechy. Warto jednak pamiętać, że generatory AI wciąż miewają swoje „halucynacje”, a rzeczywiste rezultaty mogą różnić się od idealnych przykładów z informacji prasowej. OpenAI samo zastrzega, że choć postęp jest duży, technologia wciąż ma swoje ograniczenia.

Tekst i szybkość

GPT Image 1.5 ma robić wyraźny krok naprzód w renderowaniu tekstu. Model radzi sobie z gęstym, drobnym drukiem, co zaprezentowano na przykładzie wygenerowania całej szpalty gazety z czytelnym wykresem i tabelami. Do tej pory był to jeden z najtrudniejszych elementów dla AI.

Dodatkowo nowy model generuje obrazy do 4 razy szybciej niż poprzednik. Aby ułatwić pracę, w ChatGPT pojawia się dedykowana sekcja „Images” z gotowymi filtrami i presetami, co ma przypominać podręczne studio kreatywne.

Taniej, ale w API

Jest też dobra wiadomość dla deweloperów: GPT Image 1.5 w API jest o 20% tańszy od swojego poprzednika. Należy jednak podkreślić, że obniżka ta dotyczy kosztów dla programistów i firm integrujących model we własnych aplikacjach, a nie bezpośredniej ceny subskrypcji ChatGPT Plus/Team dla użytkownika końcowego.

OpenAI i Disney zawierają przełomową umowę – postacie Disneya trafią do Sory

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .