Stability AI publikuje Stable Diffusion 3.5 – nowa wersja generatywnej AI do grafiki
Stability AI ogłosiła dostępność najnowszej generacji swojego flagowego modelu sztucznej inteligencji do generowania obrazów: Stable Diffusion 3.5.
Najnowsza wersja Stable Diffusion 3.5 to nie tylko bardzo zaawansowany model generatywnej sztucznej inteligencji wyspecjalizowanej w generowaniu obrazów na podstawie opisów tekstowych, ale też model dostarczany przez Stability AI w bardzo wielu wariantach, które można dostosowywać. Tak przynajmniej wyraźnie sugerują sami twórcy tego rozwiązania w oficjalnym komunikacie.
Nowa generacja Stable Diffusion działa na sprzęcie konsumenckim i jest dostępna na licencji Stability AI Community Licence (generalnie jest za darmo do użytku niekomercyjnego, a także komercyjnego, pod warunkiem nieprzekroczenia progu miliona dolarów rocznego dochodu). Nowy model jest już dostępny do pobrania na platformie Hugging Face, kod znajdziecie także na GitHub.
Sami twórcy wyróżniają następujące modele:
- Stable Diffusion 3.5 Large: 8 miliardów parametrów, najmocniejszy wariant najnowszej generacji modelu Stable Diffusion. Nadaje się do profesjonalnych zastosowań.
- Stable Diffusion 3.5 Large Turbo: uproszczona wersja Stable Diffusion 3.5 Large, generuje wysokiej jakości obrazy szybciej niż powyższy model, w zaledwie 4 krokach.
- Stable Diffusion 3.5 Medium: ten wariant ma zadebiutować 29 października br. Oferuje 2,5 miliarda parametrów z ulepszoną architekturą MMDiT-X i metodami szkolenia. To model przeznaczony do uruchamiania bezpośrednio na sprzęcie konsumenckim (w sensie offline, lokalnie, bez chmury). Zdaniem twórców prezentuje równowagę między jakością a łatwością implementacji i przydzielania zasobów. Jest w stanie generować obrazy o rozdzielczości od 0,25 do 2 megapikseli.
Więcej szczegółowych informacji o najnowszej generacji sztucznej inteligencji do generowania obrazów opracowanej przez Stability AI znajdziecie w obszernym wpisie na oficjalnym blogu Stability AI. Załączone ilustracje (w tym otwierająca) zostały wygenerowane właśnie za pomocą najnowszej generacji modelu Stable Diffusion 3.5.