Mastodon
Zdjęcie okładkowe wpisu Apple ujawnia sekrety Apple Intelligence. Mamy wgląd w architekturę i działanie nowej AI

Apple ujawnia sekrety Apple Intelligence. Mamy wgląd w architekturę i działanie nowej AI

0
Dodane: 21 godzin temu

Apple opublikowało obszerny raport techniczny, w którym szczegółowo opisuje działanie, architekturę i proces trenowania swoich fundamentalnych modeli językowych, stanowiących trzon systemu Apple Intelligence.

Dokument rzuca światło na to, w jaki sposób firma chce połączyć wysoką wydajność z ochroną prywatności użytkowników, a także jak zamierza konkurować na rynku sztucznej inteligencji.

Firma z Cupertino zaprezentowała w dokumencie dwa główne, wielojęzyczne i multimodalne (rozumiejące tekst i obrazy) modele językowe, które napędzają funkcje Apple Intelligence. Pierwszy z nich to model działający bezpośrednio na urządzeniu (on-device), o wielkości około 3 miliardów parametrów. Został on zoptymalizowany pod kątem wydajności na czipach Apple Silicon dzięki innowacjom architektonicznym, takim jak współdzielenie pamięci podręcznej KV (KV-cache sharing) oraz 2-bitowa kwantyzacja. Mówiąc prościej, Apple opracowało techniki, które pozwalają na znaczne zmniejszenie zapotrzebowania modelu na zasoby, co przekłada się na szybkość działania i mniejsze zużycie energii w iPhonie czy komputerze Mac.

Drugi, znacznie potężniejszy model, działa na serwerach w ramach nowej platformy Private Cloud Compute. Zbudowano go w oparciu o nowatorską architekturę Parallel-Track Mixture-of-Experts (PT-MoE). Umożliwia ona przetwarzanie zadań w równoległych „torach”, co znacznie zwiększa wydajność i skalowalność przy bardziej złożonych zadaniach, jednocześnie zachowując standardy prywatności Apple. To hybrydowe podejście pozwala systemowi dynamicznie wybierać, czy zadanie może być wykonane lokalnie na urządzeniu, czy też wymaga większej mocy obliczeniowej z chmury, przy czym Apple gwarantuje, że dane wysyłane na serwery nie są przechowywane ani wykorzystywane do dalszego trenowania modeli.

Skąd AI czerpie swoją wiedzę?

Kluczowym elementem raportu jest transparentność w kwestii danych treningowych. Apple podkreśla, że oba modele były trenowane na ogromnych, wielojęzycznych i multimodalnych zbiorach danych. Pochodziły one z trzech głównych źródeł: licencjonowanych korpusów, publicznie dostępnych informacji zebranych przez pełzający po sieci Applebot oraz wysokiej jakości danych syntetycznych. Firma stanowczo zaznacza, że „nie wykorzystuje prywatnych danych osobowych ani interakcji użytkowników podczas trenowania swoich modeli fundamentalnych”. Co więcej, stosowane są filtry w celu usuwania danych osobowych oraz wulgaryzmów i treści niebezpiecznych. Applebot respektuje również protokół robots.txt, pozwalający wydawcom na wyłączenie ich treści z procesu treningowego.

Wydajność, konkurencja i dostępność w Polsce

Apple w swoim raporcie porównuje wydajność swoich modeli z konkurencyjnymi, ogólnodostępnymi rozwiązaniami, takimi jak modele z serii Gemma od Google, Qwen czy LLaMA 4 Scout. Z opublikowanych danych wynika, że model on-device wypada korzystnie na tle modeli o podobnej wielkości, a czasem nawet je przewyższa. Z kolei model serwerowy jest porównywalny z LLaMA 4 Scout, ale ustępuje znacznie większym modelom, takim jak GPT-4o czy Qwen-3-235B. Raport pokazuje też, że zastosowane techniki optymalizacyjne, takie jak agresywna kwantyzacja (kompresja) do 2 bitów na wagę w modelu na urządzeniu, wiążą się z niewielkim spadkiem jakości w testach porównawczych, ale jednocześnie drastycznie zwiększają szybkość i efektywność działania.

Apple Intelligence a Polska

Niestety, w kwestii dostępności Apple Intelligence w Polsce raport nie przynosi dobrych wieści. Choć dokument wielokrotnie wspomina o wsparciu dla wielu języków i rozszerzaniu go na nowe regiony, Polska i język polski nie zostały wymienione w grupie pierwszych języków poza angielskim, dla których przygotowano i testowano nową technologię. W jednej z tabel analitycznych pojawia się grupa językowa „PFIGSCJK”, która, jak wyjaśniono, obejmuje portugalski, francuski, włoski, niemiecki, hiszpański, chiński (uproszczony), japoński i koreański.

W ten sposób, najnowsza techniczna publikacja Apple, w rzeczywistości potwierdza status quo i wzmacnia poczucie bycia klientem drugiej kategorii, o czym pisałem w moim niedawnym felietonie. Konkurencja, jak podkreślałem, nie miała problemu z wdrożeniem naszego języka, co dowodzi, że jest to wyłącznie kwestia strategicznej decyzji, a nie technologicznych ograniczeń. Oznacza to, że na wdrożenie Apple Intelligence w naszym kraju będziemy musieli jeszcze poczekać, a raport nie podaje żadnych konkretnych ram czasowych w tej kwestii.

Jabłko niezgody, czyli o polskim milczeniu Apple

Dla chętnych: link do rzeczonego raportu opublikowanego przez Apple (PDF, język angielski, 27 stron).

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .