Grok 4.1 oficjalnie. xAI stawia na empatię i tryb „tensorowy”, ale król jest już inny

Agnieszka Serafinowicz

Dodane: 8 miesięcy temu

Wyścig zbrojeń AI nie zwalnia ani na moment. Można stwierdzić, że niemal jednocześnie z debiutem modelu Gemini 3.0 od Google’a, firma xAI Elona Muska zaprezentowała swój najnowszy model – Grok 4.1. Twórcy chwalą się, że jest liderem rankingów, ale… te dane już się zdezaktualizowały.

Grok 4.1 to ewolucja, a nie rewolucja, podobnie jak OpenAI przy przejściu z GPT-5 na GPT5.1. Podczas gdy Google przeskoczyło z wersji 2.5 na 3.0, xAI, tak jak i OpenAI stawia na optymalizację, a nie nową generację modelu.

Panowanie trwało chwilę. Gemini 3.0 górą

Wyniki opublikowane prze xAI ukazały się krótko przed prezentacją Google’a z Gemini 3.0. Według danych firmy Elona Muska, w prestiżowym rankingu LMArena (Chatbot Arena) nowy Grok 4.1 zajął pierwsze miejsce z wynikiem 1483 punktów Elo. Owszem, prześcignął Gemini 2.5 Pro, ale nie zajmuje już pierwszego miejsca.

Nie ulega wątpliwości, że jest to wciąż imponujący wynik, ale – jak informowaliśmy rano – debiutujący niemal równolegle Gemini 3.0 Pro (dokładniej Gemini 3.0 pojawiło się nieznacznie później niż Grok 4.1) osiągnął w tym samym teście 1501 punktów. Grok 4.1 jest więc potężny i wyprzedza dotychczasową czołówkę, ale na ten moment musi uznać wyższość nowej technologii Google.

Co nowego? Empatia i dwa tryby myślenia

Główny nacisk w wersji 4.1 położono na „osobowość”. Model ma lepiej rozpoznawać intencje, być bardziej empatyczny i utrzymywać spójny charakter rozmówcy. Potwierdzają to testy EQ-Bench, gdzie Grok wykazuje się zdolnością do „oceny emocji użytkownika”.

Ciekawostką techniczną jest podział na dwa tryby:

Thinking (myślący): pełna moc obliczeniowa, wysokie wyniki w testach logicznych.
Tensor: tryb natychmiastowy, który nie używa „tokenów myślenia”.

Co imponujące, nawet w tym szybkim trybie Grok 4.1 osiąga 1465 punktów Elo, wyprzedzając wiele modeli „myślących” starszej generacji.

Kreatywność i mniej „halucynacji”

W testach kreatywnego pisania (Creative Writing v3) Grok 4.1 zajął drugie miejsce, tuż za wczesną wersją GPT-5.1. Ale i te dane mogą już być nieaktualne, ze względu na wyniki Gemini 3.0, co nie znaczy jednak że nowy Grok nie imponuje. Warto zaznaczyć, że xAI chwali się również znaczącą redukcją halucynacji (zmyślania faktów), co osiągnięto dzięki nowym technikom treningowym. Model jest już dostępny w wersji testowej dla ograniczonej grupy użytkowników. Także dla tych, którzy korzystają z Groka bezpłatnie.