Mastodon
Zdjęcie okładkowe wpisu Anthropic prezentuje Claude 4: nowe modele AI rewolucjonizują kodowanie i zaawansowane zadania

Anthropic prezentuje Claude 4: nowe modele AI rewolucjonizują kodowanie i zaawansowane zadania

0
Dodane: 9 godzin temu

Anthropic, firma założona przez byłych badaczy OpenAI, ogłosiła wprowadzenie dwóch nowych modeli sztucznej inteligencji: Claude 4 Sonnet i Claude 4 Opus.

Zaprezentowane podczas pierwszej konferencji deweloperskiej „Code with Claude”, modele są dostępne od razu na stronie Claude oraz przez API, oferując znaczące ulepszenia w kodowaniu, rozumowaniu i wykonywaniu złożonych zadań.

Nowe modele Claude 4 Sonnet i Claude 4 Opus wyróżniają się hybrydową konstrukcją, umożliwiającą zarówno błyskawiczne odpowiedzi, jak i głębokie rozumowanie. Claude 4 Sonnet, jako model średniego poziomu, poprawia wydajność w kodowaniu i śledzeniu instrukcji w porównaniu do Claude Sonnet 3.7, będąc jego bezpośrednim następcą.

Claude 4 Opus, najpotężniejszy model Anthropic, przewyższa konkurencyjne modele, takie jak OpenAI o3, GPT-4.1 czy Gemini 2.5 Pro, w testach dotyczących wielojęzycznych pytań, kodowania agentowego i rozumowania na poziomie akademickim.

Firma twierdzi, że Claude 4 Opus jest „najlepszym modelem do kodowania na świecie”, zdolnym do autonomicznej pracy przez niemal cały dzień roboczy – do siedmiu godzin.

Oba modele wprowadzają nowe możliwości, takie jak rozszerzone myślenie z użyciem narzędzi (np. wyszukiwanie w internecie) w trybie beta, co pozwala na lepsze odpowiedzi poprzez przeplatanie rozumowania z danymi zewnętrznymi.

Anthropic zaprezentowało także cztery nowe funkcje API: narzędzie do wykonywania kodu, konektor MCP, API plików oraz możliwość buforowania promptów przez godzinę. Claude Code, zintegrowany z GitHub, umożliwia uruchamianie kodu bezpośrednio z pull requestów, co przyspiesza procesy deweloperskie. Modele są dostępne przez API Anthropic, Amazon Bedrock i Google Cloud Vertex AI.

Anthropic podkreśla, że Claude 4 Opus wymaga dodatkowych zabezpieczeń ze względu na swoją moc. Modele są mniej podatne na „reward hacking”, czyli omijanie zasad w celu szybszego wykonania zadań. Choć Claude 4 nie pokonał konkurencji we wszystkich testach (np. MMMU czy GPQA Diamond), jego zdolność do analizy dużych zbiorów danych i długotrwałej pracy czyni go liderem w zadaniach programistycznych.

Anthropic planuje dodać tryb głosowy do chatbota Claude

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .