Mastodon
Zdjęcie okładkowe wpisu DeepSeek nie zrujnuje NVIDII, ale Chińczycy zamieszali w AI i na giełdach

DeepSeek nie zrujnuje NVIDII, ale Chińczycy zamieszali w AI i na giełdach

0
Dodane: 2 dni temu

Dziś na ustach wszystkich jest chińska sztuczna inteligencja DeepSeek. Nie dość, że nowy chiński model AI jest w stanie w wielu testach pokonać topowy model OpenAI, to jeszcze na dodatek został wytrenowany podobno za ułamek kwoty pochłanianej przez trening największych amerykańskich modeli sztucznej inteligencji. Na reakcję rynku i giełdy nie trzeba było czekać.

Kilka dni po tym, jak Donald Trump wspólnie z przedstawicielami gigantów technologicznych (w tym Sam Altman z OpenAI) ogłosił plany gigantycznych inwestycji w kwocie 500 mld dolarów na moc obliczeniową dla przyszłych modeli AI, nikomu nie znany chiński startup DeepSeek zaprezentował własny, w pełni otwarty model AI, DeepSeek R1, który ponoć został wytrenowany nie za kwoty rzędu 100 mln dolarów, lecz za zaledwie 5,6 mln dolarów. Jednocześnie efekty tego treningu przeszły najśmielsze oczekiwania.

Donald Trump i OpenAI ogłaszają gigantyczną infrastrukturę AI: Project Stargate

Jednocześnie DeepSeek R1 został publicznie udostępniony, to system otwarty, dostępny dla każdego, bez żadnych planów subskrypcyjnych, opłat, itp. Na efekty takiej polityki długo nie trzeba było czekać. Aplikacja mobilna DeepSeek (jest zarówno w Google Play i App Store) już teraz stała się najchętniej pobieraną aplikacją AI przez użytkowników.

DeepSeek R1 został zaprojektowany z myślą o zaawansowanym rozumowaniu, rozwiązywaniu problemów matematycznych oraz programowaniu. W testach osiąga wyniki porównywalne z czołowymi modelami, takimi jak OpenAI o1. Na przykład, w teście AIME 2024 osiągnął dokładność na poziomie 79,8%, co odpowiada wynikom OpenAI o1.

Jednym z najbardziej imponujących aspektów DeepSeek R1 jest jego efektywność kosztowa. Całkowity koszt opracowania modelu wyniósł podobno poniżej 6 milionów dolarów, a do jego treningu wykorzystano jedynie 10 000 układów NVIDIA. Dla porównania, firmy takie jak OpenAI wydają rocznie ponad 5 miliardów dolarów na rozwój swoich modeli.

Dobra wiadomość polega na tym, że DeepSeek R1 jest modelem open-source, co oznacza, że jego kod źródłowy jest dostępny publicznie. Dzięki temu deweloperzy na całym świecie mogą go modyfikować i dostosowywać do własnych potrzeb. Ponadto dzięki temu, że model jest otwarty, będzie możliwość zweryfikowania faktycznych kosztów jego treningu. Choć debiut DeepSeek negatywnie wpłynął m.in. na notowania giełdowe NVIDII, a inwestorzy z całego świata rozważają przemyślenie swoich strategii związanych z AI, to w dłuższej perspektywie jeżeli faktycznie udało się znacząco zmniejszyć koszt treningu przy tak wysokiej efektywności wyniku, to dla całej branży AI bardzo dobra wiadomość. Czy to dobra wiadomość do ludzkości? To już zupełnie inne pytanie i nie podejmuję się odpowiedzi na nie.

Tymczasem DeepSeek R1 chwilowo (stan na godz. 17:00 27.01.2025) odmówił współpracy. Widać zainteresowanie przerosło skalowalność chińskiej AI.

OpenAI prezentuje usługę Operator – Agent AI w przeglądarce zrobi za ciebie wszystko

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .