Mastodon
Zdjęcie okładkowe wpisu Google alarmuje pracowników: musimy podwajać moc obliczeniową co 6 miesięcy, by nadążyć za AI

Google alarmuje pracowników: musimy podwajać moc obliczeniową co 6 miesięcy, by nadążyć za AI

0
Dodane: 18 godzin temu

Podczas gdy rynek debatuje nad potencjalnym pęknięciem „bańki AI” i ryzykiem przeinwestowania, wewnętrzna narracja w Google wskazuje na zupełnie inny problem: infrastruktura nie nadąża za popytem.

Amin Vahdat, szef infrastruktury AI w Google, podczas ogólnofirmowego spotkania przekazał pracownikom, że firma musi podwajać swoje moce obsługowe co sześć miesięcy, aby sprostać zapotrzebowaniu na usługi sztucznej inteligencji.

Według slajdów zaprezentowanych przez Vahdata, Google stoi przed wyzwaniem zwiększenia skali działania o 1000 razy w ciągu najbliższych 4–5 lat. Co istotne, ten gigantyczny skok wydajności, mocy obliczeniowej i przepustowości sieci musi zostać osiągnięty przy zachowaniu niemal tych samych kosztów i, co jeszcze trudniejsze, przy tym samym poziomie zużycia energii.

Wyścig zbrojeń i braki sprzętowe

Google nie jest osamotnione w tych zmaganiach. Konkurencyjne OpenAI, we współpracy z SoftBankiem i Oracle, planuje budowę sześciu ogromnych centrów danych w USA, angażując ponad 400 miliardów dolarów w ciągu trzech lat, aby osiągnąć prawie 7 gigawatów mocy. OpenAI boryka się z podobnymi ograniczeniami przy obsłudze 800 milionów użytkowników tygodniowo, gdzie nawet płacący subskrybenci napotykają limity użycia.

Wąskim gardłem pozostaje dostępność sprzętu. Nvidia ogłosiła niedawno, że jej chipy AI są całkowicie „wyprzedane”, a przychody z centrów danych wzrosły o 10 miliardów dolarów w jednym kwartale. Te braki mają realny wpływ na produkty Google. CEO firmy, Sundar Pichai, przyznał, że narzędzie do generowania wideo, Veo, nie mogło trafić do szerszego grona użytkowników aplikacji Gemini właśnie ze względu na ograniczenia mocy obliczeniowej.

Własny krzem sposobem na kryzys

Aby sprostać tym wyzwaniom bez polegania wyłącznie na Nvidii, Google stawia na własne układy scalone. Firma ogłosiła ogólną dostępność siódmej generacji procesorów Tensor Processing Unit (TPU) o nazwie Ironwood. Google twierdzi, że są one prawie 30 razy bardziej energooszczędne niż pierwsze Cloud TPU z 2018 roku. Strategia firmy opiera się na trzech filarach: rozbudowie fizycznej infrastruktury, tworzeniu wydajniejszych modeli AI oraz projektowaniu własnych chipów.

Mimo obaw o „bańkę”, Sundar Pichai stwierdził, że ryzyko niedoinwestowania przewyższa ryzyko nadmiarowych mocy, ostrzegając jednocześnie pracowników, że rok 2026 będzie pod tym względem bardzo „intensywny”.

Quick Share z Pixel 10 zaczyna współpracować z AirDrop. Piekło zamarzło.

Zapraszamy do dalszej dyskusji na Mastodonie lub Twitterze .