Chiny chcą dogonić Nvidię. Czy sklejanie chipów wystarczy?

Dariusz Hałas

Dodane: 3 miesiące temu

Kiedy Waszyngton odciął Pekin od najnowocześniejszych technologii produkcji półprzewodników, wydawało się, że chiński sen o potędze AI został brutalnie przerwany.

Jednak inżynierowie z Państwa Środka proponują rozwiązanie, które przypomina budowanie drapaczy chmur w gęsto zabudowanym mieście. Analogia architektonicza jest tu o tyle zasadna, że ułatwi nam zrozumienie chińskiego podejścia bez wnikania w zawiłości fizyki współczesnych układów scalonych. W skrócie: jeżeli nie możesz budować szerzej (co jest analogią najbardziej zaawansowanych procesów technologicznych rzędu kilku nanometrów), buduj w górę (czyli łącz chipy w stosy). Pytanie tylko, czy ta improwizowana konstrukcja nie zawali się pod własnym ciężarem termicznym.

Strategia, o której głośno mówi się w chińskich kręgach technologicznych, opiera się na koncepcji „chip stacking”, czyli pionowego układania warstw układów scalonych.

Wei Shaojun, wiceprezes Chińskiego Stowarzyszenia Przemysłu Półprzewodnikowego, przedstawił niedawno wizję architektury, która łączy starsze, możliwe do wyprodukowania w Chinach chipy logiczne (wykonane w technologii 14 nm) z pamięcią DRAM (18 nm) za pomocą hybrydowego łączenia 3D.

Innowacja z konieczności

To klasyczny przykład innowacji wymuszonej przez ograniczenia. Amerykańskie sankcje precyzyjnie celują w technologie poniżej 14 nm dla logiki i 18 nm dla pamięci. Chińczycy operują więc na granicy tego, co jest dla nich dostępne, próbując nadrobić braki w miniaturyzacji (gdzie TSMC i Samsung schodzą już do 2-3 nm) zmianą architektury całego systemu.

Kluczem jest tu technika „software-defined near-memory computing”. Zamiast przesyłać dane tam i z powrotem między procesorem a pamięcią – co jest największym „wąskim gardłem” w obliczeniach AI – Chińczycy proponują pionowe ułożenie elementów i miedziane połączenia o mikroskopijnej skali (poniżej 10 mikrometrów). Drastyczne skrócenie dystansu ma wpływ na prędkości wymiany danych na linii procesor-pamięć.

Brutalna weryfikacja wydajności

Wei Shaojun twierdzi, że taka konfiguracja może rywalizować z procesorami graficznymi Nvidii wykonanymi w procesie 4 nm, oferując wydajność rzędu 120 TFLOPS. Brzmi imponująco, dopóki nie spojrzymy na liczby konkurencji. Układ Nvidia A100 – który jest tu punktem odniesienia – oferuje do 312 TFLOPS. To ponad 2,5 razy więcej.

Sklejanie starszych technologii nie jest magiczną różdżką. Starsze procesy (14 nm) generują znacznie więcej ciepła i zużywają więcej energii niż nowoczesne układy 4 nm czy 5 nm. Upakowanie ich w ciasny, wielowarstwowy stos tworzy inżynieryjny koszmar termiczny. Odprowadzenie ciepła z takiego „sandwicza” chipów jest znacznie trudniejsze niż z płaskiego układu.

Zmiana filozofii: siła w ilości, nie w jakości

Mimo technicznych wyzwań, Chiny wydają się zdeterminowane. Ren Zhengfei, założyciel Huawei, sformułował nową doktrynę: osiąganie „najnowocześniejszej wydajności poprzez układanie i klastrowanie chipów, zamiast konkurowania węzeł za węzeł”. To strategiczny zwrot – Pekin przestaje ścigać się w biegu, którego nie może wygrać (nanometry), i próbuje zmienić zasady gry, stawiając na optymalizację systemową.

Czy to wystarczy, by zdetronizować Nvidię? W zadaniach treningowych AI, wymagających brutalnej mocy obliczeniowej – raczej nie. Jednak w przypadku wnioskowania (inference) czy specyficznych zastosowań analitycznych, gdzie kluczowa jest przepustowość pamięci, ta strategia może okazać się „wystarczająco dobra”. A w świecie odciętym od zachodnich technologii, „wystarczająco dobre” może oznaczać przetrwanie. Przypomnę tylko, że to zresztą niejedyny sposób, w jaki Państwo Środka próbuje rozwijać własne kompetencje AI.

Chiny znalazły sposób na blokadę Nvidii? Alibaba i ByteDance trenują AI w Singapurze, omijając sankcje

Poza tym jest jeszcze jeden aspekt. Niezależnie od tego jak szczelne jest sito ochrony własności intelektualnej amerykańskich gigantów technologicznych, jakikolwiek proces technologiczny nie został nikomu dany z góry. Został wymyślony, opracowany, wdrożony. Chiny inwestują olbrzymie środki w edukację i własne wykwalifikowane zasoby ludzkie. To może oznaczać, że niezależnie od wdrażanych półśrodków takich jak budowanie stosów starszych (mniej zaawansowanych) technologicznie chipów, któregoś dnia chińscy naukowcy w końcu zdobędą odpowiednią wiedzę i kompetencje, by realnie zagrozić współczesnym, technologicznym dominatorom. To kwestia czasu i determinacji. Nie wiem jak z czasem, nie wróżę z fusów, ale determinacja Chin jest olbrzymia.