Aktualności

Superkomputer Frontier - nowa era w efektywności szkolenia AI

K C

10 sty 2024 — 1 min read

źródło: Oak Ridge National Laboratory

W świecie technologii, gdzie granice możliwości są przekraczane niemal codziennie, amerykańscy badacze z Oak Ridge National Laboratory dokonali przełomu, wykorzystując najpotężniejszy na świecie superkomputer – Frontier – do szkolenia ogromnych modeli językowych (LLM). To, co wydawało się granicą osiągalności, okazało się jedynie przystankiem na drodze do bardziej zaawansowanych odkryć.

Wyzwanie technologiczne

Przedsięwzięcie to nie było pozbawione wyzwań. Centralnym problemem był sposób wykorzystania mocy obliczeniowej Frontiera, superkomputera klasy eksaskalowej. Naukowcy musieli zmierzyć się z ograniczeniami pamięci oraz skomplikowaną komunikacją między procesorami graficznymi AMD Instinct MI250X. Ich sukces w wykorzystaniu 3072 z 37 888 dostępnych procesorów graficznych do trenowania modeli językowych oznaczał pokonanie barier skalowania, które do tej pory były domeną sprzętu Nvidia i ekosystemu CUDA.

Przełom w szkoleniu LLM

To, co uczyniło tę pracę wyjątkową, to nie tylko skalę – jeden model miał bilion parametrów, a drugi 175 miliardów – ale także efektywność. Wykorzystując zaledwie ułamek dostępnej mocy obliczeniowej Frontiera, badacze osiągnęli coś, co wydawało się niemożliwe – efektywne szkolenie LLM przy znacznie niższym zużyciu zasobów.

Ograniczenia i możliwości

Pomimo sukcesu, badania te rzucają światło na istotne ograniczenia. Pamięć okazała się głównym wąskim gardłem, z wymaganiami sięgającymi około 14 TB. Równie istotne było to, że platforma ROCm firmy AMD, choć efektywna, jest wciąż bardziej spartańska w porównaniu do konkurencyjnego CUDA. To podkreśla, że choć AMD robi postępy w wyścigu technologicznym, nadal pozostaje miejsce na dalszy rozwój.

To, co uczyniło to osiągnięcie tak znaczącym, to nie tylko technologiczny wyczyn, ale także jego potencjalny wpływ na przyszłość szkolenia LLM i sztucznej inteligencji. Praca ta nie tylko otwiera drzwi do bardziej zaawansowanych badań w dziedzinie AI, ale także stanowi ważny impuls dla ekosystemu AMD, potwierdzając jego konkurencyjność i innowacyjność. W erze cyfrowej, gdzie dane są nowym złotem, efektywność i skalowalność takich technologii stanowią klucz do przyszłych odkryć, które mogą zmienić oblicze naszego świata.

Coming soon

This is The Kinetic Brief, a brand new site by Bartosz Martyka that's just getting started. Things will be up and running here shortly, but you can subscribe in the meantime if you'd like to stay up to date and receive emails when new content is

AI democratises cybercrime. Windows on target for hackers

Artificial intelligence, widely recognised as a driver of innovation in business, has become an equally powerful tool in the hands of criminals. The latest Elastic 2025 Global Threat Report, based on analysis of more than one billion data points, sheds light on a worrying trend: the barrier to entry into

AI demokratyzuje cyberprzestępczość. Windows na celowniku hakerów

Sztuczna inteligencja, powszechnie uznawana za motor napędowy innowacji w biznesie, stała się równie potężnym narzędziem w rękach przestępców. Najnowszy Elastic 2025 Global Threat Report, oparty na analizie ponad miliarda punktów danych, rzuca światło na niepokojący trend: bariera wejścia do świata cyberprzestępczości drastycznie maleje, a zautomatyzowane ataki stają się nowym standardem

The end of the 'lone wolf'. The future of cyber security is managed services

Statistics can be unforgiving, and in the case of cyber security, they shed new light on the state of modern business. It is estimated that just 0.009 per cent of the world’s one million companies have a chief information security officer, or CISO, on staff. For years, this