Aktualności

DeepSeek wstrzymuje prace nad R2 przez brak chipów Nvidia

Klaudia Ciesielska

27 cze 2025 — 1 min read

źródło: Pexels

Gdy chiński startup DeepSeek zaprezentował swój model językowy R1, wielu ekspertów przecierało oczy ze zdumienia. Model dorównywał najnowszym konstrukcjom OpenAI i Anthropic, a jego trening kosztował znacznie mniej. Sukces okazał się jednak trudny do powtórzenia — według ustaleń The Information, produkcja następcy, modelu R2, została wstrzymana z powodu niedoboru procesorów graficznych Nvidia.

DeepSeek zbudował swój sukces na ogromnej skali — model R1 został wytrenowany na 50 tys. GPU z rodziny Hopper, w tym na 10 tys. H100, 10 tys. H800 i 3 tys. chipów H20. Te ostatnie — specjalnie przygotowane do eksportu do Chin — są dziś szczególnie trudne do zdobycia. Od czasu nałożenia przez USA kolejnych ograniczeń eksportowych, chińskie firmy mają utrudniony dostęp nawet do okrojonych wersji GPU Nvidii. DeepSeek zużył już większość dostępnych zasobów, obsługując zapotrzebowanie lokalnych firm i agencji rządowych.

Sytuacja odbija się nie tylko na planach związanych z modelem R2, ale również na bieżącej wydajności R1. Użytkownicy zgłaszają spadki jakości działania modelu, co może świadczyć o przeciążeniu systemu. Firma znalazła się w pułapce: bez nowych GPU nie jest w stanie rozwijać modelu, a malejąca wydajność zniechęca potencjalnych klientów.

Chińscy producenci, tacy jak Huawei, oferują wprawdzie alternatywne akceleratory AI, ale ich wydajność wciąż odbiega od układów Nvidii. Co gorsza, nie są one zgodne z popularnym ekosystemem CUDA, co dodatkowo komplikuje migrację modeli i infrastruktury.

Dla DeepSeek to poważny problem. Firma miała szansę stać się lokalnym odpowiednikiem OpenAI, jednak bez stałego dostępu do zaawansowanego sprzętu może stracić tempo rozwoju. W praktyce potwierdza to szerszy problem chińskiego ekosystemu AI — ograniczenia w dostępie do technologii półprzewodnikowej przekładają się na trudności w skalowaniu modeli i usług.

W kontekście globalnego wyścigu zbrojeń w AI, opóźnienie modelu R2 pokazuje, jak istotne są łańcuchy dostaw i dominacja kilku dostawców sprzętu. Nawet najlepiej zaprojektowany model nie ma szans bez odpowiedniego zaplecza obliczeniowego.

Coming soon

This is The Kinetic Brief, a brand new site by Bartosz Martyka that's just getting started. Things will be up and running here shortly, but you can subscribe in the meantime if you'd like to stay up to date and receive emails when new content is

AI democratises cybercrime. Windows on target for hackers

Artificial intelligence, widely recognised as a driver of innovation in business, has become an equally powerful tool in the hands of criminals. The latest Elastic 2025 Global Threat Report, based on analysis of more than one billion data points, sheds light on a worrying trend: the barrier to entry into

AI demokratyzuje cyberprzestępczość. Windows na celowniku hakerów

Sztuczna inteligencja, powszechnie uznawana za motor napędowy innowacji w biznesie, stała się równie potężnym narzędziem w rękach przestępców. Najnowszy Elastic 2025 Global Threat Report, oparty na analizie ponad miliarda punktów danych, rzuca światło na niepokojący trend: bariera wejścia do świata cyberprzestępczości drastycznie maleje, a zautomatyzowane ataki stają się nowym standardem

The end of the 'lone wolf'. The future of cyber security is managed services

Statistics can be unforgiving, and in the case of cyber security, they shed new light on the state of modern business. It is estimated that just 0.009 per cent of the world’s one million companies have a chief information security officer, or CISO, on staff. For years, this

Read more

Coming soon

AI democratises cybercrime. Windows on target for hackers

AI demokratyzuje cyberprzestępczość. Windows na celowniku hakerów

The end of the 'lone wolf'. The future of cyber security is managed services