Ievads
Modernā skaitļošana darbojas uz silīcija, un GPU ir kļuvuši par jauno zeltu. Vai spēļu, AI pētniecības, VFX, 3D renderēšanas, kriptogrāfijas vai datu centra operācijām pieprasījums pēc jaudīgiem grafikas procesoriem ir uzsprāgis pēdējo gadu laikā. Tā rezultāts ir ilgstošs, globāls GPU trūkums, kas ir ietekmējis ikvienu, sākot ar individuāliem patērētājiem un beidzot ar lielapjoma mākoņpakalpojumu sniedzējiem.
Tas, kas sākās kā piegādes traucējumi, ir pārvērties par sarežģītu, daudzslāņainu globālu krīzi, kas ietver progresīvus pusvadītāju ražošanas sastrēgumus, ģeopolitiskus ierobežojumus, lielus AI ieguldījumus, azartspēļu pieprasījumu, pieaugošu mākoņpatēriņu un tehnoloģiju pārejas.
Šis pants izjūk kāpēc saglabājas globālais GPU trūkums, kāpēc jaunas mikroshēmas joprojām ir dārgas, un – pats galvenais –kad (un ja) šis deficīts beidzot beigsies.

1. Kāpēc GPU atšķiras no citiem Chips
GPU nav procesori.
Tie prasa:
-
vairāk tranzistoru uz mm2
-
vairāk uzlabotas litogrāfija (līdz 3nm / 5nm)
-
liela joslas platuma atmiņas integrācija (HBM);
-
uzlabots iepakojums (CoWoS, EMIB, 3D iepakojums)
-
ļoti zema defektu panesamība
-
specializētas ražošanas līnijas
-
ierobežots globālo piegādātāju skaits
Tas nozīmē:
-
GPU ražošanu nevar vienkārši „izmērīt”
-
jaunas rūpnīcas nevar ieslēgt nakti
-
tikai saujiņa uzņēmumu var padarīt tos vispār
95%+ asiņošanas virziena GPU ražošana ir atkarīga no TSMC, Taivānas pusvadītāju milzis.
Tas ir vienīgais globālās neveiksmes punkts.
2. Kas izraisīja trūkumu? (Vairāki viļņi)
GPU trūkums nav viens notikums – tas pārklājas virkne viļņu:
vilnis – pandēmijas piegādes traucējumi (2020.–2021. gads)
Rūpnīcas slēgtas.
Shipping froze.
Pieprasījums strauji pieauga.
Rezultāts: nulle inventarizācija sākumā lielākajai daļai patērētāju GPU.
vilnis.
Ethereum ieguves nosūtīja GPU pieprasījumu caur jumtu.
Gamers sacentās ar rūpniecības mēroga kalnrūpniecības saimniecībām.
Cenas shot up 200%–400%.
vilnis – mākoņdatošanas eksplozija
Hyperscalears paplašināja GPU jaudu AI dramatiski:
-
AWS
-
Google mākonis
-
Microsoft Azure
-
Oracle Cloud
-
Desmitgadīgs mākonis
-
Alibaba mākonis
Katrs hiperskaleris pasūtīja miljoniem vienību.
Wave 4 — AI Gold Rush (2023.–2025.)
Pieaugums:
-
ChatGPT
-
GPT-4 saime
-
Llama modeļi
-
Stabila difūzija
-
MidJourney
-
MI apmācība visur
pārvērta GPU par stratēģisko infrastruktūru.
Solīšanas karā iesaistījās korporācijas, valdības un aizsardzības darbuzņēmēji.
Vilnis 5 – Pusvadītāju iepakojuma vājā vieta
CoWoS iepakojuma trūkums aizkavējās par mēnešiem.
Nav svarīgi, vai GPU die ir gatava – ja to nevar saistīt ar HBM, tas ir nelietojams.
3. Kāpēc AI ir galvenais vadītājs tagad
Tas ir būtiski:
AI šodien ir #1 patērētājs augstākās klases GPU.
Ģenerējoša AI prasa:
-
Miljardi mācību rādītāju
-
nepārtraukta secinājumu darba slodze
-
milzīga paralēlās skaitļošanas spēja
-
liela joslas platuma atmiņas caurlaides spēja
Apmācības līmenis robežas modeli var prasīt desmitiem tūkstošu H100/H200 klases GPU—un tas ir paredzēts viens modeli.
Pēc tam secinājumi (pastāvīga lietošana) patērē pat vairāk aparatūra laika gaitā.
Pieprasījums ir aizgājis no tūkstošiem → simtiem tūkstošu → miljoniem vienību visā pasaulē.
Neviena rūpniecības nozare nevar uzreiz absorbēt šo šo šoku.
4. NVIDIA Dominance = tirgus nepilnības
NVIDIA kontrole:
-
80–90% no globālā AI GPU tirgus
-
gandrīz visas hiperscale mācību aparatūra
-
CUDA ekosistēmas bloķēšana
GPU daudzums ir ierobežots.
GPU alternatīvas ir ierobežotas.
GPU maiņas izmaksas ir milzīgas.
Uzņēmumiem nav citas izvēles kā gaidīt un maksāt.
5. Kāpēc patērētāju & azartspēļu GPU joprojām dārgi
Jūs domājat, ka patērētāju GPU tagad būtu lēti.
Tomēr:
1. Ražošana prioritizē datu centra GPU
(H100, GH200, B200 utt.)
jo...
peļņas norma par mikroshēmu:
$2000+ → $30 000+
vs
patērētāja karte:
$200 → $1600
Ražotāji dod priekšroku rentablām mikroshēmām.
2. Azartspēļu pieprasījums joprojām ir augsts
Jauni AAA nosaukumi prasa lielāku jaudu.
3. Lietotais tirgus ir sauss
Kalnrūpniecības sabrukums applūdināta apgāde vienreiz–bet šis piedāvājums tagad ir pagājis.
4. AI hobijisti tagad konkurē ar spēlētājiem
Vairāk konkurences → augstākas cenas.
6. Paskaidroti piegādes trūkumi
Pašreiz lielākie ierobežojumi:
• Litogrāfija
Tikai TSMC, Samsung, un Intel var veidot uzlabotas mezglus.
• Iepakošanas jauda
CoWoS ir ierobežots un sarežģīts.
• HBM ražošana
Tikai daži pārdevēji piegādāt:
-
SK Hynix
-
Samsung
-
Mikrons
un ražas normas ir zemas.
• Inventāra izsīkums
vairs nav noliktavu krājumu.
• Kuģošanas loģistika
aparatūra ceļo cauri desmitiem soļiem:
fab → iepakojums → atmiņa → dēļu montāža → testēšana → apstiprināšana → izplatīšana
7. Ģeopolitiskais risks palielina visu
GPU ražošana lielā mērā ir atkarīga no Taivānas.
Riska faktori ir:
-
Ķīnas un Taivanas spriedze
-
ASV eksporta kontrole
-
Sankcijas
-
tirdzniecības ierobežojumi
-
mikroshēmu embargo politika
ASV kontrolē piekļuvi AI žetoniem Ķīnai.
Ķīna tagad ir agresīva.
Tas rada papildu deficītu.
8. Kad GPU deficīts faktiski beigsies?
Īsa atbilde:
Drīz vien.
Reālistiski grafiski apsvērumi:
2025. gads
-
nedaudz brīvāki piegādes ierobežojumi
-
jaunas fabs sākt ierobežotu rampu
-
vairāk HBM pieejamība
-
bet AI pieprasījums pieaug ātrāk nekā piedāvājums
2026. gads
-
pabeigtas papildu iepakojuma līnijas
-
daži reģioni redzēt cenu stabilizēšanos
-
uzņēmumu nesamaksāto parādu samazinājums
2027+
-
nākamais-gen fabs nāk tiešsaistē
-
piedāvājums pasaulē ievērojami paplašinās
-
trūkst jēgpilnu kritumu
Lielākā daļa analītiķu projekta nozīmīgu normalizāciju starp 2026.–2028. gads.
Ne 2025. gadā.
Protams, ne 2024.-2025.
9. Vai GPU cenas kritums?
Tie testaments, bet lēni – jo:
-
sabiedrības joprojām maksās prēmijas
-
lielas rezerves tagad ir normāli
-
MI pieprasījums nesabruks
-
spēļu cikli turpinās
-
ikgadējā tehnoloģiju atsvaidzināšana paātrina
Cenas kritums notiek tikai tad, ja:
piedāvājums > pieprasījums
Mēs esam tālu no tā.
Vai varētu atkārtoties vēl viens trūkums?
Jā, un viegli.
Augstākā riska izraisītāji:
-
konflikts Taivānā
-
AI bruņošanās sacensību eskalācija
-
eksporta aizliegumi
-
HBM deficīts
-
loģistikas sabrukums
-
jauns ieguves bums
-
piegādes ķēdes kiberuzbrukums
Pusvadītāju nestabilitāte joprojām ir ārkārtīgi augsta.
Secinājums
Globālais GPU trūkums nav īslaicīgas neērtības – tas ir strukturālās nelīdzsvarotības rezultāts, kas pārveidojusi skaitļošanas nozari.
Pirmo reizi vēsturē:
GPU ir stratēģiski svarīgāki par procesoriem.
Pieprasījums no MI, mākoņdatošanas, spēļu un rūpnieciskās simulācijas ir pārspējis pasaules ražošanas spēju piegādāt modernus grafikas procesorus. Šis trūkums, visticamāk, turpināsies līdz šīs desmitgades otrajai pusei, samazinoties tikai kā jaunas fabs, iepakošanas uzņēmumi, un atmiņas iekārtas nobriest un stabilizējas visā pasaulē.
Vai deficīts beigsies?
Jā.
Bet ne šogad.
Ne jau nākamgad.
Mēs esam uz vairāku gadu termiņu, un pasaules MI apetīte joprojām paātrinās.
Kamēr ražošana beidzot pārsniegs pieprasījumu, GPU paliks viens no vērtīgākajiem un dārgākajiem aktīviem tehnoloģiju pasaulē.


11751
IT Pro 



















