Introdução
A computação moderna funciona em silício – e GPUs se tornaram o novo ouro. Seja para jogos, pesquisa de IA, VFX, renderização 3D, criptografia, ou operações de data-center, a demanda por poderosos processadores gráficos explodiu nos últimos anos. O resultado tem sido uma prolongada escassez global de GPU que afetou todos, desde consumidores individuais até provedores de nuvem em hiperescala.
O que começou como uma interrupção da oferta evoluiu para uma crise global complexa e multicamada envolvendo gargalos avançados de fabricação de semicondutores, restrições geopolíticas, investimento maciço em IA, demanda de jogos, crescente consumo de nuvem e transições tecnológicas.
Este artigo quebra por que a escassez global de GPU persiste, porque novas fichas permanecem caras, e - mais importante -quando (e se) esta escassez acabará finalmente.

1. Por que GPUs são diferentes de outras fichas
GPUs não são CPUs.
Exigem:
-
mais transistores por mm2
-
litografia mais avançada (até 3nm / 5nm)
-
Integração de memória de alta largura de banda (HBM)
-
embalagem avançada (CoWoS, EMIB, empilhamento 3D)
-
tolerância de defeito extremamente baixa
-
linhas de fabricação especializadas
-
fornecedores globais limitados
Isto significa:
-
Produção de GPU não pode simplesmente ser “dimensionada”
-
novas fábricas não podem ser ligadas durante a noite
-
apenas um punhado de empresas pode fazê-los em tudo
95%+ da produção de GPU de ponta hemorrágica é dependente do TSMC, o gigante semicondutor de Taiwan.
Este é um único ponto de fracasso global.
2. O que ativou a escassez? (Multiplos Ondas)
A escassez de GPU não é um evento – é uma série sobreposta de ondas:
Onda 1 — Disrupção da oferta pandémica (2020-2021)
Fábricas fechadas.
O transporte congelou.
A procura aumentou.
Resultado: zero inventário no lançamento para a maioria das GPUs de consumo.
Onda 2 — Criptominagem Frenzy
A mineração Ethereum enviou a demanda da GPU ao máximo.
Os jogadores competiram com fazendas de mineração em escala industrial.
Os preços subiram 200%–400%.
Onda 3 — Explosão de computação em nuvem
Os Hyperscalers expandiram drasticamente a capacidade da GPU para IA:
-
AWS
-
Google Cloud
-
Microsoft Azure
-
Nuvem Oracle
-
Nuvem Tencent
-
Nuvem Alibaba
Cada hiperescalador ordenou milhões de unidades.
Onda 4 — AI Gold Rush (2023-2025)
A ascensão de:
-
ChatGPT
-
Família GPT-4
-
Modelos Llama
-
Difusão estável
-
MidJourney
-
Formação de IA em toda a parte
transformou GPUs em infraestrutura estratégica.
Corporações, governos e contratantes de defesa entraram na guerra de licitações.
Wave 5 — Embalagem de semicondutores
O gargalo da embalagem da CoWoS atrasou as remessas por meses.
Não importa se uma GPU está pronta - se ela não pode ser ligada à HBM, é inutilizável.
3. Por que AI é o motorista principal agora
Isto é crucial:
A IA é o primeiro consumidor de GPUs high-end hoje.
A IA generativa requer:
-
Parâmetros de formação em escala de bilhões
-
cargas de trabalho contínuas de inferência
-
enorme capacidade de computação paralela
-
rendimento de memória de alta largura de banda
A formação de um modelo de fronteira pode exigir dezenas de milhares de GPUs de classe H100/H200—e isso é para um single modelo.
Em seguida, a inferência (uso contínuo) consome até mesmo mais hardware com o tempo.
A demanda passou de milhares → centenas de milhares → milhões de unidades globalmente.
Nenhuma indústria de fabricação pode absorver esse choque instantaneamente.
4. NVIDIA Dominância = Gargalo de Mercado
Controlos NVIDIA:
-
80–90% do mercado global de GPU de IA
-
quase todo o hardware de treinamento de hiperescala
-
Bloqueio do ecossistema CUDA
A quantidade de GPU é limitada.
As alternativas GPU são limitadas.
Os custos de mudança de GPU são enormes.
As empresas não têm escolha senão esperar e pagar.
5. Por que as GPUs de consumo e jogos permanecem caras
Você pensaria que GPUs de consumo seria barato agora.
No entanto:
1. Fabricação prioriza GPUs datacenter
(H100, GH200, B200, etc.)
Porque...
Margem de lucro por ficha:
$2000+ → $30.000+
vs
cartão de consumo:
$200 → $1600
Os fabricantes preferem as fichas lucrativas.
2. A demanda de jogos permanece alta
Novos títulos AAA exigem mais poder.
3. O mercado usado é seco
O colapso da mineração inundou o suprimento uma vez- mas esse fornecimento já era.
4. AI hobbyists estão agora competindo com jogadores
Mais concorrência → preços mais elevados.
6. Fornecimento de gargalos explicado
As maiores restrições de hoje:
• Litografia
Somente TSMC, Samsung e Intel podem construir nós avançados.
• Capacidade de embalagem
CoWoS é limitado e complexo.
• Produção da HBM
Apenas alguns fornecedores fornecem:
-
SK Hynix
-
Samsung
-
Micron
e as taxas de rendimento são baixas.
• Depleção de inventário
Já não existem stocks de armazém.
• Logística de envio
hardware viaja através de dezenas de passos:
FAB → embalagem → memória → montagem do tabuleiro → teste → validação → distribuição
7. Risco geopolítico amplia tudo
A produção de GPU depende maciçamente de Taiwan.
Os factores de risco incluem:
-
As tensões entre a China e Taiwan
-
Controlos de exportação dos EUA
-
sanções
-
Restrições comerciais
-
políticas de embargo de chips
Os EUA controlam o acesso a chips de IA para a China.
A China está agora a estocar agressivamente.
Isso impulsiona a escassez adicional.
8. Quando a falta de GPU realmente terminar?
Resposta curta:
Não tão cedo.
Considerações realistas da linha do tempo:
2025
-
restrições de fornecimento afrouxar ligeiramente
-
novos fabs começam rampa limitada
-
mais disponibilidade HBM
-
Mas a procura de IA aumenta mais rapidamente do que a oferta
2026
-
linhas de embalagem adicionais concluídas
-
Algumas regiões vêem estabilização de preços
-
O backlog corporativo diminui
2027+
-
fabs da próxima geração vêm online
-
oferta global expande significativamente
-
escassez diminui significativamente
A maioria dos analistas projeta normalização significativa entre 2026-2028.
Não em 2025.
Certamente não em 2024-2025.
9. Os preços da GPU cairão?
Eles will, mas lentamente - porque:
-
As empresas ainda irão pagar prémios
-
margens elevadas são agora normais
-
A demanda de IA não vai cair
-
ciclos de jogo continuar
-
as atualizações tecnológicas anuais estão acelerando
O colapso do preço só ocorre quando:
oferta > procura
Estamos longe disso.
10. Poderia outra escassez acontecer novamente?
Sim, e facilmente.
Principais gatilhos de risco:
-
conflito em Taiwan
-
AI escalada da corrida armamentista
-
Proibições de exportação
-
Escassez de HBM
-
colapso logístico
-
novo boom de mineração
-
ciberataque da cadeia de suprimentos
A fragilidade dos semicondutores permanece extremamente elevada.
Conclusão
A escassez global de GPU não é um inconveniente temporário – é o resultado de um desequilíbrio estrutural que reformou a indústria de computação.
Pela primeira vez na história:
GPUs são mais estrategicamente importantes do que CPUs.
A demanda de IA, computação em nuvem, jogos e simulação industrial superou a capacidade de fabricação do mundo para fornecer processadores gráficos avançados. Esta escassez provavelmente continuará até a segunda metade da década, facilitando apenas como novos fabs, plantas de embalagem, e instalações de memória amadurecer e estabilizar globalmente.
Acabará a escassez?
Sim.
Mas não este ano.
Não no próximo ano.
Estamos em uma linha do tempo de vários anos – e o apetite de IA do mundo ainda está acelerando.
Até que a produção finalmente ultrapasse a demanda, as GPUs continuarão sendo um dos ativos mais preciosos e caros do mundo tecnológico.


11386
IT Pro 



















