Zhang Haixiao, gestor de fundos de ações na Yongyingfund, afirmou em uma participação recente no programa “Chief Connection” do The Paper que o atual “super ciclo” dos semicondutores é fundamentalmente diferente dos ciclos anteriores devido a uma mudança nas fontes de demanda — impulsionadas pela produção de IA, e não por fatores baseados em estoques. Segundo Zhang, a demanda na ponta não diminuiu apesar dos aumentos de preço; ao contrário, os gastos com capital (capex) continuam subindo e até mesmo os aumentos no preço dos tokens não conseguiram conter a demanda, criando uma cadeia de transmissão bem “suave” por toda a indústria.
Zhang traçou uma evolução clara da demanda começando com o lançamento do ChatGPT no fim de 2022. Inicialmente, a demanda por hardware se concentrou em endpoints de treinamento buscando desempenho extremo, com a memória de alta largura de banda (HBM) alcançando aplicações em grande escala pela primeira vez. Conforme os modelos introduziram novos paradigmas — como raciocínio em cadeia de pensamento e contexto estendido para melhorar resultados — a demanda migrou para endpoints de inferência, nos quais o consumo de tokens registrou crescimento de dois dígitos em termos percentuais ano contra ano.
Na segunda metade de 2025, Agentes de IA capazes de invocação autônoma de ferramentas e conclusão de tarefas complexas passaram de conceito à realidade, elevando ainda mais as dependências de armazenamento. Com base nessa sequência de explosões de demanda, Zhang concluiu: “O ponto de partida deste ciclo de aumentos de preços dos chips de armazenamento foi o 3º trimestre de 2025.” Ele atribuiu a reversão total dos desequilíbrios entre oferta e demanda ao crescimento explosivo do lado da demanda na ponta, um julgamento corroborado por divulgações financeiras recentes de empresas que mostraram fortes liberações de lucro em hardware de IA, especialmente entre produtos associados aos aumentos de preço de chips de armazenamento.
Zhang destacou que o atual “super ciclo” difere fundamentalmente do ciclo de 2019-2021, e a diferença estrutural mais crítica é uma mudança fundamental nas características da demanda. O período de 2019-2021 foi um ciclo típico orientado por estoques, no qual o crescimento da demanda final veio principalmente de necessidades de home office e de interrupções na cadeia de suprimentos que levaram ao comportamento de acumular estoques. Consequentemente, a partir de meados de 2022, a indústria rapidamente caiu em uma “situação de desestocagem e rápida queda nos preços dos chips”.
“Nesta rodada, a demanda se origina de endpoints de produção de IA”, afirmou Zhang. “A ponta não reduziu compras por causa dos aumentos de preço; em vez disso, os gastos com capital continuam subindo. Até aumentos no preço dos tokens não conseguiram suprimir a demanda, e toda a cadeia de transmissão é extremamente suave.” Ele também observou que o capex global de IA deve atingir US$ 700 bilhões em 2026, e esse número ainda está sendo revisado para cima.
Ao mesmo tempo, a contenção do lado da oferta ampliou significativamente o gap entre oferta e demanda. Principais fornecedores de armazenamento planejam aumentos de aproximadamente 50% no capex em 2026, mas existe um atraso considerável entre investimento de capital e a formação efetiva da oferta. Além disso, novos aportes miram principalmente armazenamento de alto desempenho específico para IA, enquanto expansões gerais de capacidade de armazenamento ainda aguardam liberação futura.
Zhang dividiu os benefícios na cadeia da indústria em dois caminhos: primeiro, a cadeia de vendas de fabricantes de equipamento original (OEMs), fabricantes de módulos e empresas de design, que vivenciam a prosperidade primeiro — algo já validado por relatórios financeiros recentes; segundo, a cadeia de expansão de equipamentos, materiais e construção de instalações, em que a transmissão da prosperidade ocorre com um atraso relativo, em um processo gradual.
Vale notar que a postura cautelosa dos OEMs no upstream sobre a oferta aparece em ajustes estratégicos. Zhang revelou que “OEMs do upstream, como empresas intensivas em capital preocupadas com uma possível demanda abaixo do esperado no futuro e consequentes prejuízos, estão assinando ativamente acordos de fornecimento de longo prazo (LTAs) com clientes para garantir demanda futura”.
A evolução da arquitetura tecnológica está remodelando a hierarquia do valor do hardware. Zhang explicou essa mudança usando o “princípio do barril”: sob a arquitetura de Von Neumann, computação, armazenamento e comunicação de entrada-saída constituem três funções centrais, e um dos elementos vira o gargalo de desempenho em diferentes etapas. Em 2023, o poder de computação era claramente a restrição, mas com a explosão da demanda por endpoints de inferência, o gargalo rapidamente migrou para o lado do armazenamento.
Os ciclos de iteração de hardware estão se acelerando. Antes de 2022, a HBM normalmente era atualizada a cada três a quatro anos; desde 2023, esse ciclo foi comprimido para “atualizações a cada dois anos”. Essa tendência de aceleração também aparece em chips de computação e chips de comunicação. Em paralelo, a evolução das arquiteturas de computação está levando a CPU de volta ao centro do palco. Zhang citou dinâmicas da indústria indicando que a futura relação GPU-CPU pode sair da atual de 8:1 para 4:1, rumo a 2:1 ou até 1:1, impulsionando diretamente maior demanda por memória e impondo requisitos mais altos de velocidade de transmissão para chips de memória e de interface — atualizações que continuarão empurrando os preços unitários dos produtos para cima.
Além da sincronização global dos ciclos, o avanço dos semicondutores domésticos representa outro foco-chave de investimentos. Zhang observou que os OEMs de armazenamento do upstream doméstico fizeram progressos notáveis: a participação de mercado saiu de zero para aproximadamente 10%, tornando-se uma força incontestável da indústria. “A melhoria das capacidades dos OEMs impulsionará o desenvolvimento nos setores de design do meio para baixo (mid-downstream) e de equipamentos e materiais do upstream. Cada transferência anterior na história da indústria global de armazenamento trouxe atualizações abrangentes da cadeia de suprimentos para regiões locais, e desta vez não será diferente. Porém, isso está destinado a ser um processo de longo prazo, e não algo alcançado da noite para o dia.”
Quanto a potenciais riscos, Zhang identificou variáveis centrais tanto do lado da oferta quanto do lado da demanda. Do lado da oferta, acompanhar o timing da liberação de capacidade de produção é crucial: os fabricantes primeiro maximizam a capacidade existente; depois, adicionam equipamentos dentro das instalações atuais (tipicamente exigindo 6-12 meses para produção efetiva); em seguida, constroem novas instalações (geralmente 2-3 anos para capacidade efetiva). Ele alertou: “A maior liberação de capacidade deve se concentrar nos próximos dois anos, exigindo monitoramento contínuo para verificar se o ritmo de liberação excede as expectativas.”
Do lado da demanda, a atenção deve se concentrar no ritmo do capex de IA e nos desenvolvimentos tecnológicos. Zhang concluiu: “O capex de IA é o indicador de acompanhamento mais direto, enquanto novas tecnologias abrem totalmente novos espaços de mercado, afetando as previsões de capex por fabricantes de modelos e gigantes da internet — e tudo isso requer observação contínua.”
Notícias relacionadas
Aumento de Liquidez Impulsiona o Otimismo no Mercado de Criptomoedas
Aumento de Liquidez Impulsiona Otimismo no Mercado Cripto
3 criptos em rompimento para ficar de olho e buscar ganhos enormes — ARKM, PYTH e SEI
Laureada com o Nobel Spence: a IA poderia aumentar a produtividade, mas não vai resolver a crise de crescimento
Raoul Pal: A corrida de IA EUA-China de 2026 é uma guerra que ninguém consegue vencer