Analista: a demanda por memória de IA pode impulsionar as ações de chips em até 10x

O analista Zeitgeist afirmou que a demanda por chips de memória usados em inteligência artificial supera, em ordens de magnitude, a capacidade atual de produção global, sugerindo que os estoques de fabricantes de memória poderiam subir dez vezes se fossem avaliados pelas necessidades reais de computação, e não pelas máximas históricas. Zeitgeist apresentou um exemplo de investimento: US$ 50.000 aplicados em ações da Micron em setembro do ano passado valeriam aproximadamente US$ 489.000 hoje. O analista atribuiu o desequilíbrio oferta-demanda a limites fixos de memória de alta largura de banda (HBM) em aceleradores de IA e à adoção rápida de agentes de IA, que consomem muito mais memória por sessão do que chatbots tradicionais — uma mudança que ocorre enquanto a produção de memória escala mais lentamente do que o crescimento do uso.

Aceleradores de IA enfrentam limites fixos de memória

Cada acelerador de IA é enviado com uma quantidade fixa de memória de alta velocidade que não pode ser expandida após a implantação. Segundo Zeitgeist, um chip H100 padrão carrega 80 GB de HBM, as gerações mais novas oferecem até 192 GB, e o futuro B300 terá 288 GB. Esse teto determina quantas requisições um único acelerador consegue processar simultaneamente.

O analista explicou que a principal carga de memória não vem dos pesos do modelo, mas do cache KV — memória de sessão que cresce a cada token gerado. Zeitgeist calculou que uma sessão com contexto de 128.000 tokens exige aproximadamente 20 GB de memória, o que significa que apenas quatro sessões desse tipo esgotariam totalmente os recursos de um único H100. Modelos avançados como Claude Opus 4.8 ou GPT-5.5 exigem de 40 GB a 100 GB para uma única requisição longa, segundo o analista.

Analista calcula falta de memória 60x por adoção de agentes

Zeitgeist identificou a mudança de chatbots simples para agentes de IA como o principal impulsionador da demanda por memória. Enquanto uma pergunta normal impõe pouca carga à memória, um agente que chama ferramentas de forma independente e acumula contexto pode facilmente atingir 100.000 tokens ou mais. O analista calculou que um único trabalhador do conhecimento executando dez desses agentes em paralelo exigiria aproximadamente 152 GB de memória.

Zeitgeist observou que existem aproximadamente 250 milhões de trabalhadores do conhecimento no mundo. O analista estimou que, com 100 sessões agentic por pessoa por dia, o mundo precisaria de cerca de 60 vezes mais memória do que será produzida em 2026. Zeitgeist reconheceu que novos métodos de atenção podem reduzir o uso de memória em quatro a oito vezes, mas disse que a demanda está crescendo mais rápido à medida que agentes substituem chats simples, as janelas de contexto aumentam de 128.000 para 10 milhões de tokens e o uso de IA por cada trabalhador passa de zero para centenas de sessões.

SK Hynix ultrapassa Samsung à medida que a demanda por memória de IA dispara

A fabricante sul-coreana de memória SK Hynix ultrapassou a Samsung como a empresa listada mais valiosa do país, impulsionada por sua posição em chips de memória de alta largura de banda usados em cargas de trabalho de inteligência artificial. Zeitgeist afirmou que essa mudança sustenta a tese de que os produtores de memória estão se tornando grandes beneficiários da corrida pela infraestrutura de IA, com empresas capazes de produzir chips avançados de memória posicionadas para ver receita e avaliações crescerem de forma acentuada à medida que a demanda por HBM crescer mais rápido do que a oferta.

FAQ

O que o analista Zeitgeist disse sobre a valorização das ações de chips de memória?

Zeitgeist afirmou que as ações de fabricantes de memória poderiam subir dez vezes em relação aos níveis atuais se fossem avaliadas pelas necessidades reais de computação, e não pelas máximas históricas, citando uma demanda por memória de IA que excede a capacidade global de produção em ordens de magnitude.

Quanta memória uma sessão de agente de IA exige, segundo Zeitgeist?

Zeitgeist calculou que uma sessão com contexto de 128.000 tokens exige aproximadamente 20 GB de memória, enquanto modelos avançados como Claude Opus 4.8 ou GPT-5.5 exigem de 40 GB a 100 GB para uma única requisição longa. O analista estimou que um trabalhador do conhecimento executando dez sessões de agente em paralelo precisaria de aproximadamente 152 GB de memória.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários