A Microsoft está em negociações para fornecer à Anthropic, a empresa de IA de São Francisco por trás da Claude, seus chips de IA Maia 200 por meio da Azure. O acordo ainda não foi finalizado, mas pode ajudar a Microsoft a reduzir a diferença para a Amazon e o Google na oferta de chips de IA personalizados a clientes de nuvem. Em novembro, a Microsoft investiu US$ 5 bilhões na Anthropic. A Anthropic se comprometeu a gastar US$ 30 bilhões na Azure, enquanto a startup também usa GPUs da Nvidia além de chips personalizados da Amazon e do Google.
Maia 200 mira eficiência na inferência de IA
O Maia 200 da Microsoft foi construído para inferência de IA — o trabalho de executar um modelo treinado para gerar respostas — e não como um chip de uso geral. Rodar grandes serviços de IA ao longo do tempo pode custar mais do que treinar o modelo em primeiro lugar. A Microsoft diz que o Maia 200 oferece 30% a mais de desempenho por dólar, o que poderia reduzir custos diários para um cliente de alto volume ou viabilizar recursos como janelas de contexto mais longas sem aumentar o orçamento. O chip também busca manter os tempos de resposta mais estáveis durante picos de tráfego, o que importa para empresas que constroem produtos sobre os modelos da Anthropic.
Chips personalizados reconfiguram a concorrência em IA
As conversas sugerem que a disputa está avançando além de comprar mais unidades de processamento gráfico (GPUs) da Nvidia. Empresas estão combinando criadores de modelos com plataformas de chips personalizados e os sistemas de nuvem que os executam. A Anthropic já adota essa abordagem com a Google e a Broadcom, uma projetista de chips e empresa de infraestrutura. Ela está ajustando seus modelos Claude para funcionar de forma mais estreita com o hardware e a pilha de software da Unidade de Processamento Tensorial (TPU) da Google. Uma configuração semelhante com a Microsoft para o Maia 200 poderia dar suporte a um plano multicloud com mais de um fornecedor de chips, ampliando o acesso da Anthropic a silício personalizado por meio da Azure. Espera-se que remessas de chips personalizados de provedores de nuvem aumentem 44,6% em 2026, em comparação com crescimento de 16,1% para GPUs.