Microsoft cancelou a maioria de suas licenças do Claude Code no mês passado para reduzir os custos com IA, de acordo com o The Verge. A medida reflete uma mudança mais ampla no setor, à medida que as empresas começam a gerenciar despesas de IA como orçamentos tradicionais de TI, em vez de incentivar a adoção irrestrita. O CEO Satya Nadella questionou esta semana se um futuro dominado por um punhado de provedores de modelos de fronteira é viável, defendendo, em vez disso, um ecossistema de IA mais competitivo. A mudança ocorre no momento em que modelos de código aberto reduzem a lacuna de desempenho com sistemas proprietários, enquanto os custos de inferência diminuem, criando o que observadores do setor descrevem como a primeira fase deflacionária da IA desde que o ChatGPT lançou o boom da IA generativa no final de 2022.
A Microsoft começou a cancelar a maioria de suas licenças do Claude Code no mês passado para reduzir custos, informou o The Verge. A decisão reflete uma mudança na forma como as empresas abordam os gastos com IA. Em vez de incentivar a adoção irrestrita de IA, as empresas agora gerenciam despesas de IA como qualquer outra despesa operacional, rastreando o consumo de tokens, impondo limites de uso e direcionando cargas de trabalho para modelos de menor custo sempre que possível.
O CEO Satya Nadella afirmou esta semana que um futuro dominado por um punhado de provedores de modelos de fronteira pode não ser inevitável. Ele defendeu um ecossistema de IA mais competitivo, onde os clientes possam escolher entre vários modelos, em vez de depender de alguns fornecedores premium.
À medida que mais fornecedores de IA cobram dos clientes com base no uso de tokens, em vez de assinaturas fixas, cada prompt, conclusão e chamada de API se tornou uma despesa operacional mensurável. Essa mudança está afetando a economia de tokens emergente do setor. As empresas estão começando a rastrear e gerenciar os gastos com IA com o mesmo escrutínio aplicado a outros orçamentos de TI.
A mudança apresenta desafios para empresas de IA de fronteira, como OpenAI e Anthropic. Sua vantagem competitiva não é mais definida apenas pela construção do modelo mais capaz. Elas também devem preservar o poder de precificação em um mercado onde modelos abertos de alto desempenho estão se proliferando e as empresas estão se tornando mais conscientes dos custos.
Tanto a OpenAI quanto a Anthropic protocolaram confidencialmente seus IPOs junto à Comissão de Valores Mobiliários dos EUA (SEC). Isso pode atrair o foco dos investidores não apenas para sua liderança tecnológica, mas também para saber se elas conseguem sustentar preços premium em um mercado cada vez mais competitivo.
A Z.ai lançou seu modelo GLM-5.2 neste mês. Desenvolvedores do Vale do Silício elogiaram o modelo por suas capacidades de codificação e agente. O modelo está entre os de melhor desempenho em benchmarks públicos de IA e oferece desempenho de codificação comparável aos principais modelos proprietários da OpenAI e Anthropic por cerca de um sexto do custo, de acordo com um relatório da Reuters citando a empresa e rastreadores de benchmarks.
Muitos dos modelos de peso aberto mais competitivos estão surgindo na China, reduzindo rapidamente a lacuna com as ofertas proprietárias, ao mesmo tempo em que as superam em preço. Empresas chinesas, incluindo Z.ai, DeepSeek e Alibaba, adotaram cada vez mais lançamentos de peso aberto que permitem que as empresas hospedem e personalizem modelos por conta própria, em vez de depender exclusivamente de APIs premium.
Pesquisadores da Universidade de Chicago e da Universidade Chapman argumentam que os controles de exportação dos EUA sobre chips avançados de IA incentivaram involuntariamente a China a investir em ecossistemas abertos de IA e inovação com eficiência computacional. Os pesquisadores descobriram que, após as principais medidas de controle de exportação dos EUA, os desenvolvedores chineses aumentaram seu envolvimento com repositórios de LLM de código aberto muito mais do que seus colegas americanos.
A pesquisa chinesa mudou para otimização de inferência, compressão de modelos e ajuste fino com eficiência de parâmetros após as restrições. As descobertas dos pesquisadores sugerem que os controles de exportação podem ter acelerado, em vez de dificultado, o desenvolvimento de modelos de IA abertos e econômicos na China.
O Global X Artificial Intelligence & Technology ETF (AIQ) subiu 47% nos últimos 12 meses. O iShares U.S. Technology ETF (IYW) subiu 44% no mesmo período.
Por que a Microsoft cancelou as licenças do Claude Code? A Microsoft cancelou a maioria de suas licenças do Claude Code no mês passado para reduzir os custos com IA, conforme relatado pelo The Verge. A medida reflete uma tendência mais ampla do setor, na qual as empresas estão gerenciando despesas de IA como orçamentos tradicionais de TI, em vez de incentivar a adoção irrestrita.
Qual é a diferença de custo entre o GLM-5.2 da Z.ai e os modelos proprietários? O modelo GLM-5.2 da Z.ai oferece desempenho de codificação comparável aos principais modelos proprietários da OpenAI e Anthropic por cerca de um sexto do custo, de acordo com um relatório da Reuters citando a empresa e rastreadores de benchmarks. O modelo foi lançado neste mês e está entre os de melhor desempenho em benchmarks públicos de IA.
Notícias relacionadas
Ações da Microsoft registram o pior primeiro semestre desde 2000 com queda de 24%
Mastercard mira 2030 para mudança para pagamentos com token e biometria
Anthropic acusa Alibaba de realizar a maior campanha conhecida para copiar o Claude AI
MSTR, PLTR, NFLX atingem mínimas de 52 semanas em meio à rotação de mercado
Vazamento do Claude Code sugere retorno de Fable 5 com limites de uso semanais