Alibaba Cloud migra para IA agentic, receita de tokens dispara 15x em 5 meses

BABA-0,79%

Abertura

A Alibaba Cloud anunciou, em 20 de maio de 2026, no Alibaba Cloud Summit, uma atualização abrangente do seu sistema de tecnologia full-stack, se posicionando para a era de IA Agentic. A empresa apresentou novos produtos, incluindo o site do produto Qwen Cloud, o chip de IA auto-desenvolvido Pangu M890 integrado ao servidor supernode Panjiu AL128, e o modelo Qwen3.7-Max, carro-chefe. Essa mudança reflete um alteração fundamental nos principais usuários do setor de computação em nuvem: como agentes de IA operam 24 horas por dia de forma contínua, com demandas infinitas de IA e de nuvem, a Alibaba Cloud está reestruturando toda a sua pilha tecnológica, dos chips da camada inferior, passando pela infraestrutura Agentic Cloud, pelos modelos, até as plataformas de inferência. Segundo executivos da empresa, a receita de IA baseada em tokens está prestes a substituir o ECS (Elastic Compute Service) como a maior linha de produtos da Alibaba Cloud, marcando uma transição de serviços de nuvem tradicionais para modelos de consumo orientados por IA. Nos últimos cinco meses, a receita diária média de tokens da Alibaba Cloud cresceu aproximadamente 15 vezes, sinalizando a aceleração dessa transformação.

Série de chips Pangu AI e infraestrutura de hardware

A Alibaba Cloud divulgou um agressivo roadmap de chips centrado no Pangu M890, um chip de IA unificado de treinamento e inferência de próxima geração, com desempenho três vezes superior ao da geração anterior Pangu M810E. O servidor supernode Panjiu AL128, alimentado pelo M890 e equipado com o chip de interconexão ICN Switch 1.0 desenvolvido internamente, permite que 128 chips de IA funcionem como uma única unidade de computação, com latência ponto a ponto abaixo de 150 nanossegundos, atendendo à inferência massivamente concorrente e às demandas de treinamento de modelos grandes em cenários de agentes.

A Alibaba Cloud revelou o roadmap da série de chips Pangu, comprometendo-se a lançar uma nova geração por ano nos próximos dois anos, com lançamentos planejados dos chips Pangu V900 e Pangu J900 oferecendo maior capacidade computacional. Até o momento, a série Pangu já despachou 560.000 chips acumulados, atendendo mais de 400 clientes em mais de 20 setores.

Crescimento da receita por tokens e posição no mercado

A Alibaba Cloud detém a maior fatia no mercado MaaS de modelos grandes (Model-as-a-Service). A empresa informou que a receita por tokens registrou uma aceleração significativa a partir deste ano, com o período anterior caracterizado apenas como um “prólogo”. De acordo com executivos da empresa, a receita diária média por tokens aumentou aproximadamente 15 vezes ao longo dos últimos cinco meses, refletindo a rápida adoção de serviços de IA. Essa trajetória de crescimento indica que métricas baseadas em tokens estão se tornando a unidade de medição principal para a expansão de receita da Alibaba Cloud.

Redesign de produtos de nuvem para cargas de trabalho de agentes

A Alibaba Cloud está reestruturando fundamentalmente seus produtos de nuvem para operar como sistemas nativos de agentes. Produtos de nuvem tradicionais foram projetados com operadores humanos em mente, mas as cargas de trabalho de agentes apresentam características incompatíveis com a computação em nuvem convencional: elasticidade irregular, ciclos de vida curtos e escalonamento instantâneo. A empresa realizou Skill-ification, transformação MCP (Model Context Protocol) e padronização de CLI (Command Line Interface) de todos os produtos de nuvem, permitindo que agentes invoquem capacidades de nuvem como chamadas de função padronizadas.

Essa filosofia de redesign levou a Alibaba Cloud a lançar o Qwen Cloud, um novo site de produto separado do portal principal da Alibaba Cloud. Na página inicial, o site exibe uma única instrução de prompt legível por agentes. Todas as capacidades de serviço de modelos são encapsuladas como Skills padronizadas e ferramentas de CLI, permitindo que agentes interpretem a instrução, adquiram as capacidades completas da plataforma e invoquem autonomamente as funções necessárias. De acordo com a liderança da empresa, o julgamento central por trás dessa iniciativa é que os principais usuários da computação em nuvem futura serão agentes de IA, e não engenheiros humanos, exigindo uma mudança fundamental na arquitetura do produto e no design de interação.

Capacidades e desempenho do modelo Qwen3.7-Max

A Alibaba Cloud lançou o Qwen3.7-Max como seu mais recente modelo de linguagem grande carro-chefe. No ranking de testes cegos globais de modelos grandes do Arena, o Qwen3.7-Max fica em primeiro lugar entre os modelos chineses, superando Kimi-K2.6, DeepSeek-v4-pro e GLM-5.1, enquanto se aproxima dos níveis de desempenho dos modelos mais fortes da GPT, Claude e Gemini.

Um estudo de caso em produção demonstra a capacidade autônoma do modelo além do benchmarking padrão. No chip Pangu M890 — uma plataforma com a qual o modelo nunca havia lidado durante o treinamento — o Qwen3.7-Max concluiu, de forma independente, uma implementação e tarefa de otimização de um kernel de computação de IA em nível de produção em mais de 35 horas, usando apenas uma descrição da tarefa, alcançando um desempenho 10 vezes maior do que a versão de referência oficial. Esse caso exemplifica uma mudança fundamental nos objetivos de design do modelo: de otimizar para alinhamento de preferência humana para otimizar para conclusão autônoma de tarefas. Segundo a liderança da divisão de modelos grandes da Alibaba, o Qwen3.7-Max foi projetado para servir como o núcleo inteligente de agentes, equipado com planejamento autônomo, iteração contínua e capacidade de colaboração entre ferramentas.

A Alibaba Cloud identificou o AI Coding (programação orientada por IA) como um domínio de aplicação principal. A empresa observa que o AI Coding cria novas aplicações enquanto, ao mesmo tempo, moderniza o código legado acumulado ao longo de décadas. Executivos da empresa destacaram que o AI Coding mira gastos com desenvolvimento de software e terceirização externa que antes ficavam fora da captura de receita tradicional dos serviços de nuvem, representando uma expansão significativa da oportunidade de mercado endereçável.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários