O CEO da MiniMax Intelligence, Li Dahai, afirmou na 2026 Beijing Zhiyuan Conference que a tecnologia de agentes exige uma abordagem criteriosa, apesar do avanço rápido. Conversando com a Pengpai News e outros veículos de mídia, Li explicou que as expectativas do público por agentes sem erros superam o que a curva atual de desenvolvimento técnico consegue entregar, já que a tecnologia ainda precisa de tempo para amadurecer. Ele apontou 2025 como o primeiro ano dos agentes, prevendo um crescimento explosivo que terá impacto profundo na sociedade humana, embora tenha ressaltado a necessidade de uma avaliação serena das capacidades técnicas atuais no campo de agentes de IA.
Li Dahai reconheceu que a integração de modelos grandes e a tecnologia de agentes está evoluindo rapidamente, com alguns cenários já chegando a aplicações práticas. Ao falar sobre limitações de agentes, Li afirmou diretamente: "Problemas em todo lugar." Ele detalhou que "a evolução da tecnologia de modelos e agentes é muito rápida", explicando que "talvez hoje algum trabalho tenha uma taxa de erro de 10% e, no próximo mês, a taxa de erro caia para 1% — a rápida evolução virou uma tendência central."
Li Dahai contestou diretamente a crença difundida na indústria de que "criar bons modelos pequenos precisa vir da destilação de modelos base de escala ultra-grande", chamando isso de "um equívoco cognitivo". Ele explicou: "Por trás da destilação há uma premissa bem específica: o próprio objeto da destilação precisa ser um bom modelo. A destilação é essencialmente: para empresas que não têm capacidade de desenvolver modelos base por conta própria, mas querem fazer o pouso de aplicações, elas adotam modelos base pequenos existentes e obtêm capacidades para cenários específicos por meio de fine-tuning. Nesse processo, elas podem de fato usar outros modelos grandes para sintetizar dados para permitir que os modelos pequenos adquiram capacidades correspondentes." Li afirmou que este é o paradigma para todo o treinamento de modelos grandes, não se limitando apenas a modelos pequenos.
Li Dahai revelou: "Desde este ano, como a indústria como um todo mudou a inferência para chips domésticos, nós também estamos transferindo gradualmente o treinamento para chips domésticos e clusters domésticos." Ele identificou dois caminhos paralelos para melhorar o ecossistema de computação doméstica: o primeiro é o refinamento de baixo para cima, em que empresas de modelos grandes aprimoram gradualmente o ecossistema por meio das próprias práticas de treinamento, "como umidificar uma placa de pedra aos poucos, o que leva tempo." O segundo caminho é o planejamento de cima para baixo, exemplificado pela cooperação profunda da MiniMax com o Instituto de Pesquisa Zhiyuan no ecossistema de software FlagOS, no qual empresas de modelos grandes e empresas de chips estabelecem uma cooperação profunda e avançam com planejamento. Li Yuxuan, chefe de AIInfra da MiniMax Intelligence, observou que inferência na verdade exige precisão mais alta do que treinamento, e a tecnologia de escalonamento de modelos proposta pela MiniMax se tornou uma grande conquista: alcançar o efeito de prever modelos grandes com modelos bem pequenos, fornecer avaliação aprofundada em chips domésticos, alinhar detalhes experimentais com fabricantes no exterior e confirmar que a precisão do treinamento é utilizável. A MiniMax divulgou que atingiu um treinamento ciente de quantização com largura de bits extremamente baixa na plataforma da Huawei, chegando a 95% da eficiência do treinamento comum. Li Dahai explicou que a perda de 5% vem do overhead do quantizador em si, e por meio de uma cooperação profunda com a Huawei, esse overhead foi otimizado para o mínimo.
A MiniMax Intelligence anunciou que a versão 1B da MiniCPM Small Cannon quinta geração alcançou uma pontuação de 17,9 na avaliação autorizada da ArtificialAnalysis (AA). Pesquisadores da comunidade de código aberto compararam e descobriram que o GPT-4o (parâmetros 200B), lançado em maio de 2024, marcou 18,3-18,6 no mesmo tipo de avaliação, com uma diferença de apenas 0,4-0,7 pontos entre os dois. Li Dahai afirmou: "Em 2024 previmos que, até o fim de 2026, o nível de inteligência de modelos de borda poderia chegar ao nível do GPT-4. Pelos dados atuais, esse objetivo foi alcançado antes do prazo."
Durante a anterior "MiniMax Open Source Week", a MiniMax Intelligence lançou dois modelos grandes de borda: MiniCPM5-1B e BitCPM-CANN. O MiniCPM5-1B renovou novamente o limite superior da densidade de inteligência do modelo: com apenas escala de parâmetros 1B, ele superou todos os modelos abaixo de 2B na internacionalmente conhecida liderança do AA-Index; em comparação com o Qwen3.5-2B, lançado 3 meses antes, o MiniCPM5-1B não só tem desempenho melhor como também reduziu os parâmetros pela metade.
O modelo MiniCPM5-1B foi pré-treinado pela framework de treinamento de IA desenvolvida independentemente pela MiniMax Intelligence, a ForgeTrain, que é a primeira framework de pré-treinamento de modelos grandes em produção do mundo totalmente escrita por IA, sem participação de programadores humanos. A velocidade de treinamento é 10% mais rápida do que a NVIDIA Megatron.
O que Li Dahai disse sobre as limitações da tecnologia de agentes na 2026 Beijing Zhiyuan Conference?
Li Dahai afirmou que as expectativas do público por agentes sem erros superam o que a curva atual de desenvolvimento técnico consegue entregar, e que a tecnologia ainda precisa de tempo para amadurecer. Ele descreveu as limitações atuais de agentes como "problemas em todo lugar", mas enfatizou que as taxas de erro estão caindo rapidamente — de 10% para 1% dentro de um mês em alguns casos.
Como o desempenho do MiniCPM-5 1B se compara ao GPT-4o no benchmark da ArtificialAnalysis?
O MiniCPM-5 1B (com 1B de parâmetros) marcou 17,9 na avaliação da ArtificialAnalysis, enquanto o GPT-4o (com 200B de parâmetros, lançado em maio de 2024) marcou 18,3-18,6 na mesma avaliação, resultando em uma diferença de apenas 0,4-0,7 pontos entre os dois modelos.
O que é ForgeTrain e como ela se compara à NVIDIA Megatron?
ForgeTrain é a framework de treinamento de IA desenvolvida independentemente pela MiniMax Intelligence, que é a primeira framework de pré-treinamento de modelos grandes em nível de produção do mundo totalmente escrita por IA, sem participação de programadores humanos. Ela treina 10% mais rápido do que a NVIDIA Megatron.
Notícias relacionadas
CEO da Microsoft: a “cidadela” de IA é um ciclo de aprendizado em loop; as empresas não podem terceirizar o aprendizado
O CEO da SpaceX afirma que a ideia de uma “fusão com a Tesla” é viável, integrando data centers de IA e negócios de chips
Cofundador da Animoca, Siu, diz que criatividade será a habilidade mais demandada na era da IA
ChatGPT Pro Entrega Valor em IA de US$ 14.000 em Teste de Assinatura do Semianalysis
Ripple, MetaMask e Mastercard constroem infraestrutura de pagamentos com agente de IA