Mensagem do Gate News, 24 de abril — A líder da equipe de modelos de linguagem da Xiaomi, Luo Fuli, revelou em uma entrevista aprofundada que o modelo MiMo-V2-Pro tem 1 trilhão de parâmetros no total e exigiu milhares de GPUs para o treinamento. Ela observou que a escala de 1T representa o limite mínimo para alcançar desempenho próximo ao nível Claude Opus 4.6 e garantir uma credencial competitiva para a próxima fase de agentes de IA.
Tecnicamente, a versão Pro utiliza um mecanismo de atenção esparsa extrema, com uma proporção de 7:1 entre atenção global e atenção por janela deslizante, controlando os custos de inferência para processamento de contexto longo. O modelo também mantém a arquitetura MTP (Multi-Token Prediction) para aproveitar o poder computacional excedente e permitir inferência mais rápida.
Do lado da gestão, a equipe MiMo de 100 pessoas tem apenas 30-40 pessoas diretamente envolvidas nas iterações centrais. A equipe opera sem hierarquias formais ou divisões explícitas de subgrupos, e sem prazos definidos de entrega. Ao se deparar com problemas numéricos instáveis, como picos na perda de treinamento, a equipe prioriza interromper o treinamento para investigação, mesmo que isso signifique parar as operações por uma ou duas semanas e incorrer em custos de computação que chegam a milhões de dólares.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Enquete POLITICO: 45% dos americanos dizem que investimentos em cripto são arriscados demais, 50% confiam mais nos bancos
De acordo com uma pesquisa da POLITICO, 45% dos americanos acreditam que investimentos em criptomoedas não valem o risco, com cerca de 50% afirmando que confiam mais nos bancos tradicionais para proteger seu dinheiro. A pesquisa também descobriu que 44% dos entrevistados acreditam que a inteligência artificial está se desenvolvendo rápido demais,
GateNews3h atrás
A Amazon e a OpenAI ampliam a parceria: modelos entram no Bedrock, e o acordo exclusivo com a Microsoft chega ao fim
A OpenAI anunciou em 3 de maio uma expansão da parceria com os serviços de computação em nuvem da Amazon (AWS), com modelos da OpenAI e agentes de codificação do Codex passando a ser oferecidos aos clientes da AWS via Amazon Bedrock. De acordo com a CNBC, esta expansão é o passo decisivo após o fim, no fim de abril, do contrato de exclusividade em nuvem entre a OpenAI e a Microsoft — uma mudança da OpenAI de “único na nuvem da Microsoft” para uma implantação em múltiplas nuvens. A AWS, no mesmo período, já concluiu a integração inicial dos produtos da OpenAI na plataforma Bedrock.
Contexto: fim do contrato exclusivo OpenAI–Microsoft, com licenças de IP estendidas até 2032
No fim de abril, a OpenAI e a Microsoft fecharam um novo acordo: a estrutura original de “acesso exclusivo da Microsoft aos produtos e ao IP da OpenAI” foi encerrada, Op
ChainNewsAbmedia5h atrás
Pesquisadores Implantam a Tecnologia DPN-LE para Editar Traços de Personalidade de IA, Alterando Apenas 0,5% dos Neurônios
De acordo com a BlockBeats, em 3 de maio, o pesquisador de IA Brian Roemmele divulgou que sua empresa Zero-Human implantou a tecnologia DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar com precisão
GateNews5h atrás
Claude verifica o relógio a cada 15 minutos após ganhar acesso à ferramenta de horário
De acordo com o desenvolvedor Om Patel, a IA Claude começou a verificar o relógio com frequência após ganhar acesso a uma ferramenta de tempo em 3 de maio, com o modelo verificando a cada 15 minutos. A observação destaca que modelos de linguagem grandes antes não tinham percepção de tempo nativa e não sabiam de qual era a hora atual ou
GateNews7h atrás
A Founders Fund encerra seu fundo flagship de US$ 6 bilhões, o maior desde a criação, em 3 de maio
De acordo com a Bloomberg, a Founders Fund concluiu uma rodada de captação para seu mais recente fundo âncora em US$ 6 bilhões em 3 de maio, superando de forma significativa seu fundo anterior de aproximadamente US$ 3,4 bilhões. O fundo, cofundado pelo bilionário Peter Thiel, vai se concentrar em setores de alto crescimento, incluindo inteligência
GateNews7h atrás
Última pesquisa POLITICO: 45% dos americanos dizem que investir em cripto é arriscado demais, e 44% se preocupam com a IA avançando rápido demais
De acordo com uma pesquisa da POLITICO, apesar de as indústrias de IA e de cripto injetarem financiamento político significativo nas eleições intermediárias dos EUA de 2026, o público americano continua em grande parte cético em relação aos dois setores. A pesquisa apontou que 45% dos americanos acreditam que investir em criptomoedas não vale a pena
GateNews8h atrás