A Google DeepMind lançou o co-matemático de IA, um assistente de investigação matemática multi-agente, alcançando 47,9% de precisão no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% a 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que todos os modelos anteriores falharam em resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador de projeto que distribui tarefas por sub-agentes encarregues de pesquisa de literatura, codificação e raciocínio, com vários agentes avaliadores a validar as provas antes da submissão.
A Epoch AI realizou testes cegos, impedindo a equipa da DeepMind de ver os problemas, com cada questão permitida até 48 horas de computação. Numa aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando o seu valor prático para investigação. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Ações da Cloudflare despencam 23,62% a 8 de maio após resultados do 1.º trimestre e anúncio de despedimento de 1.100 pessoas
As ações da Cloudflare caíram 23,62% em 8 de maio, para 196,13 dólares por ação, na sequência da divulgação dos resultados do primeiro trimestre da empresa e do anúncio de aproximadamente 1.100 despedimentos. Embora a receita do 1.º trimestre de 640 milhões de dólares tenha superado as expectativas, com um crescimento de 34% face ao ano anterior, a orientação de receita para o 2.º trimestre de 664–665 milhões de dólares ficou aquém da expectativa anterior do mercado, de 666 milhões de dólares. O
GateNews22m atrás
A Helsing pretende angariar financiamento numa avaliação de 18 mil milhões de dólares
De acordo com o Financial Times, a Helsing, uma startup alemã de drones alimentados por IA, está a planear angariar novo financiamento numa avaliação de cerca de 18 mil milhões de dólares.
GateNews59m atrás
O sistema de recompensas da OpenAI pontua inadvertidamente cadeias de pensamento em 6 modelos, incluindo GPT-5.4
De acordo com a equipa de alinhamento da OpenAI, a empresa descobriu recentemente um erro crítico de treino que afectava 6 grandes modelos de linguagem, incluindo o GPT-5.4. Pensamento: o mecanismo de recompensa avaliou inadvertidamente cadeias de pensamento do modelo — o processo interno de raciocínio antes de gerar respostas. O GPT-5.5 não foi afectado. O incidente viola um princípio fundamental de segurança em IA de que as cadeias de pensamento nunca devem ser avaliadas, pois fazê-lo poderia
GateNews2h atrás
A Alibaba não realizou negociações com a DeepSeek, esclarecem fontes do mercado a 9 de maio
De acordo com fontes do mercado citadas pelo Caixin Daily a 9 de Maio, a Alibaba não realizou negociações com a DeepSeek relativamente a financiamento. Este esclarecimento surge na sequência de anteriores notícias que sugeriam que as conversações entre as duas empresas teriam falhado. A DeepSeek lançou em Abril uma importante ronda de captação de fundos, que despertou interesse tanto da Tencent como da Alibaba.
GateNews2h atrás
A OpenAI lança uma ferramenta de migração do Codex para importar configurações de assistentes de IA concorrentes
De acordo com OneMillionAI (Beating), a OpenAI lançou uma ferramenta de migração no Codex que permite aos utilizadores importar configurações e dados de outros assistentes de programação de IA, incluindo o Claude Code. A ferramenta, anunciada através da conta oficial de Twitter da OpenAI, transfere automaticamente prompts do sistema, skills personalizadas, o histórico de chat de 30 dias, configurações de servidores MCP, hooks e definições de sub-agentes. A OpenAI referiu que a ferramenta de migr
GateNews3h atrás
A ByteDance aumenta a sua despesa com infraestruturas de IA em 25% para 200 mil milhões de yuan em 9 de maio
De acordo com notícias da comunicação social, a ByteDance aumentou a sua prevista despesa em infraestruturas de IA em 25% para 200 mil milhões de iuanes em 2026, à medida que a empresa acelera a implementação de inteligência artificial num contexto de aumento dos chips de memória
GateNews4h atrás