A Artificial Analysis lançou hoje um novo Coding Agent Index para avaliar como modelos de IA se saem quando combinados com frameworks de agentes em benchmarks importantes, incluindo SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 e SWE-Atlas-QnA. O Zhipu GLM-5.1 ficou em primeiro lugar entre os modelos de código aberto na avaliação, demonstrando desempenho líder em cenários reais de agentes de codificação.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A SAP investe na n8n, dobrando a avaliação da plataforma de automação de fluxos de trabalho para US$ 5,2 bilhões
De acordo com a Bloomberg, a SAP investiu em n8n na terça-feira, dobrando a avaliação da plataforma de automação de fluxos de trabalho para US$ 5,2 bilhões. A gigante alemã de software também assinou um acordo de parceria de vários anos com a n8n para integrar as ferramentas da plataforma ao mecanismo de construção de agentes de IA da SAP, o Joule Studio, conforme declaração da SAP.
GateNews28m atrás
DAPPOS lança xBubble, um agente de IA universal com 10+ recursos essenciais para usuários não técnicos
De acordo com a ChainCatcher, a DAPPOS lançou oficialmente o xBubble, um produto universal de agentes de IA, projetado para usuários não técnicos. O produto recomenda automaticamente agentes especializados para concluir tarefas com prompts mínimos e menos iterações de depuração. O xBubble oferece 10+ capacidades principais, cobrindo criação de imagens, vídeos, documentos e sites, com suporte tanto para implantação local quanto em nuvem.
GateNews5h atrás
A Nous Research Lança o Agente Hermes para Controle de Computadores no macOS, Reduzindo o Consumo de Tokens em 95%
A Nous Research anunciou que seu Hermes Agent lançou a funcionalidade de controle de computadores com macOS, de acordo com o monitoramento da Beating. O recurso permite operações em segundo plano, como buscas de e-mail e escrita de código, sem interferir na entrada do usuário ou no foco da janela. Por meio de um mecanismo de compressão de contexto em quatro camadas, a estrutura reduz o consumo de tokens de aproximadamente 600.000 para 30.000 tokens ao executar 20 operações consecutivas na resolu
GateNews7h atrás
SNS e PoH Network permitem verificação de IA na Solana
A SNS expandiu a utilidade de seus domínios .sol com uma nova integração com a PoH Network, introduzindo recursos aprimorados de verificação de identidade on-chain dentro do ecossistema Solana, conforme um anúncio datado de 11 de maio de 2026. A colaboração foi criada para ajudar a diferenciar usuários humanos de entidades de inteligência artificial na cadeia enquanto melhora a usabilidade e o valor contextual de identidades baseadas em blockchain. A integração foi desenvolvida durante o Colosse
CryptoFrontier7h atrás
MoonPay Adquire Dawn Labs e Lança Ferramenta de Agente de IA para Negociação em Mercados de Predição
De acordo com The Block, a MoonPay adquiriu a Dawn Labs e está lançando a Dawn CLI, uma ferramenta de IA que ajuda usuários não técnicos a criar estratégias de negociação em mercados de previsão. Os usuários podem descrever estratégias em inglês simples, enquanto o sistema automatiza pesquisa, geração de código, simulação e execução em tempo real. A atividade de negociação em mercados de previsão em plataformas como Polymarket e Kalshi disparou nos últimos anos, com os volumes vitalícios combina
GateNews12h atrás
Circle Lança a Agent Stack em 12 de maio, permitindo que agentes de IA usem o USDC de forma autônoma
Segundo a Decrypt, a Circle lançou o Agent Stack em 12 de maio, um kit que permite que agentes de IA mantenham fundos de forma independente, paguem taxas e realizem transações com USDC sem intervenção humana. A suíte inclui uma carteira de agente, uma interface de linha de comando, um marketplace de agentes e um protocolo de nano-pagamentos que oferece transferências tão pequenas quanto US$ 0,000001 sem taxas de gas. O cofundador da Circle, Jeremy Allaire, afirmou que o Agent Stack é a primeira
GateNews12h atrás