A Artificial Analysis lançou hoje um novo Coding Agent Index para avaliar o desempenho dos modelos de IA quando combinados com frameworks de agentes em benchmarks-chave, incluindo SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 e SWE-Atlas-QnA. A Zhipu GLM-5.1 ficou em primeiro lugar entre os modelos open-source na avaliação, demonstrando um desempenho de ponta em cenários reais de agentes de programação.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A SAP investe na n8n, duplicando a avaliação da plataforma de automatização de fluxos de trabalho para 5,2 mil milhões de dólares
Segundo a Bloomberg, a SAP investiu na n8n na terça-feira, duplicando a avaliação da plataforma de automação de fluxos de trabalho para 5,2 mil milhões de dólares. O gigante alemão do software também assinou um acordo de parceria plurianual com a n8n para integrar as ferramentas da plataforma na plataforma de agentes de IA Joule Studio da SAP, de acordo com a declaração da SAP.
GateNews18m atrás
DAPPOS Lança xBubble, um Agente Universal de IA com 10+ Funcionalidades Principais para Utilizadores Não Técnicos
Segundo o ChainCatcher, a DAPPOS lançou oficialmente o xBubble, um produto universal de agentes de IA concebido para utilizadores não técnicos. O produto recomenda automaticamente agentes especializados para concluir tarefas com prompts mínimos e menos iterações de depuração. O xBubble disponibiliza 10+ capacidades centrais que abrangem a criação de imagens, vídeos, documentos e websites, apoiando tanto a implementação local como na nuvem.
GateNews5h atrás
A Nous Research lança o agente Hermes para controlo do computador em macOS, reduzindo o consumo de tokens em 95%
A Nous Research anunciou que o seu Hermes Agent lançou funcionalidades de controlo de computadores macOS, segundo monitorização da Beating. A funcionalidade permite operações em segundo plano, como pesquisas de e-mails e escrita de código, sem interferir com a entrada do utilizador ou com o foco da janela. Através de um mecanismo de compressão de contexto em quatro camadas, a estrutura reduz o consumo de tokens de aproximadamente 600.000 para 30.000 tokens ao executar 20 operações consecutivas n
GateNews7h atrás
SNS e PoH Network permitem verificação de IA na Solana
A SNS alargou a utilidade dos seus domínios .sol através de uma nova integração com a PoH Network, introduzindo funcionalidades reforçadas de verificação de identidade on-chain no ecossistema Solana, segundo um anúncio datado de 11 de maio de 2026. A colaboração foi concebida para ajudar a diferenciar utilizadores humanos de entidades de inteligência artificial na cadeia, ao mesmo tempo que melhora a usabilidade e o valor contextual das identidades baseadas em blockchain. A integração foi desenv
CryptoFrontier7h atrás
MoonPay adquire a Dawn Labs e lança uma ferramenta de agente de IA para trading em mercados de previsão
De acordo com a The Block, a MoonPay adquiriu a Dawn Labs e está a lançar a Dawn CLI, uma ferramenta com IA concebida para ajudar utilizadores não técnicos a criar estratégias de negociação em mercados de previsão. Os utilizadores podem descrever estratégias de negociação em inglês simples, com o sistema a automatizar pesquisa, geração de código, simulação e execução em tempo real. A actividade de negociação em mercados de previsão em plataformas como Polymarket e Kalshi disparou nos últimos ano
GateNews11h atrás
A Circle Lança a Agent Stack a 12 de Maio, Habilitando Agentes de IA a Usar USDC de Forma Autonóma
De acordo com a Decrypt, a Circle lançou o Agent Stack a 12 de maio, um kit de ferramentas que permite que agentes de IA mantenham fundos de forma independente, paguem comissões e transaccionem com USDC sem intervenção humana. A solução inclui uma carteira de agentes, uma interface de linha de comandos, um marketplace de agentes e um protocolo de pagamentos nano que suporta transferências tão pequenas como $0.000001 sem comissões de gas. O cofundador da Circle, Jeremy Allaire, afirmou que o Agen
GateNews12h atrás