A Google Research lança o ReasoningBank: agentes de IA aprendem estratégias de raciocínio com sucesso e falha

Mensagem do Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória do agente que permite que agentes orientados por grandes modelos de linguagem aprendam continuamente após o deploy. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas como falhadas em tarefas, guardando-as num banco de memória para recuperação e execução em tarefas futuras semelhantes. O artigo associado foi publicado na ICLR, e o código foi disponibilizado em open-source no GitHub.

O ReasoningBank melhora duas abordagens existentes: a Synapse, que regista trajectórias completas de acções, mas tem capacidade de transferência limitada devido à granularidade fina, e a Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank introduz duas alterações-chave: armazenar “padrões de raciocínio” em vez de “sequências de acções”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajectórias de falha na aprendizagem. O framework usa um modelo para autoavaliar trajectórias de execução, transformando experiências de falha em regras anti-erro. Por exemplo, a regra “clicar no botão Carregar mais quando o vir” evolui para “verificar primeiro o identificador da página actual, evitar ciclos de scroll infinito e, em seguida, clicar em carregar mais.”

O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca compute adicional durante a inferência para explorar múltiplas trajectórias e guardar os resultados no banco de memória. A expansão em paralelo executa múltiplas trajectórias distintas para a mesma tarefa, refinando estratégias mais robustas através de auto-comparação; a expansão sequencial refina iterativamente uma única trajectória, guardando raciocínio intermédio em memória.

Em tarefas de browser do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou uma taxa de sucesso 8,3% superior no WebArena e 4,6% superior no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de passos por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu os passos em mais 0,4.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Sonhos com o Claude da Anthropic: os agentes auto-organizam memórias entre tarefas, eliminam duplicados e contradições

A Anthropic, na conferência Code with Claude, anunciou os Dreams, permitindo que os Claude Managed Agents organizem automaticamente memórias entre múltiplas sessões de conversa, eliminem duplicados e contradições, e atualizem entradas desatualizadas, produzindo uma base de memórias finalizável e auditável; o limite de entrada é de 100 sessões e 4.096 caracteres, com execução assíncrona, concluída entre alguns minutos e algumas dezenas de minutos, e com suporte para observação por streaming. A pré-visualização da investigação requer candidatura; por agora, apenas suporta claude-opus-4-7 e claude-sonnet-4-6, com data de lançamento oficial ainda por definir.

ChainNewsAbmedia1h atrás

A Cloudflare em parceria com a Stripe lança agentes de negociação autónoma: a IA pode criar contas, comprar domínios e implementar aplicações

A Cloudflare e a Stripe lançaram em 30 de abril um novo protocolo em conjunto, permitindo que os AI Agent criem, por si próprios e sem intervenção humana, uma conta na Cloudflare, subscrevam planos pagos, registem domínios, obtenham tokens de API e façam a implementação direta de aplicações. O blogue oficial da Cloudflare explica que todo o processo, do início ao fim, não requer acesso humano ao painel, cópia e colagem de tokens, nem a introdução de dados do cartão de crédito; o utilizador só precisa de conceder permissões previamente e de aceitar os termos de utilização da Cloudflare. Nesta semana, esta notícia do anúncio obteve 548 pontos no Hacker News e tornou-se uma das mais marcantes notícias de infraestrutura que viabilizam a execução autónoma de tarefas por AI Agent. Três camadas de arquitetura de acordos: descoberta de serviços, autorização de identidade e monetização por tokens de pagamento Cloudflare-Stripe

ChainNewsAbmedia1h atrás

Engenheiro da Coinbase: os agentes de IA poderiam perturbar o modelo de publicidade na Web

Erik Reppel, engenheiro da Coinbase, afirmou que os agentes de inteligência artificial poderiam minar fundamentalmente o modelo de negócio da internet, dependente da publicidade. Segundo Reppel, a economia da Web depende fortemente das receitas de publicidade geradas a partir de utilizadores humanos, mas os agentes de IA contornam esse sistema

CryptoFrontier2h atrás

O Prophet lança um mercado de previsões com IA, com uma tranche de negociação em direto de $10.000 hoje

De acordo com a MetaversePost, a Prophet lançou hoje (6 de maio) um mercado de previsão baseado em IA, com 10 000 dólares em USDC alocados para negociação em direto. Os utilizadores podem negociar diretamente contra uma contraparte de IA que gera preços baseados em probabilidades para cada mercado, com alguns contratos a liquidar dentro de 24

GateNews9h atrás

A Tessera Labs encerra a Série A liderada pela a16z; equipa de IA com seis pessoas substitui 60 consultores da SAP

De acordo com Beating, a Tessera Labs, uma empresa de integração de sistemas de IA, concluiu uma ronda de financiamento Série A liderada pela a16z. A startup, fundada em 2024, utiliza uma plataforma multi-agente para automatizar migrações de SAP ECC para S/4HANA, tradicionalmente exigindo 3-5 anos e 100 milhões de dólares a 500 milhões de dólares por

GateNews9h atrás

O Taiwan Index está firme nos 40.000 pontos, as bolsas dos EUA atingem máximas históricas, mas a indústria de IA ainda está apenas numa fase inicial?

Goldman Sachs indicou que a procura de IA deverá aumentar significativamente o consumo de tokens devido a cargas de trabalho de agentes focados no consumo, com crescimento em 2030 que poderá exceder 12 vezes, podendo chegar a 60 biliões de tokens por mês; a diferença entre não-agents e consumer agents está na automatização de tarefas ao longo de longos períodos; se isso se concretizar, a IA entrará em fluxos de trabalho agentic. Larry Fink afirmou que a oferta de capacidade de computação está gravemente em falta, podendo surgir no futuro contratos de futuros sobre capacidade de computação, e que ambos sustentam a tese de mercado em alta para a construção de infraestruturas de IA; o artigo considera que a IA ainda está numa fase inicial.

ChainNewsAbmedia10h atrás
Comentar
0/400
Nenhum comentário