Mensagem da Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória de agente que permite que agentes baseados em modelos de linguagem aprendam continuamente após a implantação. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas quanto de tarefas fracassadas, armazenando-as em um banco de memória para recuperação e execução em tarefas futuras similares. O artigo associado foi publicado no ICLR, e o código foi disponibilizado como open source no GitHub.

O ReasoningBank melhora em relação a duas abordagens existentes: Synapse, que registra trajetórias completas de ação, mas tem transferibilidade limitada devido à granularidade fina, e Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank faz duas mudanças importantes: armazenar "padrões de raciocínio" em vez de "sequências de ação", com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajetórias de falha ao aprendizado. O framework usa um modelo para se autoavaliar trajetórias de execução, transformando experiências de falha em regras anti-armadilhas. Por exemplo, a regra "clicar no botão Carregar Mais quando for visto" evolui para "verificar primeiro o identificador da página atual, evitar loops infinitos de rolagem e depois clicar em carregar mais."

O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca computação adicional durante a inferência para explorar múltiplas trajetórias e armazenar os achados no banco de memória. A expansão em paralelo executa múltiplas trajetórias distintas para a mesma tarefa, refinando estratégias mais robustas por meio de auto comparação; a expansão sequencial refina iterativamente uma única trajetória, armazenando o raciocínio intermediário na memória.

Em tarefas de navegador do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou 8,3% a mais na taxa de sucesso no WebArena e 4,6% a mais no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de etapas por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu as etapas em mais 0,4.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-22 07:51

AWS Expands Multi-Agent AI Workflows, Supports Claude Opus 4.7 on Bedrock

04-22 06:41

0G Labs faz parceria com a Alibaba Cloud para habilitar acesso a agentes de IA on-chain ao modelo Qwen

04-22 02:41

Google consolida ferramentas de codificação com IA sob a plataforma Antigravity

04-22 01:21

OpenAI amplia parcerias com Accenture e TCS para implantar o Codex para clientes corporativos

04-22 01:11

Moonshot AI Lança Modelo Open-Source Kimi K2.6 com Fluxos de Trabalho Avançados de Agentes

Análise aprofundada