Mensagem da Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória de agente que permite que agentes baseados em modelos de linguagem aprendam continuamente após a implantação. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas quanto de tarefas fracassadas, armazenando-as em um banco de memória para recuperação e execução em tarefas futuras similares. O artigo associado foi publicado no ICLR, e o código foi disponibilizado como open source no GitHub.
O ReasoningBank melhora em relação a duas abordagens existentes: Synapse, que registra trajetórias completas de ação, mas tem transferibilidade limitada devido à granularidade fina, e Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank faz duas mudanças importantes: armazenar “padrões de raciocínio” em vez de “sequências de ação”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajetórias de falha ao aprendizado. O framework usa um modelo para se autoavaliar trajetórias de execução, transformando experiências de falha em regras anti-armadilhas. Por exemplo, a regra “clicar no botão Carregar Mais quando for visto” evolui para “verificar primeiro o identificador da página atual, evitar loops infinitos de rolagem e depois clicar em carregar mais.”
O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca computação adicional durante a inferência para explorar múltiplas trajetórias e armazenar os achados no banco de memória. A expansão em paralelo executa múltiplas trajetórias distintas para a mesma tarefa, refinando estratégias mais robustas por meio de auto comparação; a expansão sequencial refina iterativamente uma única trajetória, armazenando o raciocínio intermediário na memória.
Em tarefas de navegador do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou 8,3% a mais na taxa de sucesso no WebArena e 4,6% a mais no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de etapas por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu as etapas em mais 0,4.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Sonhos do Claude, da Anthropic: agente se organiza para recuperar memórias entre tarefas, eliminando duplicidades e contradições
A Anthropic anunciou o Dreams no evento Code with Claude, permitindo que os Claude Managed Agents organizem automaticamente memórias entre várias conversas, eliminem duplicidades e contradições, atualizem itens desatualizados e gerem um banco de memórias pós-processado e auditável; o limite de entrada é de 100 sessions e 4.096 caracteres, com execução assíncrona, concluída em minutos a dezenas de minutos, e suporte à observação via streaming. A prévia da pesquisa precisa ser solicitada; por enquanto, apenas o claude-opus-4-7 e o claude-sonnet-4-6 são suportados, e o lançamento oficial ainda não tem data.
ChainNewsAbmedia44m atrás
A Cloudflare colabora com a Stripe para desenvolver agentes com negociação autônoma: a IA pode criar contas, comprar domínios e implantar aplicativos
A Cloudflare e a Stripe lançaram em 30 de abril um novo protocolo em conjunto, permitindo que agentes de IA criem, de forma autônoma e sem intervenção humana, uma conta na Cloudflare, assinem planos pagos, registrem domínios, obtenham um token de API e implantem diretamente aplicações. O blog oficial da Cloudflare explica que todo o processo, do começo ao fim, não requer que humanos acessem o painel, façam copiar e colar de tokens ou insiram dados do cartão de crédito; os usuários só precisam conceder permissões iniciais e aceitar os termos de uso da Cloudflare. Esta semana, a notícia deste anúncio recebeu 548 pontos no Hacker News, tornando-se uma das matérias-base mais emblemáticas sobre infraestrutura para que agentes de IA executem tarefas de maneira independente.
Estrutura em três camadas do protocolo: descoberta de serviços, autorização de identidade e pagamento por meio de tokenização
Cloudflare-Stripe
ChainNewsAbmedia45m atrás
Engenheiro da Coinbase: agentes de IA podem interromper o modelo de publicidade na web
Erik Reppel, engenheiro da Coinbase, disse que agentes de inteligência artificial poderiam minar fundamentalmente o modelo de negócios da internet, que depende de publicidade. De acordo com Reppel, a economia da web depende fortemente da receita publicitária gerada a partir de usuários humanos, mas agentes de IA contornam esse sistema
CryptoFrontier1h atrás
Prophet lança mercado de previsão com IA e tranche de negociação ao vivo no valor de US$ 10.000 hoje
De acordo com a MetaversePost, a Prophet lançou hoje (6 de maio) um mercado de previsão com IA, com US$ 10.000 em USDC destinados a negociações ao vivo. Os usuários podem negociar diretamente contra uma contraparte de IA que gera preços baseados em probabilidade para cada mercado, com alguns contratos sendo liquidados em até 24
GateNews8h atrás
Tessera Labs encerra a Série A liderada pela a16z; equipe de IA com 6 pessoas substitui 60 consultores da SAP
Conforme Beating, a Tessera Labs, empresa de integração de sistemas de IA, concluiu uma rodada de financiamento Série A liderada pela a16z. A startup, fundada em 2024, usa uma plataforma multiagente para automatizar migrações de SAP ECC para S/4HANA, que tradicionalmente exigiam de 3 a 5 anos e de US$ 100 milhões a US$ 500 milhões por
GateNews8h atrás
Taiwan Index se mantém acima de 40.000 pontos, as bolsas dos EUA batem novas máximas, mas a indústria de IA ainda está apenas no estágio inicial?
Goldman Sachs aponta que a demanda por IA aumentará significativamente o consumo de tokens devido a cargas de trabalho de agentes voltados ao consumo; em 2030, o crescimento pode superar 12 vezes, e o cálculo mensal de tokens pode chegar a 60 trilhões. A diferença entre não agente e consumer agent está na automação de tarefas por longos períodos; se isso se concretizar, a IA entrará em fluxos de trabalho agentic. Larry Fink afirma que a oferta de poder computacional está gravemente escassa e que, no futuro, pode surgir a negociação futura de computação; os dois, juntos, sustentam uma tese de alta para a infraestrutura de IA. O artigo considera que a IA ainda está em uma fase inicial.
ChainNewsAbmedia9h atrás