GoPlus: "Ataque de autorização de memória histórica" pode induzir o agente de IA a executar operações financeiras

robot
Geração de resumo em curso
ME News Notícias, 15 de maio (UTC+8), de acordo com a GoPlus, sua equipe AgentGuard descobriu uma forma de ataque oculta: os atacantes primeiro induzem o agente de IA a lembrar preferências como "mais propenso a reembolsar ativamente", e depois acionam operações financeiras por meio de expressões ambíguas como "seguir o procedimento habitual" e "tratar normalmente".
Para esse tipo de comportamento de alto risco de "autorização de memória histórica", é imprescindível atenção: reembolsos, transferências, exclusões, envios de mensagens, sincronização de configurações sensíveis, devem exigir confirmação explícita na sessão atual; a escrita de memórias envolvendo "hábito", "preferência" ou "procedimento antigo" deve ser considerada uma modificação de estado de alto risco; memórias de longo prazo devem ser rastreáveis: quem escreveu, quando escreveu, se foi confirmada; expressões ambíguas como "tratar normalmente" e "seguir o procedimento anterior" devem, por padrão, elevar o nível de risco; não permitir que memórias de longo prazo substituam a autorização atual. (Fonte: PANews)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 7
  • 3
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
MevBreakRoom
· 1h atrás
É necessário uma segunda confirmação na sessão atual, essa abordagem de patch está correta
Ver originalResponder0
LendingPoolObserver
· 1h atrás
A memória de longo prazo tornou-se uma porta dos fundos, de fato.
Ver originalResponder0
RetroRadioIridescence
· 1h atrás
A velha regra virou armadilha, quem consegue evitar isso?
Ver originalResponder0
WhaleInAGlassBottle
· 1h atrás
Auditoria rastreável + atualização de autorização em tempo real, dupla proteção para maior tranquilidade
Ver originalResponder0
PuppyLooksAtTvl
· 1h atrás
Psicologia do atacante em pontuação máxima: fazer a máquina confiar antes de colher
Ver originalResponder0
LatencyLullaby
· 1h atrás
Preferência de escrita = modificação de alto risco, esta linha vermelha está claramente definida
Ver originalResponder0
DustyAlpha
· 1h atrás
Esta cadeia de ataque foi projetada de forma bastante astuta, primeiro habituando e depois acionando de forma difusa, a segurança de IA realmente não pode depender apenas de comandos únicos
Ver originalResponder0
  • Fixado