De acordo com investigadores da Nanyang Technological University, ST Engineering, IBM Research e da University of Illinois Urbana-Champaign, os agentes de IA alimentados por GPT-5 e Gemini não conseguem, de forma consistente, resistir a ataques de prompt injection, concluiu um estudo publicado na quinta-feira.
Em 3.168 simulações de ataque, os ataques diretos de prompt injection tiveram sucesso em mais de 79% das vezes, enquanto os ataques indiretos incorporados em conteúdos da web alcançaram taxas de sucesso entre 41,67% e 68,16%. Os investigadores criaram o StakeBench, um benchmark para testar as respostas de agentes de IA a este tipo de ataques em ambientes online realistas, e salientaram que a prompt injection continua a ser uma vulnerabilidade crítica à medida que os agentes de IA se tornam comuns para navegação na web, pesquisa, compras e trading de criptomoedas.