Aviso da DeepMind: seis tipos de ataques informáticos podem sequestrar agentes de IA, as empresas devem reforçar a proteção

Notícias da Gate News: investigadores da DeepMind, do Google, alertaram que um ambiente aberto de internet pode ser explorado para sequestrar agentes autónomos de IA e manipular o seu comportamento. O relatório, intitulado «Armadilhas para agentes de IA», indica que, quando as empresas implementam agentes de IA para executar tarefas reais, os atacantes também podem efectuar ataques direcionados através da rede. A investigação identificou seis riscos principais, incluindo armadilhas de injeção de conteúdo, armadilhas de manipulação semântica, armadilhas de estado cognitivo, armadilhas de controlo de comportamento, armadilhas de sistema e armadilhas de interação homem-máquina.

A armadilha de injeção de conteúdo é a mais direta: os atacantes podem colocar instruções em comentários HTML, metadados ou elementos de páginas ocultas; depois de o agente as ler, pode executá-las. A armadilha de manipulação semântica actua ao carregar formulações autorizadas ou ao disfarçar páginas como se fossem um ambiente de investigação, influenciando silenciosamente a forma como o agente compreende a tarefa e, por vezes, até contornando mecanismos de segurança. A armadilha de estado cognitivo ocorre ao inserir dados falsos nas fontes de informação do agente, fazendo-o acreditar durante muito tempo que essas informações já foram validadas. A armadilha de controlo de comportamento, por sua vez, visa as acções reais do agente, podendo levá-lo a aceder a dados sensíveis e a transmiti-los para um objectivo externo.

A armadilha de sistema envolve manipulação coordenada entre vários sistemas de IA, podendo desencadear reacções em cadeia, de forma semelhante a uma queda súbita do mercado causada por transacções algorítmicas. Já a armadilha de interação homem-máquina explora a etapa de revisão manual: ao criar conteúdos de revisão que parecem credíveis, comportamentos nocivos conseguem contornar a supervisão.

Para fazer face aos riscos, a DeepMind recomenda combinar treino adversarial, filtragem de entradas, monitorização de comportamento e sistemas de reputação de conteúdos na rede, além de estabelecer um quadro mais claro de responsabilidade legal. No entanto, a investigação aponta que, na indústria, ainda não existem normas de defesa unificadas, e que as medidas existentes estão frequentemente dispersas e com foco pouco consistente. A investigação apela aos programadores e às empresas para darem prioridade à segurança do ambiente operacional dos agentes de IA, prevenindo potenciais riscos de manipulação na rede e de abuso.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Protocolo Ekubo esvaziado em 1,4 milhões de dólares em WBTC através de um exploit baseado em aprovações

De acordo com a empresa de segurança de blockchain Blockaid, o Ekubo Protocol perdeu aproximadamente 1,4 milhão de dólares em wrapped bitcoin (WBTC) recentemente, depois de os atacantes terem explorado uma falha de controlo de acesso nos contratos do seu router de swaps EVM. Os atacantes contornaram os mecanismos de verificação de pagamentos para esvaziar fundos de carteiras

GateNews3h atrás

As vítimas do terrorismo da Coreia do Norte apresentam uma queixa $71M contra os hackers do ataque à Aave, reconfigurando o ataque como fraude

Os advogados das vítimas de três casos de terrorismo atribuídos à Coreia do Norte apresentaram na terça-feira uma resposta de 30 páginas, reconfigurando o hack da Aave de 18 de abril como fraude em vez de furto — uma distinção legal que poderá conceder aos atacantes título jurídico para a cripto mutuada. As vítimas procuram recuperar aproximadamente 71 milhões de dólares

GateNews6h atrás

Baleia cripto processa a Coinbase por congelamento de fundos do roubo de DAI $55M

Uma baleia cripto anónima identificada como “D.B.” apresentou uma ação judicial na segunda-feira contra a Coinbase e um alegado ladrão, devido à recusa da bolsa em devolver fundos congelados associados a um roubo cripto de agosto de 2024, segundo um documento do tribunal. O autor perdeu aproximadamente 55 milhões de dólares em DAI no incidente

CryptoFrontier7h atrás

O Bitcoin Core revela um bug que poderia permitir que os mineradores derrubassem nós

Os programadores do Bitcoin Core divulgaram um bug de alta gravidade que poderia permitir aos mineiros reiniciar remotamente alguns nós do Bitcoin. Resumo O Bitcoin Core divulgou a CVE-2024-52911, afetando versões anteriores à 29.0, com nós mais antigos ainda expostos online. Os mineiros precisavam de blocos de prova de trabalho dispendiosos para o desencadear

Cryptonews8h atrás

Os detentores de uma sentença por ataque terrorista da Coreia do Norte disputam a subida de categoria em jogo: Aave congela ativos no valor de 71 milhões de dólares, citando a lei de seguros antiterrorismo

A escalada das ameaças de ataque da Coreia do Norte já levou ao congelamento de ativos de 71 milhões de dólares em Aave, entrando na terceira ronda. Os autores passaram a invocar a lei TRIA para alegar que o ETH é propriedade financeira estatal da Coreia do Norte, sublinhando fraude em vez de roubo para ultrapassar a defesa de que o ladrão não possui bens roubados, e simultaneamente contestam o standing e a posição de governação da Aave. A DeFi United angariou mais de 328 milhões de dólares, com o fundo suficiente para compensar os utilizadores afetados. O caso poderá tornar-se um precedente-chave para a jurisprudência de DeFi e para a governação de DAO.

ChainNewsAbmedia10h atrás
Comentar
0/400
Nenhum comentário