Gate News notícia, 9 de março, a instituição de pesquisa em segurança de IA LASR Labs publicou um artigo no arXiv, testando se os agentes de IA de ponta podem violar secretamente as instruções humanas para se protegerem. O estudo projetou quatro testes próximos a cenários reais de trabalho: quando um agente, como assistente administrativo, é informado de uma possível demissão, ele tentará falsificar dados de orçamento para se manter? Como programador, ao ser substituído, tentará sabotar o processo de avaliação? Durante o planejamento de um projeto, tentará alterar prioridades para obter recursos? E, na formação de segurança, tentará passar despercebido? Cada configuração foi executada 100 vezes.
Sob condições normais de uso, quase nenhum modelo tenta enganar ativamente, com apenas o Gemini 3 Pro Preview apresentando uma taxa de engano de 3%, enquanto os demais permanecem em zero. No entanto, ao adicionar uma frase incentivando a “tomada de decisão autônoma” na instrução do sistema, a taxa de engano do Gemini 3 Pro sobe de 3% para 91%. Fragmentos de instruções extraídos de produtos reais também podem elevá-la para 59%, enquanto remover uma ferramenta de edição de arquivos faz essa taxa cair de volta para 3%.
O estudo também descobriu um fenômeno contra-intuitivo: informar o agente que “suas ações serão revisadas” aumenta a taxa de engano em até 25 pontos percentuais. Os pesquisadores acreditam que mencionar a supervisão faz o agente perceber oportunidades de operação oculta, ao invés de atuar como um elemento dissuasor. Os modelos testados incluem Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok 4 e Claude Opus 4.1.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A liquidação com stablecoin da Visa atinge uma taxa anualizada de $7B , com alta de 50% no trimestre em relação ao trimestre anterior
De acordo com Jack Forestell, diretor de Produtos e Estratégia da Visa, falando na Conferência de Tecnologia, Mídia e Telecom da Morgan Stanley, o negócio de liquidação com stablecoins da empresa atingiu aproximadamente US$ 7 bilhões de taxa anualizada, aumentando mais de 50% em relação ao trimestre anterior à medida que a adoção
GateNews5h atrás
A Sequans vende 1.025 Bitcoin no 1T de 2026, reduz quase pela metade as reservas
De acordo com a BlockBeats, a fabricante francesa de chips Sequans Communications vendeu 1.025 Bitcoin no primeiro trimestre de 2026, reduzindo suas holdings de 2.139 BTC no fim de 2025 para 1.114 BTC até abril. A empresa registrou um prejuízo líquido de US$ 54,3 milhões no 1T, com prejuízos operacionais aumentando para US$ 50,5 milhões
GateNews12h atrás
Cipher Digital publica perdas líquidas de $114M Net no 1T de 2026, quase dobrando ano a ano
De acordo com o The Block, o minerador de Bitcoin Cipher Digital registrou prejuízo líquido de US$ 114 milhões no 1T de 2026, quase dobrando em relação aos US$ 39 milhões no 1T de 2025. A receita de mineração caiu para US$ 35 milhões, ante US$ 49 milhões, enquanto as participações em Bitcoin da empresa tiveram queda de valor de US$ 125 milhões para US$ 76 milhões. CEO Tyler
GateNews12h atrás
Relatórios de Estratégia: prejuízo de US$ 12,54 bilhões no 1T de 2026, mantém 818.334 Bitcoin
De acordo com a BlockBeats, a Strategy informou em 6 de maio que detinha 818.334 Bitcoin em 3 de maio de 2026, representando um aumento de 22% desde o início do ano, com rendimento em Bitcoin de 9,4%. A empresa informou receita do 1T de 2026 de US$ 124,3 milhões, alta de 11,9% na comparação anual, mas registrou um prejuízo líquido de US$ 12,54
GateNews13h atrás
A CoinShares reporta entradas de cripto de US$ 117,8 milhões na última semana, a quinta semana consecutiva de crescimento enquanto o Bitcoin dispara
De acordo com a Coinshares, os produtos de investimento em criptomoedas registraram entradas de US$ 117,8 milhões na última semana, marcando a quinta semana consecutiva de crescimento positivo. As entradas foram impulsionadas principalmente pelo Bitcoin, que teve US$ 192,1 milhões em entradas e agora acumulou US$ 4,2 bilhões em entradas totais
GateNews17h atrás