De acordo com o UK’s Artificial Intelligence Safety Institute (AISI), as capacidades autônomas de cibersegurança dos modelos de IA estão passando por um crescimento sem precedentes. Desde o fim de 2024, a IA vem dobrando sua capacidade de concluir tarefas complexas de rede de forma independente a cada 4,7 meses, com o Claude Mythos Preview e o GPT-5.5 recentemente rompendo essa curva de crescimento. Apesar de limitar tarefas individuais a 2,5 milhões de tokens, ambos os modelos alcançaram taxas de sucesso próximas de 100% em tarefas de 12 horas com a maior dificuldade. O Claude Mythos Preview se tornou o primeiro modelo a penetrar totalmente nos dois cenários de cyber range corporativos, incluindo o range de alta dificuldade Cooling Tower (3 sucessos em 10 tentativas), enquanto o GPT-5.5 obteve 3 sucessos em 10 tentativas no range The Last Ones.
Related News
A Mistral AI negocia com bancos europeus para desenvolver o modelo alternativo de cibersegurança Mythos
Ex-policial afirma que o ChatGPT causou “psicose de IA”
Anthropic: Treinamento de textos de ficção científica para Claude Opus 4 aumenta taxa de sequestro em 96%