George Hotz, o hacker que conseguiu desbloquear o iPhone pela primeira vez aos 17 anos e fez engenharia inversa à PlayStation 3, publicou um post no blogue no domingo defendendo que a adoção em massa de agentes de codificação por IA levará a uma degradação significativa da qualidade do software. Hotz escreveu: "Estou a chamar agora: a adoção de agentes de IA no desenvolvimento de software será um dos erros mais dispendiosos da história do campo." A sua posição contrasta diretamente com Andrej Karpathy, um dos investigadores de IA mais proeminentes, que se juntou à equipa de pré-treino da Anthropic a 19 de maio de 2026, declarando explicitamente que, na sua perspetiva, os agentes de IA já transformaram o desenvolvimento de software. Os dois representam polos opostos num debate ainda por estabilizar na indústria, ambos com credenciais substanciais para sustentar os seus argumentos.
O argumento central de Hotz
Hotz passou seis meses a testar agentes de IA em projetos reais: partes do Tinygrad, o seu framework de aprendizagem profunda open-source, e uma engenharia inversa completa de um firmware de um chip USB-PCIe. Com base nessa experiência, argumenta que "os agentes não conseguem programar, e tem demorado cada vez mais a perceber que não conseguem." Descreve o resultado como "descaracterizado, mas de um modo cada vez mais difícil de detetar. O que é exatamente o que esperaria de um modelo estatístico cada vez mais preciso."
O seu receio central é organizacional. Os melhores desempenhos têm ciclos de feedback apertados para detetar problemas gerados pelos agentes antes de serem enviados—leem o código, identificam erros e ajustam quando confiam na ferramenta. "Os piores desempenhos não terão essa auto-verificação", escreve Hotz. A questão crítica: os agentes estão a ser usados pelos desempenhos mais baixos para produzir 10 vezes o output anterior. Em grandes empresas, isto provoca uma degradação mais rápida da qualidade média do código, mascarada pela mera quantidade. Hotz descreve o resultado como "uma era dourada para baldes e baldes de porcaria, e uma era negra para gemas de qualidade." Aponta para relatórios de que a Apple está a promover ferramentas de codificação com IA em toda a sua organização de engenharia, perguntando: "Acham que o macOS vai ficar melhor ou pior nos próximos 2 anos?"
Não é sobre ego
Hotz antecipa a objeção de que um programador que define parte da sua identidade através do seu trabalho naturalmente resistiria a ferramentas de substituição. Leva isso a sério e descarta-o por mérito. "O AFL da Google encontrou mais bugs do que os LLMs e ninguém se sentiu assim. Xadrez e Go são mais populares do que nunca", escreveu. A IA no xadrez dominou os humanos durante décadas, enquanto o jogo só cresceu em popularidade.
Hotz também manifesta ceticismo relativamente às motivações da indústria: "Quase que penso que isto é algum tipo de psyop para vender agentes. O medo da perda é uma das únicas formas de fazer as grandes empresas avançarem. Mas acho que, com esse medo, estão a cometer um grande erro."
Onde se posicionam os campos
Hotz posiciona-se agora no que chama o "campo LeCun/Marcus"—referindo-se a Yann LeCun, diretor científico de IA da Meta, e Gary Marcus, um cético de longa data em relação a LLMs. Ambos defenderam que os modelos de linguagem são, fundamentalmente, localizadores de padrões sofisticados: conseguem imitar a distribuição do código existente, mas não raciocinam sobre problemas verdadeiramente novos a partir de primeiros princípios.
A codificação por vibe—descrever o que se quer em linguagem simples e deixar a IA gerar a implementação—explodiu no último ano. Os principais laboratórios de IA posicionaram a codificação baseada em agentes como um produto de bandeira. A Microsoft transformou o GitHub Copilot num sistema totalmente agentic em 2025, com o CEO Satya Nadella a descrevê-lo como uma mudança ao nível de plataforma comparável à migração para a cloud.
Karpathy tinha sido cético em relação aos agentes no início de 2025, mas inverteu a sua posição após lançamentos de novos modelos. O CEO da Anthropic, Dario Amodei, afirmou em Davos que alguns engenheiros da Anthropic já deixaram de escrever código eles próprios, deixando que os modelos tratem disso enquanto eles revêm o output. Hotz, depois de tentar a mesma abordagem, diz que se viu sempre a recorrer ao ajuste manual.