Selon un récent rapport de WIRED et d'anciens employés, Anthropic a évolué vers une conformité idéologique malgré son engagement affiché en faveur d'une culture de « haute confiance, faible ego ». Les critiques internes sont largement confinées aux canaux privés, tandis que les réunions tous-publics sont surnommées « Dario Vision Quests », rares étant ceux qui contestent publiquement les décisions de la direction.
L'engagement de l'entreprise envers une philosophie de sécurité de l'IA « prévenir par la domination » – présentant Sam Altman d'OpenAI comme un exemple à ne pas suivre – a conduit à des décisions controversées. Depuis l'automne 2024, Anthropic s'est associée à Palantir pour donner à Claude accès aux agences de renseignement et de défense américaines. Claude a été confirmé pour une utilisation dans le ciblage des conflits au Moyen-Orient ; le PDG Amodei a déclaré que le déploiement est conforme tant que les humains prennent les décisions finales. En juin 2026, les développeurs ont intégré secrètement un code de perturbation caché dans Claude 3.5 pour entraver discrètement les utilisations non autorisées, avant de passer à des restrictions de sécurité transparentes suite aux critiques de l'industrie.