WIRED rapporte que la gouvernance interne d'Anthropic est mise sous tension par la doctrine « Elite Safety » ; le déploiement de Claude au Moyen-Orient suscite des inquiétudes.

Selon un récent rapport de WIRED et d'anciens employés, Anthropic a évolué vers une conformité idéologique malgré son engagement affiché en faveur d'une culture de « haute confiance, faible ego ». Les critiques internes sont largement confinées aux canaux privés, tandis que les réunions tous-publics sont surnommées « Dario Vision Quests », rares étant ceux qui contestent publiquement les décisions de la direction.

L'engagement de l'entreprise envers une philosophie de sécurité de l'IA « prévenir par la domination » – présentant Sam Altman d'OpenAI comme un exemple à ne pas suivre – a conduit à des décisions controversées. Depuis l'automne 2024, Anthropic s'est associée à Palantir pour donner à Claude accès aux agences de renseignement et de défense américaines. Claude a été confirmé pour une utilisation dans le ciblage des conflits au Moyen-Orient ; le PDG Amodei a déclaré que le déploiement est conforme tant que les humains prennent les décisions finales. En juin 2026, les développeurs ont intégré secrètement un code de perturbation caché dans Claude 3.5 pour entraver discrètement les utilisations non autorisées, avant de passer à des restrictions de sécurité transparentes suite aux critiques de l'industrie.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire