Claude Opus 4.7 Masquage des hausses de prix : un nouvel Tokenizer fait consommer 37–47 % de jetons supplémentaires pour le même texte, les frais ne changent pas mais la facture devient plus chère

Selon le rapport de The Decoder et les tests en conditions réelles de plateformes d’observation des coûts d’IA comme Finout et ClaudeCodeCamp, Claude Opus 4.7, lancé à la mi-du mois, conserve un tarif officiel identique de $5 USD pour l’entrée et $25 USD pour la sortie par million de tokens, mais le nouveau tokenizer découpe le même texte en davantage de tokens — avec, d’après les observations en tests, une hausse de 1,47 fois pour le contenu en anglais et le code. Les tests moyens de la communauté indiquent aussi une augmentation de +37,4% des coûts. Pour les utilisateurs professionnels, il s’agit d’une controverse de tarification IA en 2026 avec le premier cas « rate card inchangée, facture en hausse ».

Le plafond officiel de 1,35x rencontre des résultats de 1,47x lors des tests

La documentation officielle d’Anthropic reconnaît que le nouveau tokenizer d’Opus 4.7 fera en sorte qu’un même passage soit découpé en davantage de tokens ; le ratio fourni par l’officiel se situe dans une fourchette de 1,0 à 1,35 fois (soit au maximum +35%). Mais plusieurs tests indépendants aboutissent à des résultats différents : Finout mesure 1,47x dans des prompts d’entreprises réels, ClaudeCodeCamp observe aussi 1,47x dans des scénarios de technical docs, et l’évaluation moyenne de la communauté ressort à +37,4%. L’écart vient du type de texte utilisé dans les tests : la documentation très dense en anglais et le code sont les plus affectés.

Conversion en coûts réels : d’Opus 4.6 à Opus 4.7

En termes de coût concret : le travail d’un prompt sur Opus 4.6, qui consommait 1 000 tokens d’entrée + 500 tokens de sortie, passe sur Opus 4.7 à environ 1 370–1 470 tokens d’entrée + 685–735 tokens de sortie. Même si le tarif par token reste strictement identique, la facture totale de la requête augmente de 37–47%.

La logique du modèle économique transforme les tokens en levier de prix invisible

Ce n’est pas un événement isolé, mais un problème structurel du modèle commercial de l’IA. L’unité de tarification des fournisseurs de LLM est « par token », mais la question de savoir « combien d’informations correspond à un token » est entièrement contrôlée par le fournisseur : modifier le tokenizer, adapter l’algorithme de codage, ou changer la table de vocabulaire fait correspondre le même contenu à un nombre différent de tokens. En d’autres termes, les fournisseurs d’IA peuvent réaliser une hausse de prix réelle sans toucher à la rate card, simplement via une mise à niveau du tokenizer.

Les achats d’IA par les entreprises, ces dernières années, utilisaient principalement le « coût par token » comme indicateur de comparaison ; mais le cas d’Opus 4.7 montre que cet indicateur est incomplet. Le vrai pilotage des coûts doit regarder la « consommation totale de tokens pour accomplir une tâche métier unique » : pour comparer des modèles, il faut d’abord un benchmark token-calibrated (avec une entrée de tâche identique, et en observant la consommation réelle de tokens de chaque modèle).

Impact concret sur les contrats d’achat des entreprises

Pour les organisations ayant déjà signé des contrats d’entreprise avec Anthropic, trois aspects doivent être vérifiés immédiatement : d’abord, si les dépenses mensuelles montent anormalement en raison de la mise à niveau du modèle ; ensuite, si le contrat comporte des conditions obligatoires de mise à niveau de « version du modèle » ; enfin, si le suivi des coûts d’IA en interne inclut un tracking des tokens par tâche, plutôt que de ne surveiller que le total de tokens par jour. Cette semaine, Anthropic a aussi officiellement lancé la facturation à l’usage pour l’offre entreprise ; l’effet combiné de ces deux éléments signifie que le budget IA des entreprises pourrait connaître des dépassements inattendus à deux chiffres.

La transparence du prix de l’IA deviendra un nouveau sujet industriel

La controverse autour du tokenizer d’Opus 4.7 pourrait faire émerger de nouvelles normes d’autorégulation dans l’industrie : demander aux fournisseurs de publier les variations de token ratio lors des mises à niveau des modèles, ou exiger que le tokenizer reste fixe pendant une période donnée. Pour l’écosystème d’IA qui « engloutit » 80% du capital-risque mondial, un manque de transparence rapprochera l’attention des organismes de régulation : la FTC américaine, le DMA de l’UE, etc. s’intéressent déjà à la question des « suppléments invisibles » des services numériques. Pour les lecteurs de Wade, côté achats et développement en entreprise, ce n’est pas un sujet abstrait : ce sont les chiffres sur la facture du mois prochain.

Cet article « Claude Opus 4.7 cache une hausse de prix : le nouveau tokenizer fait consommer 37–47% de tokens pour le même texte, le tarif ne change pas mais la facture devient plus chère » apparaît pour la première fois sur Chaîne Actualités ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Haun Ventures clôture un fonds de 1 milliard de dollars le 5 mai, ciblant les startups de la crypto et de l’IA

Selon Cointelegraph, Haun Ventures a finalisé une levée de fonds de 1 milliard de dollars pour un nouveau fonds le 5 mai, avec un capital qui sera réparti à parts égales entre les investissements en phase précoce et en phase tardive. Le fonds se concentrera sur des startups dans la crypto, l’intelligence artificielle et les alternatives

GateNewsIl y a 46m

Les investissements d’Anthropic et d’OpenAI dépassent 1,1 milliard de dollars dans le trading crypto de détail depuis le début 2026

Selon Bloomberg, les investisseurs particuliers ont versé environ 1,13 milliard de dollars dans le trading à effet de levier via des dérivés de sociétés privées d’IA depuis le début de 2026. Les plateformes crypto Ventuals et PreStocks permettent un trading 24 heures sur 24 sur des sociétés telles qu’Anthropic, OpenAI et SpaceX, sans accorder d’e

GateNewsIl y a 51m

Le vétéran de Qualcomm, Alex Katouzian, rejoint Intel en tant que directeur général (EVP) du calcul client et de l’IA physique

D’après Intel, le 5 mai, Alex Katouzian a rejoint l’entreprise en tant que vice-président exécutif et directeur général de la division Client Computing et Physical AI. Katouzian a auparavant occupé les fonctions de vice-président exécutif et directeur général du secteur mobile, informatique et XR de Qualcomm. Intel a également

GateNewsIl y a 51m

L’aperçu de l’IA de Google fournit des dizaines de millions de réponses erronées chaque heure ; la précision de Gemini 3 atteint 91%

D’après The New York Times, la fonctionnalité d’IA Overview de Google affiche un taux de précision de 91% avec Gemini 3, ce qui signifie qu’elle fournit des dizaines de millions de réponses incorrectes chaque heure. D’après le traitement par Google de plus de 5 mille milliards de recherches par an, cela représente des centaines de milliers de réponses inexactes

GateNewsIl y a 59m

Anthropic prépare un assistant proactif « Orbit » reliant six outils, dont GitHub et Figma

D’après les découvertes du code surveillées par Beating, Anthropic prépare une nouvelle fonctionnalité d’assistant proactif appelée Orbit qui se connecte à Gmail, Slack, GitHub, Calendar, Drive et Figma. La fonctionnalité utilise un mécanisme d’adhésion volontaire et génère des briefings personnalisés à partir des outils de travail connectés tout en

GateNewsIl y a 1h

Vertex Ventures soutient l’entreprise singapourienne d’IA ReN3 avec $5M le 5 mai

D'après Vertex Ventures Southeast Asia et Inde, la start-up singapourienne d'IA d'entreprise ReN3 a levé 5 millions de dollars en financement de démarrage le 5 mai pour se développer en Asie du Sud-Est et investir dans le développement de produits. La société prévoit d'approfondir ses partenaires de distribution

GateNewsIl y a 2h
Commentaire
0/400
Aucun commentaire