
La série Alibaba Qwen (Qwen) publie cette semaine le modèle Qwen3.7-Plus, avec un prix d’entrée de 0,40 dollar/1 million de tokens et un prix de sortie de 1,60 dollar/1 million de tokens, pour un total de 2,00 dollars, soit une baisse de 80 % par rapport à Qwen3.7-Max ; le prix d’entrée en cache peut descendre jusqu’à 0,04 dollar/1 million de tokens, le scénario visé étant des tâches à forte fréquence et à forte répétitivité.
Qwen3.7-Plus : prix confirmés selon chaque mode de facturation
D’après les informations de tarification publiées par Alibaba :
Entrée standard : 0,40 dollar/1 million de tokens
Sortie standard : 1,60 dollar/1 million de tokens
Total (entrée + sortie) : 2,00 dollars
Entrée en cache : 0,04 dollar/1 million de tokens (pour des scénarios d’agent où l’on relit à plusieurs reprises le même dépôt de code ou la même interface utilisateur d’entreprise)
Référence : Qwen3.7-Max : entrée à 2,50 dollars, sortie à 7,50 dollars, total 10,00 dollars. Les concurrents chinois MiniMax-M3 avec une offre promotionnelle temporaire totalisent 1,50 dollar ; la tarification de Qwen3.7-Plus se cale au plus près.
Chiffres des tests de référence officiels (auto-évaluation)
Voici les chiffres des tests de référence de Qwen3.7-Plus publiés par Alibaba, tous issus d’une auto-évaluation :
Terminal Bench 2.0-Terminus : 70,3 (DeepSeek-V4-Pro Max : 67,9 ; Gemini-3.1 Pro : 63,5)
ScreenSpot Pro (vision par ordinateur et compréhension d’interface) : 79,0 (GPT-5.4 xhigh : 67,4 ; Claude-Opus-4.6 : 49,5)
À noter que la documentation officielle d’Alibaba indique également que les performances globales de Qwen3.7-Plus restent inférieures à celles de la plupart des modèles américains fermés de premier plan ; les chiffres ci-dessus correspondent à des comparaisons à un instant précis pour des tâches spécifiques et ne représentent pas une performance globale.
Impact de la validation du déploiement en modèle fermé : considérations de conformité et limites d’application
Qwen3.7-Plus ne fournit pas de poids de modèles open source téléchargeables ; tous les appels API doivent être traités via les nœuds internationaux d’Alibaba Cloud, et les données ne circulent pas en dehors des serveurs de l’utilisateur. En vertu de cette architecture, les scénarios suivants présentent des obstacles de conformité clairs :
Industries soumises à des contraintes de souveraineté des données ou à des exigences réglementaires : santé (HIPAA, GDPR), défense, organismes gouvernementaux ; il faut évaluer si le routage via API externe respecte les exigences de conformité
Scénarios de déploiement avec isolement du réseau interne : impossible de déployer dans un environnement local totalement isolé
En revanche, l’avantage du mode API fermé réside dans le fait qu’il n’est pas nécessaire d’acheter ni d’exploiter un cluster multi-GPU (par exemple Nvidia H100) en interne ; et le format compatible avec OpenAI réduit au minimum les coûts de modification de l’infrastructure existante.
Questions fréquentes
À quels scénarios s’applique le prix en cache de 0,04 dollar/1 million de tokens de Qwen3.7-Plus ?
Le prix en cache s’applique aux scénarios où un agent lit à maintes reprises les mêmes entrées, par exemple un accès continu à un même dépôt de code, des modèles d’interface utilisateur d’entreprise fixes, ou des prompts système conservés sur de longues périodes. Dans de grands workflows à haute fréquence et à forte répétitivité, le mécanisme de cache peut réduire de manière significative le coût API global. Alibaba n’a pas publié de garantie précise concernant le taux de succès du cache ni de détails sur les limitations d’utilisation.
Quelles sont les principales différences entre Qwen3.7-Plus et les versions ouvertes précédentes de Qwen ?
Auparavant, la série Qwen était publiée sous licence Apache 2.0, avec des poids de modèles téléchargeables, permettant à n’importe qui de déployer localement, de fine-tuner et de l’intégrer à ses propres systèmes. Qwen3.7-Plus n’est fourni que via l’API d’Alibaba Cloud ; il ne publie pas les poids du modèle, ce qui implique qu’il ne peut pas être déployé en local ou dans un réseau isolé, et que toutes les utilisations dépendent de l’infrastructure externe d’Alibaba Cloud.
Comment faut-il interpréter la fiabilité des chiffres des tests de référence officiels de Qwen3.7-Plus ?
La documentation officielle de Qwen3.7-Plus indique clairement que Terminal Bench et ScreenSpot Pro sont des scores basés sur des chiffres d’auto-évaluation d’Alibaba, et que les performances globales restent inférieures à celles de la plupart des modèles américains fermés de premier plan. Les chiffres de benchmark reflètent des performances ponctuelles sur des tâches spécifiques et ne représentent pas la latence bout-en-bout, la stabilité ou la performance globale dans un environnement de production réel.