DGrid AI publie un livre blanc de recherche PoQ-Judge, réduisant de 72% les coûts d’évaluation de la qualité des LLM

2026-06-15 14:04:18

D'après ChainCatcher, DGrid AI a publié aujourd'hui son dernier article de recherche « PoQ-Judge », introduisant un cadre d'évaluation de la qualité multi-architecture qui élimine le besoin de réponses de référence. Le cadre a atteint une corrélation de 0,747 avec les scores d'évaluation humaine sur des ensembles de test maintenus, tout en réduisant les coûts d'évaluation de plus de 72 % grâce à une évaluation en cascade et à une calibration des poids en ligne. PoQ (Proof of Quality) est le mécanisme de consensus propriétaire de DGrid, conçu pour empêcher le déploiement de modèles de faible qualité et la manipulation des données au niveau du protocole.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

Il y a 3h

Moonshot AI lance Kimi K2.7 Code HighSpeed, 6 fois plus rapide avec une double tarification API

Il y a 3h

Mise à niveau majeure de l’assistant de stratégie de Gate AI : génération de stratégie en une phrase à partir de langage naturel, avec backtest et déploiement en une seule étape

Il y a 10h

Zhipu lance le modèle phare GLM-5.2 avec une fenêtre de contexte de 1M, qui sera open-source sous licence MIT

Il y a 11h

Baidu DuMate réduit la consommation de jetons de 75 % après une mise à niveau du moteur principal

06-14 03:33

OpenRouter lance le modèle Fusion qui correspond à Fable 5 pour la moitié du coût, obtenant 69 % contre 65,3 %

Analyse approfondie