DGrid AI publie un livre blanc de recherche PoQ-Judge, réduisant de 72% les coûts d’évaluation de la qualité des LLM

D'après ChainCatcher, DGrid AI a publié aujourd'hui son dernier article de recherche « PoQ-Judge », introduisant un cadre d'évaluation de la qualité multi-architecture qui élimine le besoin de réponses de référence. Le cadre a atteint une corrélation de 0,747 avec les scores d'évaluation humaine sur des ensembles de test maintenus, tout en réduisant les coûts d'évaluation de plus de 72 % grâce à une évaluation en cascade et à une calibration des poids en ligne. PoQ (Proof of Quality) est le mécanisme de consensus propriétaire de DGrid, conçu pour empêcher le déploiement de modèles de faible qualité et la manipulation des données au niveau du protocole.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire