A DGrid AI lança um artigo de investigação do PoQ-Judge, reduzindo os custos de avaliação da qualidade de LLM em 72%

De acordo com a ChainCatcher, a DGrid AI lançou hoje o seu mais recente artigo de investigação, "PoQ-Judge", introduzindo um enquadramento de avaliação de qualidade multi-arquitectura que elimina a necessidade de respostas de referência. A estrutura alcançou uma correlação de 0,747 com as pontuações de avaliação humana em conjuntos de teste retidos, ao mesmo tempo que reduziu os custos de avaliação em mais de 72% através de avaliação em cascata e calibração online de pesos. PoQ (Proof of Quality) é o mecanismo de consenso proprietário da DGrid, concebido para impedir a implementação de modelos de baixa qualidade e a manipulação de dados na camada de protocolo.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário