DGrid AI lança paper de pesquisa PoQ-Judge, reduzindo em 72% os custos de avaliação da qualidade de LLMs

De acordo com o ChainCatcher, a DGrid AI lançou hoje seu mais recente artigo de pesquisa “PoQ-Judge”, apresentando um framework de avaliação de qualidade multiarquitetura que elimina a necessidade de respostas de referência. A estrutura alcançou uma correlação de 0,747 com as pontuações de avaliação humana em conjuntos de teste mantidos à parte, enquanto reduzia os custos de avaliação em mais de 72% por meio de avaliação em cascata e calibração online de pesos. PoQ (Proof of Quality) é o mecanismo de consenso proprietário da DGrid, projetado para impedir a implantação de modelos de baixa qualidade e manipulação de dados na camada de protocolo.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários