Plurai's quadro de restrições barred gera automaticamente dados de treinamento sintéticos a partir de uma descrição de tarefa fornecida e de uma pequena amostra não rotulada, treinando assim um filtro de conteúdo personalizado para verificar se a saída da IA viola as diretrizes. Usando esse conjunto de dados para fazer ajuste fino no qwen2.5-3b (30 bilhões de parâmetros), o método supera o oss-safeguard-20b da OpenAI (200 bilhões de parâmetros) e o GPT-4.1 usado diretamente em tarefas como estratégia de diálogo, verificação de saída de agentes e conformidade médica. O quadro divide a tarefa em múltiplas dimensões, gera amostras propensas a erros na fronteira e garante a precisão das etiquetas por meio de uma etapa de “debate assimétrico”. O código de avaliação e o conjunto de dados foram abertos no GitHub e no Hugging Face.

CoinNetwork

2026-04-29 10:59:47

Geração do resumo em andamento

CoinWorld消息，Plurai提出的barred框架通过给定任务描述和少量无标注样本，自动生成合成训练数据，训练出定制的内容护栏（guardrail），用于审核AI输出是否违规。使用这套数据微调的qwen2.5-3b（30亿参数）在对话策略、agent输出校验和医疗合规等任务上全面超过OpenAI的oss-safeguard-20b（200亿参数），并且也超过直接使用的GPT-4.1。该框架将任务拆分为多个维度，专门在边界地带生成容易判错的样本。生成后需经过「非对称辩论」环节，确保样本标签的准确性。评估代码和数据集已在GitHub和Hugging Face开源。

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
WCTCTradingKingPK
360.44K Popularidade
#
CryptoMarketsDipSlightly
264.89K Popularidade
#
IsraelStrikesIranBTCPlunges
35.94K Popularidade
#
#DailyPolymarketHotspot
697.11K Popularidade
#
StrategyAccumulates2xMiningRate
139.47M Popularidade

Marcar

sitemap

Plurai: modelo pequeno de 3 bilhões de parâmetros supera o modelo dedicado de 20 bilhões de parâmetros

Tendências

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Marcar