NVIDIA e MIT lançam framework Lightning OPD, aumentando 4x a eficiência da distilação de modelos enquanto eliminam problemas de memória da GPU

Segundo as informações, investigadores da NVIDIA e do MIT lançaram o Lightning OPD (Offline On-Policy Distillation), um novo quadro de pós-treino para modelos de linguagem de grande dimensão que elimina a necessidade de manter um modelo “teacher” em funcionamento durante o treino. Ao pré-computar, offline, as log-probabilidades do modelo “teacher”, o quadro melhora a eficiência do treino em 4x, libertando todos os recursos da GPU para o treino do modelo “student”.

Em testes com 8 GPUs NVIDIA H100, o Lightning OPD conseguiu destilar com sucesso o Qwen3-30B-A3B-Base (um modelo MoE com 30 mil milhões de parâmetros) e atingiu 71,0 no benchmark AIME 2024, enquanto o OPD standard ficou sem memória no mesmo hardware. Para o modelo Qwen3-8B mais pequeno, o quadro exigiu apenas 30 horas de GPU para alcançar 69,9 pontos.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A startup de voz por IA Vapi conclui $50M Série B liderada pela Peak XV Partners

De acordo com a TechCrunch, a Vapi, uma startup de voz com IA, concluiu uma ronda de financiamento Série B no valor de 50 milhões de dólares, liderada pela Peak XV Partners, com uma avaliação pós-financiamento de aproximadamente 500 milhões de dólares. A Ring, subsidiária da Amazon, colocou a Vapi a tratar de 100% das suas chamadas recebidas após avaliar mais de 40 fornecedores de voz com IA, ajudando a impulsionar a ronda de financiamento.

GateNews12m atrás

A precisão do GPT-5.4 cai de 100% para 54% no ARC-AGI após repetida sumarização de memória

De acordo com Beating, um estudo recente sobre memória de agentes, de Dylan Zhang, estudante de doutoramento na Universidade de Illinois, concluiu que a sumarização repetida das experiências do modelo pode degradar o desempenho em vez de melhorá-lo. Em tarefas ARC-AGI, o GPT-5.4 obteve 100% de precisão em 19 problemas sem memória, mas após múltiplas rondas de compressão de memória com base em trajectórias de solução correctas, a precisão caiu para 54%. De forma semelhante, em tarefas de compras

GateNews24m atrás

A OpenAI alarga o Programa de Acesso Confiável a dezenas de empresas europeias a 12 de maio

De acordo com relatos de 12 de maio, a OpenAI anunciou planos para expandir o seu Programa de Acesso Confiável para dezenas de empresas europeias.

GateNews46m atrás

Transformers em versão real! A ยู樹科技 lançou o primeiro veículo robótico de produção em série a nível mundial, com um preço de 570 mil dólares

A empresa chinesa de robótica Unitree Robotics, com sede em Hangzhou, lançou a 12 de maio o seu mais recente produto, o GD01 — um mecha robótico tripulado que consegue alternar livremente entre modos de marcha humanoide bípede e escalada quadrúpede. Pode dizer-se que é como se as imagens de ficção científica dos filmes “Transformers” e “Pacific Rim” tivessem sido transportadas para o mundo real. O lançamento não é apenas uma curiosidade tecnológica; mostra também a rapidez com que a indústria ch

ChainNewsAbmedia1h atrás

Thinking Machines Model Ties GPT-Realtime-2 para o 1.º lugar no benchmark de áudio hoje, com uma pontuação de 43,4% APR

De acordo com o mais recente benchmark Audio MC S2S da Scale Labs, hoje divulgado, o modelo TML-Interaction-Small da Thinking Machines alcançou 43,36 pontos, empatando em primeiro lugar com o GPT-Realtime-2 (xHigh) da OpenAI, com uma pontuação de 43,4% de APR. O líder absoluto em pontuação, GPT-Realtime-2 (xHigh), marcou 48,45 pontos, enquanto o TML-Interaction-Small ficou logo a seguir, com 43,36 pontos; a diferença ficou dentro das margens de erro estatístico, resultando num empate oficial no

GateNews2h atrás

Arthur Hayes prevê que o Bitcoin regresse aos 126.000 dólares no meio da corrida armamentista de IA entre EUA e China e da inflação associada à guerra

Segundo a Odaily, Arthur Hayes publicou um artigo intitulado “The Butterfly Touch” a 12 de maio, prevendo que o Bitcoin regressará aos $126.000 na sequência da competição de despesas de capital em IA EUA-China e da inflação impulsionada pela guerra. Hayes afirmou que o mercado touro cripto arrancou oficialmente após a ação militar dos EUA contra o Irão, a 28 de fevereiro de 2026, com o Bitcoin já tendo formado uma base perto de $60.000. Espera ganhos acelerados depois de uma quebra acima de $90.

GateNews2h atrás
Comentar
0/400
Nenhum comentário