NVIDIA e MIT lançam framework Lightning OPD, aumentando 4x a eficiência da distilação de modelos enquanto eliminam problemas de memória da GPU

GateNews

2026-05-12 11:13:28

Segundo as informações, investigadores da NVIDIA e do MIT lançaram o Lightning OPD (Offline On-Policy Distillation), um novo quadro de pós-treino para modelos de linguagem de grande dimensão que elimina a necessidade de manter um modelo “teacher” em funcionamento durante o treino. Ao pré-computar, offline, as log-probabilidades do modelo “teacher”, o quadro melhora a eficiência do treino em 4x, libertando todos os recursos da GPU para o treino do modelo “student”.

Em testes com 8 GPUs NVIDIA H100, o Lightning OPD conseguiu destilar com sucesso o Qwen3-30B-A3B-Base (um modelo MoE com 30 mil milhões de parâmetros) e atingiu 71,0 no benchmark AIME 2024, enquanto o OPD standard ficou sem memória no mesmo hardware. Para o modelo Qwen3-8B mais pequeno, o quadro exigiu apenas 30 horas de GPU para alcançar 69,9 pontos.

Ver fonte

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

A startup de voz por IA Vapi conclui $50M Série B liderada pela Peak XV Partners

Notícias da indústria de IA

De acordo com a TechCrunch, a Vapi, uma startup de voz com IA, concluiu uma ronda de financiamento Série B no valor de 50 milhões de dólares, liderada pela Peak XV Partners, com uma avaliação pós-financiamento de aproximadamente 500 milhões de dólares. A Ring, subsidiária da Amazon, colocou a Vapi a tratar de 100% das suas chamadas recebidas após avaliar mais de 40 fornecedores de voz com IA, ajudando a impulsionar a ronda de financiamento.

GateNews12m atrás

A precisão do GPT-5.4 cai de 100% para 54% no ARC-AGI após repetida sumarização de memória

Notícias da indústria de IA

De acordo com Beating, um estudo recente sobre memória de agentes, de Dylan Zhang, estudante de doutoramento na Universidade de Illinois, concluiu que a sumarização repetida das experiências do modelo pode degradar o desempenho em vez de melhorá-lo. Em tarefas ARC-AGI, o GPT-5.4 obteve 100% de precisão em 19 problemas sem memória, mas após múltiplas rondas de compressão de memória com base em trajectórias de solução correctas, a precisão caiu para 54%. De forma semelhante, em tarefas de compras

GateNews24m atrás

A OpenAI alarga o Programa de Acesso Confiável a dezenas de empresas europeias a 12 de maio

Notícias da indústria de IA

De acordo com relatos de 12 de maio, a OpenAI anunciou planos para expandir o seu Programa de Acesso Confiável para dezenas de empresas europeias.

GateNews46m atrás

Transformers em versão real! A ยู樹科技 lançou o primeiro veículo robótico de produção em série a nível mundial, com um preço de 570 mil dólares

Notícias da indústria de IA

A empresa chinesa de robótica Unitree Robotics, com sede em Hangzhou, lançou a 12 de maio o seu mais recente produto, o GD01 — um mecha robótico tripulado que consegue alternar livremente entre modos de marcha humanoide bípede e escalada quadrúpede. Pode dizer-se que é como se as imagens de ficção científica dos filmes “Transformers” e “Pacific Rim” tivessem sido transportadas para o mundo real. O lançamento não é apenas uma curiosidade tecnológica; mostra também a rapidez com que a indústria ch

ChainNewsAbmedia1h atrás

Thinking Machines Model Ties GPT-Realtime-2 para o 1.º lugar no benchmark de áudio hoje, com uma pontuação de 43,4% APR

Notícias da indústria de IA

De acordo com o mais recente benchmark Audio MC S2S da Scale Labs, hoje divulgado, o modelo TML-Interaction-Small da Thinking Machines alcançou 43,36 pontos, empatando em primeiro lugar com o GPT-Realtime-2 (xHigh) da OpenAI, com uma pontuação de 43,4% de APR. O líder absoluto em pontuação, GPT-Realtime-2 (xHigh), marcou 48,45 pontos, enquanto o TML-Interaction-Small ficou logo a seguir, com 43,36 pontos; a diferença ficou dentro das margens de erro estatístico, resultando num empate oficial no

GateNews2h atrás

Arthur Hayes prevê que o Bitcoin regresse aos 126.000 dólares no meio da corrida armamentista de IA entre EUA e China e da inflação associada à guerra

Previsão de preços Notícias da indústria de IA bitcoin news

Segundo a Odaily, Arthur Hayes publicou um artigo intitulado “The Butterfly Touch” a 12 de maio, prevendo que o Bitcoin regressará aos $126.000 na sequência da competição de despesas de capital em IA EUA-China e da inflação impulsionada pela guerra. Hayes afirmou que o mercado touro cripto arrancou oficialmente após a ação militar dos EUA contra o Irão, a 28 de fevereiro de 2026, com o Bitcoin já tendo formado uma base perto de $60.000. Espera ganhos acelerados depois de uma quebra acima de $90.

GateNews2h atrás

Comentar

0/400

Nenhum comentário