O custo das GPUs Nvidia Blackwell dobra, mas a despesa com inferência por token cai 35x em comparação com a Hopper

De acordo com a análise mais recente do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam 35 vezes menos custos de inferência por token. Usando o modelo de teste DeepSeek-R1, Blackwell (GB300 NVL72) é alugado por US$ 2,65 por GPU por hora, enquanto o Hopper custa US$ 1,41. Ainda assim, o throughput de uma única GPU salta de 90 para 6.000 tokens por segundo. Esse ganho de throughput de 65x reduz os custos por milhão de tokens de US$ 4,20 para US$ 0,12.

O valor de US$ 0,12 pressupõe otimização total de software, incluindo inferência com FP4 em baixa precisão e previsão de múltiplos tokens (MTP). Sem MTP habilitado, os custos por milhão de tokens chegam a aproximadamente US$ 2,35, caindo para US$ 0,11 com ele ativo, demonstrando um impacto de otimização de 21x atribuível apenas a esse recurso.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Legisladores do Colorado propõem substituição da lei de IA para abordar preocupações do setor

Os legisladores de Colorado estão se movendo para revogar e substituir a lei de inteligência artificial (IA) de 2024 do estado, SB24-205, por novas regras que restringem o escopo da regulamentação de IA enquanto abordam as preocupações da indústria sobre o ônus de conformidade. A nova proposta, SB26-189, regularia sistemas de IA usados em

CryptoFrontier32m atrás

R0AR Avança para a Rodada Final do PitchFest do Consensus 2026, mas perde por pouco o Top 20

De acordo com a MetaversePost, R0AR avançou para a rodada final de seleção do CoinDesk's Consensus 2026 PitchFest em 4 de maio, ficando por pouco fora das 20 principais startups selecionadas para apresentações ao vivo. O inovador em Web3 e IA foi avaliado junto com startups de alto potencial do mundo todo em um dos maiores eventos do setor

GateNews4h atrás

Musk busca um acordo de US$ 150 bilhões com a OpenAI antes do julgamento; negociações fracassam

De acordo com uma petição judicial, Elon Musk entrou em contato com o presidente da OpenAI, Greg Brockman, em 26 de abril, dois dias antes de o julgamento começar na corte federal de Oakland, para discutir uma possível solução. Quando Brockman sugeriu que ambas as partes desistissem de suas alegações, Musk respondeu com ameaças, dizendo a Brockman: "No fim

GateNews4h atrás

A Cursor aceita a oferta de aquisição de US$ 60 bilhões da SpaceX, mas não vai firmar parceria com a xAI em modelos de codificação

De acordo com a The Information, a Cursor aceitou uma oferta de aquisição condicional de US$ 60 bilhões da SpaceX, embora o acordo ainda não tenha sido finalizado. A empresa atualmente não tem planos de colaborar com a unidade de IA da SpaceX, a xAI, no desenvolvimento de modelos de código. Em vez disso, a Cursor está focada em otimizá-lo

GateNews4h atrás

Haun Ventures fecha fundo de US$ 1 bilhão em 4 de maio, dividindo o capital entre investimentos em cripto no estágio inicial e no estágio tardio

De acordo com a Bloomberg, a Haun Ventures concluiu uma rodada de captação de US$ 1 bilhão em 4 de maio, com US$ 500 milhões destinados a investimentos em estágio inicial e US$ 500 milhões a investimentos em estágio avançado. O fundo vai alocar capital nos próximos dois a três anos, mirando startups de criptomoedas e blockchain enquanto amplia

GateNews5h atrás

OpenAI Levanta $4 Bilhões para Joint Venture de Implantação, Avaliada em US$ 10 bilhões

De acordo com a BlockBeats, em 4 de maio, a OpenAI levantou mais de $4 bilhão para estabelecer uma nova joint venture voltada a ajudar empresas a adotarem seu software de inteligência artificial. A venture, chamada The Deployment Company, conta com apoio de 19 investidores, incluindo TPG Inc., Brookfield Asset Management,

GateNews6h atrás
Comentário
0/400
Sem comentários