Google Lança Chips de TPU de Oitava Geração com Melhor Relação Preço-Desempenho, Separa Treinamento e Inferência

Mensagem do Gate News, 22 de abril — A Google Cloud anunciou o lançamento de chips (Tensor Processing Unit) (Unidade de Processamento de Tensor) personalizados de sua oitava geração, baseados em TPU, em 22 de abril. A nova linha inclui a TPU 8t, projetada especificamente para tarefas de treinamento de IA, e a TPU 8i, otimizada para cargas de trabalho de inferência de IA. Ambos os chips estarão disponíveis mais tarde este ano. A Google também divulgou novas ferramentas para construir agentes de IA e anunciou um fundo de $750 um milhão para impulsionar a adoção de IA por empresas.

A TPU 8t oferece 2,8 vezes o desempenho do TPU Ironwood da geração anterior da Google, pelo mesmo preço. A TPU 8i melhora o desempenho em 80% em relação à predecessora e incorpora uma arquitetura de memória estática de acesso aleatório (SRAM) para entregar “alto throughput em larga escala e baixa latência, possibilitando que milhões de agentes sejam executados simultaneamente”, de acordo com o CEO Sundar Pichai. Em comparação com a Ironwood, tanto a TPU 8t quanto a TPU 8i atingem mais do que o dobro da eficiência desempenho-por-watt, com a TPU 8t melhorando em 124% e a TPU 8i em 117%. A Google otimizou a eficiência energética em toda a pilha de tecnologia e integrou sistemas de gerenciamento de energia dinâmicos que ajustam o consumo com base na demanda em tempo real.

Os modelos de primeira parte da Google agora processam mais de 160 bilhões de tokens por minuto por meio de chamadas diretas à API do cliente, acima dos 100 bilhões no trimestre passado. A IA agora gera 75% de todo o novo código na Google, em comparação com 50% no outono do ano passado. O Gemini Enterprise, oferta corporativa da Google, cresceu 40% de um trimestre para o outro em usuários ativos mensais pagantes. A empresa espera investir um pouco mais da metade do orçamento de computação de machine learning em serviços de nuvem até 2026 para melhor atender clientes e parceiros de nuvem. A Google também está expandindo sua colaboração com a Broadcom para desenvolver e fornecer chips de TPU personalizados para gerações futuras, enquanto grandes empresas de tecnologia buscam alternativas a GPUs caras e com oferta limitada da NVIDIA e da AMD.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

R0AR Avança para a Rodada Final do PitchFest do Consensus 2026, mas perde por pouco o Top 20

De acordo com a MetaversePost, R0AR avançou para a rodada final de seleção do CoinDesk's Consensus 2026 PitchFest em 4 de maio, ficando por pouco fora das 20 principais startups selecionadas para apresentações ao vivo. O inovador em Web3 e IA foi avaliado junto com startups de alto potencial do mundo todo em um dos maiores eventos do setor

GateNews1h atrás

Musk busca um acordo de US$ 150 bilhões com a OpenAI antes do julgamento; negociações fracassam

De acordo com uma petição judicial, Elon Musk entrou em contato com o presidente da OpenAI, Greg Brockman, em 26 de abril, dois dias antes de o julgamento começar na corte federal de Oakland, para discutir uma possível solução. Quando Brockman sugeriu que ambas as partes desistissem de suas alegações, Musk respondeu com ameaças, dizendo a Brockman: "No fim

GateNews1h atrás

A Cursor aceita a oferta de aquisição de US$ 60 bilhões da SpaceX, mas não vai firmar parceria com a xAI em modelos de codificação

De acordo com a The Information, a Cursor aceitou uma oferta de aquisição condicional de US$ 60 bilhões da SpaceX, embora o acordo ainda não tenha sido finalizado. A empresa atualmente não tem planos de colaborar com a unidade de IA da SpaceX, a xAI, no desenvolvimento de modelos de código. Em vez disso, a Cursor está focada em otimizá-lo

GateNews2h atrás

Haun Ventures fecha fundo de US$ 1 bilhão em 4 de maio, dividindo o capital entre investimentos em cripto no estágio inicial e no estágio tardio

De acordo com a Bloomberg, a Haun Ventures concluiu uma rodada de captação de US$ 1 bilhão em 4 de maio, com US$ 500 milhões destinados a investimentos em estágio inicial e US$ 500 milhões a investimentos em estágio avançado. O fundo vai alocar capital nos próximos dois a três anos, mirando startups de criptomoedas e blockchain enquanto amplia

GateNews2h atrás

OpenAI Levanta $4 Bilhões para Joint Venture de Implantação, Avaliada em US$ 10 bilhões

De acordo com a BlockBeats, em 4 de maio, a OpenAI levantou mais de $4 bilhão para estabelecer uma nova joint venture voltada a ajudar empresas a adotarem seu software de inteligência artificial. A venture, chamada The Deployment Company, conta com apoio de 19 investidores, incluindo TPG Inc., Brookfield Asset Management,

GateNews3h atrás

Por que algumas pessoas acham que a IA vai mudar o mundo, enquanto outras acham que não vai mudar nada? As duas constatações de Karpathy

Karpathy aponta que a lacuna de percepção da IA se origina de dois diagnósticos: 1) o uso apenas de modelos gratuitos/antigos impede que se reflita a capacidade dos modelos agentic de ponta; 2) a melhora de desempenho só se torna claramente visível em áreas altamente técnicas e ainda assim apresenta assimetria. Isso faz com que usuários pagantes e leitores comuns observem fenômenos diferentes, gerando um mal-entendido mútuo entre mundos paralelos. A lição para os leitores de Taiwan é que, ao usar na prática os modelos mais avançados para completar tarefas de produção e verificar os fundamentos das conclusões, é possível evitar ser conduzido por ilusões da mídia.

ChainNewsAbmedia3h atrás
Comentário
0/400
Sem comentários