Modelos da OpenAI para Migrar Gradualmente para o Chip Personalizado Trainium da Amazon, Diz Altman Ele Está 'Ansioso' por Isso

Mensagem do Gate News, 29 de abril — Modelos da OpenAI executados no Amazon Web Services’ Bedrock irão migrar gradualmente para o Trainium, o chip de IA personalizado da Amazon, de acordo com comentários recentes do CEO da OpenAI, Sam Altman, e de executivos da AWS. Atualmente, os modelos operam em um ambiente misto usando tanto GPUs quanto Trainium, com uma parcela crescente sendo transferida para o Trainium ao longo do tempo. Altman afirmou que a empresa está “ansiosa para levar modelos para o Trainium.”

O executivo da AWS, Garman, reconheceu que o nome do Trainium pode ter sido enganoso, já que o chip foi projetado para treinamento e inferência, sendo que a inferência deve ser o principal caso de uso no futuro. No entanto, Garman enfatizou que a marca do chip é em grande parte irrelevante para a maioria dos clientes, observando que os usuários interagem com a OpenAI por meio de sua interface de API em vez de diretamente com o hardware subjacente. Quando perguntado sobre a integração futura de modelos que não sejam da OpenAI ao Bedrock Managed Agents, Garman recusou-se a fornecer detalhes, afirmando apenas que a AWS está atualmente focada em sua parceria com a OpenAI.

A colaboração destaca a estratégia da AWS de aproveitar seus silícios personalizados para dar suporte a grandes cargas de trabalho de IA em sua plataforma de nuvem.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Cloudflare: agentes de IA impulsionam tráfego não humano; x402 oferece solução

O diretor de estratégia da Cloudflare afirmou que mais da metade do tráfego da internet agora é não humano, destacando uma mudança significativa nos padrões de uso da web impulsionada por agentes de IA e sistemas automatizados. O executivo sugeriu que a Fundação x402 está construindo infraestrutura para enfrentar os desafios

CryptoFrontier45m atrás

IREN adquire a Mirantis por $625M em um acordo 100% em ações para expandir a plataforma de nuvem de IA

Segundo a BlockBeats, a IREN Limited concordou em adquirir a empresa de software de infraestrutura em nuvem Mirantis por aproximadamente US$ 625 milhões em uma transação integralmente em ações em 5 de maio. A aquisição visa fortalecer as capacidades de nuvem com IA da IREN ao introduzir recursos de software e orquestração para

GateNews6h atrás

CEO da Anthropic: EUA analisam processo simplificado de lançamento de modelos de IA, concorrentes de 1 a 3 meses atrás

De acordo com 金十, o CEO da Anthropic revelou em 5 de maio que o governo dos EUA parece estar considerando simplificar o processo de liberação de modelos de inteligência artificial. O CEO observou que as capacidades de outros grandes laboratórios de IA podem ficar atrás da Anthropic em um a três

GateNews6h atrás

A equipe do SGLang conclui uma rodada de captação de sementes $100M , a uma avaliação $400M , com a Accel na liderança

De acordo com Beating, a equipe por trás do mecanismo de inferência de código aberto SGLang estabeleceu formalmente a RadixArk e concluiu uma rodada de captação seed de US$ 100 milhões a uma avaliação pós-money de US$ 400 milhões. A Accel liderou a rodada, com a Spark Capital como investidora co-líder. Concorrentes de semicondutores da Nvidia (via

GateNews7h atrás

OpenAI concede 8.000 desenvolvedores um aumento de 10x no limite de taxa do Codex até 5 de junho

De acordo com Beating, a OpenAI enviou e-mails para mais de 8.000 desenvolvedores que se inscreveram no evento offline do GPT-5.5 em São Francisco, concedendo a eles um aumento de 10x nos limites de taxa do Codex, em vigor imediatamente até 5 de junho. Todos os candidatos recebem o prêmio, independentemente de terem recebido um convite para o evento

GateNews7h atrás

Joint venture da OpenAI com a Anthropic em conversas para adquirir três empresas de serviços de IA em 5 de maio

De acordo com Jin 10, a joint venture da OpenAI com a Anthropic está em negociações para adquirir três empresas de serviços de IA em 5 de maio. As empresas visadas, segundo relatos, incluem firmas com foco em engenharia nos serviços de IA

GateNews7h atrás
Comentário
0/400
isahshavip
· 04-29 11:29
Corrida de touros 🐂
Ver originalResponder0