Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram o tópico de discussão mais popular na conferência acadêmica ISCA, ofereceu recomendações específicas alinhadas com padrões de interconexão da indústria. A V4, por outro lado, é muito mais vaga.
Chan contestou sistematicamente três recomendações-chave. Em consumo de energia, o relatório sugere que a otimização de software permite que os chips executem computação, armazenamento e comunicação com capacidade total simultaneamente, e recomenda que os fabricantes de chips reservem margem de energia adicional. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por limitações do processo físico, então reservar mais margem de energia apenas reduz a frequência de operação, diminuindo, por fim, o desempenho computacional. No que diz respeito à transferência de dados de GPU para GPU, o relatório defende um modelo pull—no qual as GPUs buscam ativamente os dados—em vez de um modelo push, citando alto overhead de notificação nas operações push. Chan contesta isso, afirmando que o pull na verdade é mais lento e que capacidades aprimoradas do adaptador de rede seriam preferíveis. No entanto, os dois podem estar discutindo camadas diferentes do problema: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.
Quanto às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho ideal usando SwiGLU. Chan suspeita que o DeepSeek possa ter “enfraquecido deliberadamente esta seção.”
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Depoimentos na 1ª semana do processo de Musk vs. Altman: ele admite que a XAI está “destilando” a OpenAI, e alerta que a IA é como um Exterminador
馬斯克, na primeira semana de depoimento em um tribunal federal de Oakland, acusou Altman e Brockman de fraudar recursos iniciais de uma organização sem fins lucrativos, alertou sobre riscos catastróficos de fim do mundo com a IA e admitiu que parte do xAI foi “destilada” de modelos da OpenAI; ele declarou ter investido US$ 38 milhões e ter visto a OpenAI se transformar de uma entidade sem fins lucrativos em uma empresa avaliada em US$ 800 bilhões. O investimento da Microsoft em 2022 é visto como um ponto de virada na quebra de confiança. A OpenAI argumenta que Musk tentou aliciar pessoas e contesta com a alegação de motivações competitivas. Na segunda semana, novos depoentes incluem Russell e Brockman.
ChainNewsAbmedia1h atrás
A AI Finance ligada a Trump adquire a Block Street por US$ 43 milhões
De acordo com a Fortune, a AI Financial, uma empresa de criptomoedas ligada à família Trump e que antes se chamava Alt5 Sigma, adquiriu a Block Street, uma empresa de infraestrutura cripto, por US$ 43 milhões na semana passada. Matthew Morgan, assessor da AI Financial e CEO da Block Street, afirmou que a aquisição não foi um
GateNews2h atrás
Ações da Riot Disparam 8% Após Expandir A Acordo com a AMD para Data Center
As ações da mineradora de Bitcoin Riot subiram 8% após a expansão de seu acordo com a AMD para data centers. A parceria ampliada inclui melhores condições de financiamento, destacando a mudança estratégica da Riot, saindo da mineração de bitcoin em direção à operação de data centers de inteligência artificial. A medida sinaliza confiança crescente
GateNews4h atrás
Minnesota proíbe ferramentas de IA para imagens íntimas não consensuais e impõe multas de até $500K
De acordo com a Decrypt, a legislatura de Minnesota aprovou, em 2 de maio, um projeto de lei que proíbe sites e aplicativos de fornecerem ferramentas de IA que gerem imagens íntimas não consensuais de indivíduos identificáveis. A lei impede as plataformas de permitirem que usuários acessem ou usem essas ferramentas de “deepfake” e proíbe
GateNews6h atrás
Usuários do ChatGPT agora podem acessar assinaturas na plataforma OpenClaw, anuncia Sam Altman
De acordo com o anúncio de Sam Altman hoje, os usuários do ChatGPT agora podem fazer login na plataforma de agentes OpenClaw usando suas contas do ChatGPT e acessar diretamente suas assinaturas existentes do ChatGPT na plataforma.
GateNews7h atrás
xAI Lança Vozes Personalizadas do Grok, permitindo que os usuários clonem a própria voz de IA em um minuto
Segundo Beating, a xAI lançou o Grok Custom Voices e a Voice Library, permitindo que os usuários gravem um minuto de áudio no console da xAI para gerar um custom voice_id para uso com as APIs do Grok TTS e Voice Agent. O recurso oferece suporte a aplicações como agentes de atendimento ao cliente, criação de conteúdo,
GateNews8h atrás