Engenheiro da OpenAI Clive Chan ContestA as Recomendações de Hardware da V4, Apontando Erros e Ambiguidade Face à V3

Mensagem do Gate News, 24 de Abril — O engenheiro da OpenAI Clive Chan apresentou objecções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-lhe “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram no tema de discussão mais popular na conferência académica ISCA, ofereceu recomendações específicas alinhadas com normas de interconexão da indústria. Já a V4, em contraste, é muito mais vaga.

Chan contestou sistematicamente três recomendações-chave. No consumo de energia, o relatório sugere que a optimização de software permite que os chips executem simultaneamente em capacidade total computação, armazenamento e comunicação, e recomenda que os fabricantes de chips reservem folga adicional de energia. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por restrições das limitações físicas do processo, pelo que reservar mais margem de energia apenas reduz a frequência de funcionamento, acabando por diminuir o desempenho computacional. No que respeita à transferência de dados de GPU para GPU, o relatório defende um modelo pull—em que as GPUs buscam activamente dados—em vez de um modelo push, citando a elevada sobrecarga de notificações em operações push. Chan contesta isso, sustentando que o pull é na verdade mais lento e que capacidades melhoradas dos adaptadores de rede seriam preferíveis. No entanto, os dois podem estar a discutir camadas diferentes do problema: o relatório trata a sobrecarga do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.

Quanto às funções de activação, o relatório recomenda substituir SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho óptimo usando SwiGLU. Chan suspeita que o DeepSeek pode ter “enfraquecido deliberadamente esta secção.”

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Musk admite que a xAI usou destilação em modelos da OpenAI durante o Dia 4 do julgamento

De acordo com Beating e The Verge, no 4.º dia do julgamento entre Musk e a OpenAI, os advogados da OpenAI questionaram se a xAI tinha usado destilação para melhorar os seus modelos recorrendo à tecnologia da OpenAI. Musk afirmou inicialmente que “quase todas as empresas de IA fazem isto”, mas, quando lhe pediram uma resposta direta, reconhec…

GateNews2m atrás

66,3% dos trabalhadores americanos com rendimentos elevados utilizam ferramentas de IA no trabalho, mostra um inquérito da Reserva Federal

De acordo com um inquérito da Reserva Federal, 66,3% dos trabalhadores nos EUA com rendimentos superiores a 200.000 USD anuais já utilizaram ferramentas de IA no trabalho nos últimos 12 meses, à data de 1 de maio. Entre os escalões de rendimentos mais baixos, as taxas de utilização diminuem significativamente: 51,6% para os que auferem entre 100.000 USD e 200.000 USD, 40,2% para os que ganham entre 50.000 USD e 100.000 USD,

GateNews21m atrás

xAI lança a API do Grok 4.3 com uma janela de contexto de 1 milhão de tokens a 1,25 dólares por milhão de tokens de entrada

De acordo com a BlockBeats, a xAI lançou a API do Grok 4.3 a 1 de maio. O novo modelo suporta uma janela de contexto de 1 milhão de tokens e oferece funcionalidades de entrada/saída de texto, capacidades multimodais e chamadas de ferramentas. A API do Grok 4.3 tem um preço de $1,25 por milhão de entradas

GateNews33m atrás

As gigantes tecnológicas dos EUA vão gastar $700B em infraestruturas de IA em 2026, muito acima dos 105 mil milhões de dólares da China

De acordo com o South China Morning Post, as gigantes tecnológicas dos EUA estão preparadas para gastar mais de 700 mil milhões de dólares em infraestruturas de IA este ano, muito acima dos seus pares chineses. Google, Microsoft, Meta e Amazon respondem pela maior parte desse total, enquanto a Morgan Stanley estimou que os fornecedores de cloud chineses iriam gastar cerca de 105 mil milhões de dólares

GateNews39m atrás

A Huawei prevê que a receita dos seus chips de IA em 2026 atinja 12 mil milhões de dólares, acima 60% face a 2025

De acordo com a Reuters, a Huawei espera que as receitas dos seus chips de IA para 2026 atinjam aproximadamente 12 mil milhões de dólares, representando um aumento de pelo menos 60% face aos 7,5 mil milhões de dólares em 2025. A maior parte das encomendas deste ano é para o processador Ascend 950PR, que entrou em produção em massa em março. A empresa planeia lançar um

GateNews1h atrás

A Nvidia investe na nova empresa de tecnologia jurídica em IA da Suécia, a Legora, com Jude Law como embaixador global da marca

A Nvidia fez um investimento de ampliação da Série D na Legora no valor de 50 milhões de dólares, elevando o total angariado da Legora para 600 milhões de dólares, com uma avaliação de 5,6 mil milhões de dólares. A Atlassian, Adams Street Partners e Insight Partners participaram. A Legora foca-se em tecnologia jurídica de IA, disponibilizando ferramentas como revisão automatizada, análise de contratos e pesquisa jurídica. O ARR ultrapassa 100 milhões de dólares e o número de colaboradores cresceu de 40 para 400. Jude Law tornou-se embaixador de marca global e o slogan publicitário é “Law just got more attractive”.

ChainNewsAbmedia1h atrás
Comentar
0/400
Nenhum comentário