Antigo Engenheiro da ByteDance Seed: A iteração de IA da ByteDance demora seis meses, em comparação com os três meses do Google

Mensagem de Gate News, 24 de abril — Zhang Chi, um antigo engenheiro da equipa Seed da ByteDance e atualmente professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance necessita de aproximadamente seis meses para concluir um ciclo completo de treino de pré-formação de modelos de linguagem de grande dimensão (pretraining mais pós-treino), enquanto o Google, segundo se afirma, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como uma razão central pela qual as empresas chinesas têm dificuldade em acompanhar o desenvolvimento de IA.

Zhang descreveu uma “cultura de benchmark” dentro da Seed, em que os líderes de equipa são avaliados com base nas pontuações de referência que supervisionam, e todos os membros se concentram em aumentar os números. No entanto, referiu que isto não se traduz, na prática, numa melhor experiência do utilizador. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA em termos de papel, ficam aquém na utilização real. O objetivo da Seed é alcançar um desempenho de topo a nível global, mas Zhang afirmou que não acredita que a equipa tenha atingido esse patamar, nem que tenha alcançado a meta de liderança doméstica.

No final de 2024, a Seed considerava-se equivalente ao GPT-4o, mas após o lançamento da DeepSeek, a equipa reconheceu que a diferença continuava. Quando Zhang se juntou, todo o grupo estava a mudar com urgência para a aprendizagem por reforço para colmatar a lacuna.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Cloudflare: agentes de IA impulsionam tráfego não humano, x402 oferece uma solução

O Diretor de Estratégia da Cloudflare afirmou que mais de metade do tráfego na Internet já não é gerado por humanos, destacando uma mudança significativa nos padrões de utilização da web impulsionada por agentes de IA e sistemas automatizados. O executivo sugeriu que a x402 Foundation está a construir infraestruturas para enfrentar os desafios

CryptoFrontier9m atrás

IREN adquire a Mirantis por $625M num acordo integral em ações para expandir a plataforma de cloud de IA

De acordo com a BlockBeats, a IREN Limited acordou adquirir a empresa de software de infraestruturas cloud Mirantis por aproximadamente 625 milhões de dólares, numa transação integralmente em ações, a 5 de maio. A aquisição visa reforçar as capacidades de cloud com IA da IREN, introduzindo capacidades de software e orquestração para

GateNews6h atrás

CEO da Anthropic: os EUA estão a considerar um processo simplificado de lançamento de modelos de IA, enquanto os concorrentes estão 1-3 meses atrasados

De acordo com 金十, o CEO da Anthropic revelou a 5 de maio que o governo dos EUA parece estar a considerar simplificar o processo de divulgação de modelos de inteligência artificial. O CEO indicou que as capacidades de outros grandes laboratórios de IA podem ficar atrás da Anthropic em um a três

GateNews6h atrás

A equipa da SGLang conclui a $100M ronda de financiamento-semente$400M com avaliação, com a Accel na liderança

De acordo com Beating, a equipa por detrás do motor de inferência open-source SGLang estabeleceu formalmente a RadixArk e concluiu uma ronda de investimento de seed no valor de 100 milhões de dólares, a uma avaliação pós-money de 400 milhões de dólares. A Accel liderou a ronda, com a Spark Capital como investidora co-líder. Concorrentes no setor de semicondutores da Nvidia (via

GateNews6h atrás

A OpenAI concede 8.000 programadores um aumento de 10x do limite de taxa do Codex até 5 de junho

De acordo com Beating, a OpenAI enviou e-mails a mais de 8.000 programadores que se inscreveram para o evento offline do GPT-5.5 em São Francisco, concedendo-lhes um aumento de 10x nos limites de taxa do Codex com efeitos imediatos até 5 de junho. Todos os candidatos recebem o prémio, independentemente de terem recebido um evento

GateNews6h atrás

Joint Venture da OpenAI com a Anthropic em negociações para adquirir três empresas de serviços de IA a 5 de maio

Segundo Jin 10, o empreendimento conjunto da OpenAI com a Anthropic está em negociações para adquirir três empresas de serviços de IA a 5 de maio. As empresas visadas incluem, segundo é noticiado, empresas focadas em engenharia nos serviços de IA

GateNews6h atrás
Comentar
0/400
Nenhum comentário