Ex-engenheiro da Seed da ByteDance: A iteração de IA da ByteDance leva seis meses vs. os três meses do Google

Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast “Into Asia” que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (pretraining mais pós-treinamento), enquanto o Google, supostamente, precisa apenas de três meses. Zhang atribuiu a diferença de velocidade como um motivo central pelo qual as empresas chinesas têm dificuldades para alcançar o ritmo no desenvolvimento de IA.

Zhang descreveu uma “cultura de benchmarking” dentro da Seed, em que os líderes de equipe são avaliados com base nas pontuações de benchmarks que eles supervisionam, e todos os membros se concentram em aumentar os números. No entanto, ele observou que isso não se traduz em uma melhor experiência do usuário na prática. Embora os modelos das principais empresas chinesas pareçam competitivos com os modelos de fronteira dos EUA no papel, eles ficam aquém no uso real. O objetivo da Seed é alcançar desempenho de primeira linha global, mas Zhang declarou que não acredita que a equipe tenha atingido isso, nem que tenha alcançado a meta de liderança doméstica.

No fim de 2024, a Seed se via em igualdade com o GPT-4o, mas após o lançamento do DeepSeek, a equipe reconheceu que a lacuna permanecia. Quando Zhang entrou, todo o grupo estava mudando urgentemente para aprendizado por reforço para lidar com a deficiência.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Casos de ransomware disparam 389% em 2025, chegando a 7.831, aponta o relatório da Fortinet

De acordo com a Fortinet, os casos globais de ransomware aumentaram 389% ano a ano, para 7.831 em 2025, à medida que criminosos cibernéticos usaram IA e aceleraram ataques a vulnerabilidades de software. A manufatura foi o setor mais visado, com 1.284 casos, seguida pelos serviços empresariais com 824 e pelo varejo com 682. Fortine

GateNews13m atrás

Blackstone, KKR, EQT em negociações com a Alphabet para acordos de portfólio de IA

De acordo com a Bloomberg, Blackstone, KKR e a EQT, com sede na Suécia, estão em conversas com a Alphabet para oferecer às empresas de seu portfólio acesso aos modelos de IA do Google por meio de contratos abrangentes para todo o portfólio. As discussões não são exclusivas e podem não resultar em acordos. A estrutura daria ao Google algo mais

GateNews23m atrás

O laboratório finlandês de IA QuTwo conclui a rodada de seed $29M na $380M avaliação; a empresa anterior do fundador, a Silo AI, foi vendida para a AMD por US$ 665 milhões

De acordo com Beating, o laboratório de IA finlandês QuTwo concluiu uma rodada seed de 25 milhões de euros (aproximadamente US$ 29 milhões), com valuation pós-investimento de 325 milhões de euros (aproximadamente US$ 380 milhões). O fundador e presidente executivo Peter Sarlin anteriormente fundou a Silo AI, que a AMD adquiriu por US$ 665 milhões em 2024.

GateNews53m atrás

DeepSeek avaliada em $45B , enquanto o Fundo Estatal de Semicondutores da China mira um investimento líder

De acordo com o ChainCatcher, o fundo de investimentos em semicondutores apoiado pelo Estado da China está em conversas para liderar a rodada de Série A do DeepSeek, potencialmente avaliando o laboratório de IA em cerca de US$ 45 bilhões. As negociações de financiamento estão em andamento, segundo quatro pessoas familiarizadas com o

GateNews1h atrás

Pesquisa da Microsoft: apenas 13% dos funcionários dizem que a falha em inovações no local de trabalho impulsionadas por IA recebeu incentivos da empresa

De acordo com o relatório anual “Índice de Tendências de Trabalho”, publicado pela Microsoft em 5 de maio, o documento analisou dezenas de milhares de sinais anônimos de produtividade do Microsoft 365 e entrevistou 20.000 funcionários em vários mercados, incluindo Estados Unidos, Reino Unido, Índia e Japão. Os dados do relatório mostram que apenas 13% dos funcionários disseram que seus empregadores oferecem incentivos quando eles tentam melhorar o trabalho com IA e não alcançam os resultados esperados.

MarketWhisper2h atrás

A Meta desenvolve um assistente de IA Hatch para competir com o OpenClaw, com conclusão do teste interno até o fim de junho

De acordo com a Financial Times, em 5 de maio, a Meta está desenvolvendo um assistente de IA (Hatch) voltado para o consumidor comum, inspirado no OpenClaw, da OpenAI, com o objetivo de concluir testes internos até o fim de junho; a Meta também planeja, antes do quarto trimestre deste ano, integrar ferramentas de compra autônomas baseadas em agentes ao Instagram.

MarketWhisper2h atrás
Comentário
0/400
Sem comentários