Gate News 消息,4 月 24 日——字节跳动种子团队的前工程师张弛、现任北京大学助理教授在播客“Into Asia”中透露,字节跳动完成一次大型语言模型训练(预训练以及后训练)需要大约六个月,而据称谷歌只需要三个月。张弛将这种速度差异视为中国公司在 AI 开发方面难以追赶的核心原因。
张弛描述了种子内部的一种“基准测试文化”:团队负责人会根据他们所负责的基准测试得分来接受评估,所有成员都致力于提升数据指标。不过他指出,这种做法在实践中并不会转化为更好的用户体验。尽管从纸面上看,中国大型公司的模型似乎与美国前沿模型具备竞争力,但在实际使用中却有所欠缺。种子的目标是达到全球一流水平,但张弛表示他不认为团队已经实现了这一目标,也未达成国内领导者的目标。
在 2024 年末,种子团队认为自己与 GPT-4o 处于同一水平,但在深度求索发布之后,团队意识到差距仍然存在。张弛加入时,整个团队正急切地转向强化学习,以弥补这一不足。
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
IREN приобретает Mirantis в рамках сделки полностью акциями $625M , чтобы расширить платформу AI Cloud
По данным BlockBeats, IREN Limited договорилась приобрести компанию по разработке ПО для облачной инфраструктуры Mirantis примерно за $625 миллионов в сделке с оплатой полностью акциями 5 мая. Приобретение направлено на расширение возможностей IREN в облачных сервисах на базе ИИ за счёт внедрения ПО и возможностей оркестрации для
GateNews5ч назад
Генеральный директор Anthropic: США рассматривают упрощённый процесс выпуска модели ИИ, конкуренты отстают на 1–3 месяца
Согласно 金十, генеральный директор Anthropic сообщил 5 мая, что, похоже, правительство США рассматривает возможность упрощения процесса выпуска моделей искусственного интеллекта. Глава компании отметил, что возможности других крупных AI-лабораторий могут отставать от Anthropic на 1–3
GateNews5ч назад
Команда SGLang завершила $100M раунд посевного финансирования на $400M оценку, Accel возглавляет
По данным Beating, команда, стоящая за открытым исходным кодом inference-движка SGLang, официально учредила RadixArk и завершила раунд seed-финансирования на $100 миллионов при оценке в $400 миллионов после получения средств. Accel возглавила раунд, а Spark Capital выступила со-ведущим инвестором. Полупроводниковые конкуренты Nvidia (через
GateNews5ч назад
OpenAI предоставляет 8 000 разработчикам увеличение лимита скорости Codex в 10 раз до 5 июня
По данным Beating, OpenAI отправила письма более чем 8 000 разработчикам, которые зарегистрировались на офлайн-мероприятие GPT-5.5 в Сан-Франциско, предоставив им 10-кратное увеличение лимитов скорости Codex, действующее немедленно вплоть до 5 июня. Все заявители получают награду независимо от того, получили ли они приглашение на мероприятие
GateNews6ч назад
Совместное предприятие OpenAI с Anthropic ведёт переговоры о покупке трёх компаний, предоставляющих услуги в сфере ИИ, 5 мая
По данным Jin 10, совместное предприятие OpenAI с Anthropic ведёт переговоры о приобретении трёх компаний, оказывающих AI-услуги, 5 мая. Сообщается, что в число целевых компаний входят инженерно-ориентированные фирмы, работающие в сфере AI-услуг
GateNews6ч назад
Anthropic во вторник запускает десять ИИ-агентов для финансовых услуг
Во вторник Anthropic запустила десять новых AI-агентов, предназначенных для выполнения задач в сфере финансовых услуг, включая подготовку презентаций для встреч с клиентами, проверку финансовой отчетности и эскалацию кейсов для комплаенс-проверки. Инструменты ориентированы на специалистов в банкинге, страховании, управлении активами и финтехе
GateNews6ч назад