Глава AI-команды Tencent Яо Шунью защищает темпы разработки на конференции 5 июня

Главный специалист по ИИ Tencent Яо Шуньюй впервые публично выступил 5 июня на конференции Tencent Cloud AI Industry Application Conference, где подробно обсудил крупную языковую модель компании Hunyuan 3 и ответил на критику того, что Tencent отстала в развитии ИИ. Яо, который пришёл в Tencent из OpenAI и руководит командой Hunyuan, принял участие в диалоге с старшим исполнительным вице-президентом Tencent Тан Даошэном, обсудив стратегию ИИ-моделей, разработку продуктов и будущее интеллектуальных агентов. 28-летний учёный обратился к внешнему скепсису, охарактеризовав конкуренцию в ИИ как марафон, а не спринт, и заявив, что миру нельзя полагаться только на ChatGPT как на единственное доминирующее приложение.

Подробности о подходе к разработке Hunyuan 3 от Яо Шуньюя

На конференционном диалоге Яо описал три ключевых улучшения в Hunyuan 3. «На самом деле нет никакого секрета. Создание больших моделей сегодня в некотором смысле довольно утомительная задача. Нам нужно правильно выстроить инфраструктуру, правильно наладить данные — алгоритмическая часть относительно проста», — заявил Яо. Улучшения включали полностью заново выстроив всю инфраструктуру для предобучения и обучения с подкреплением, всестороннюю модернизацию систем данных и оценивания с большим акцентом на определение реальных задач и повышение качества данных, а также принятие решений, основанных на «вкусе», в вопросах найма, ритма разработки модели и компромиссов.

Яо, который предложил архитектуру ReAct в ходе докторского исследования, подчеркнул, что многие решения в разработке моделей являются «основанными на вкусе», а не выведенными по формуле. «Очень многое из того, что мы решаем, на самом деле завязано именно на вкус», — повторял он несколько раз в ходе диалога. Его докторская диссертация 2019 года под названием «From Next Token Prediction to Digital Automation» изучала языковых агентов в эпоху GPT-2. «Тогда ещё была эра GPT-2, и он даже не мог генерировать непрерывные абзацы — было много шероховатостей», — вспоминал Яо. «Но я тогда почувствовал, что GPT — это очень элегантная вещь, и выдача следующего токена — это крайне простая, но при этом очень универсальная задача. Я считал, что однажды это позволит не только выдавать следующий токен, но и автоматизировать всё в этом мире».

Яо назвал кодирующих агентов наиболее необходимой формой интеллектуальных агентов, потому что они Тьюринг-полны. Он обозначил трёхчастную стратегию Tencent для развития агентов: делать упор на комплексный системный дизайн, полностью использовать данные, возвращающиеся из продуктовых направлений, и сохранять достаточное воображение для исследования. Что касается стратегии разработки моделей, Яо поделился тремя направлениями: поддерживать всеобъемлющие системы данных, даже когда кодирование становится самым важным треком; использовать данные обратной связи от продуктовых направлений через опыт совместного проектирования; и исследовать следующие парадигмы в эволюции технологий и продуктов.

Говоря о компромиссах «стоимость — эффективность», Яо заявил, что производительность является предпосылкой рентабельности. «Многие считают, что использовать сильную модель дешевле, чем слабую, потому что она делает всё правильно быстрее», — объяснил он. Он предположил, что добиться сильной производительности относительно меньшими моделями и сохранять надёжную производительность по большинству задач «может быть более ценно в сегодняшнем Китае».

Tencent определяет организационные требования для AGI

Яо ввёл концепцию «вторая половина ИИ» в блоге год назад — теперь этот термин широко используется в отрасли. Он объяснил, что суть этой идеи заключается в фундаментальном сдвиге: если в прошлые десятилетия разработки ИИ упор делался на «поиск методов», то теперь, когда методологии созрели, «находить хорошие задачи» стало сложнее. «Раньше мы изобретали методы вроде AlphaGo, чтобы играть в Го, но он мог только играть в шахматы. Мы сделали специальную модель для перевода, но она могла только переводить. Но с предобучением и постобучением у нас теперь есть универсальный молот, который может забивать любой гвоздь», — объяснил Яо. «Самое сложное — всё-таки находить хорошие задачи, которые стоит решать».

Яо заявил, что обширный портфель продуктов Tencent и сценарии дают подлинные источники задач для технологий ИИ — это была его вторая причина присоединиться к компании. Он назвал культуру своей главной мотивацией. «Когда я впервые поговорил с президентом Тан и другими руководителями высшего звена, первое впечатление было таким: все очень честно говорят о том, что мы делаем хорошо, и о том, в чём мы не сильны — предельно прямо, без прикрывания проблем», — сказал Яо. «В целом Tencent работает на основе доверия, а не метрик. Такая искренняя, малогероичная и прагматичная культура, вместе с приверженностью долгосрочности, критически важна для построения долгосрочной AI-организации».

По словам Яо, самая важная задача «второй половины ИИ» — создать долгосрочную AGI-ориентированную организацию в Китае. Для неё нужно построить «сбалансированный треугольник»: прочную базовую технологию, продукты, создающие ценность, и дух исследования переднего края.

Яо и Тан отвечают на критику темпов на конференции

В ходе диалога Яо заявил, что ИИ — это игра на долгую дистанцию и вторая половина только началась. «Я не думаю, что ChatGPT и Claude Code будут единственными суперприложениями — это был бы очень мрачный мир. Сегодня это похоже на 1970-е, когда впервые появились персональные компьютеры: тогда ещё нужно было сделать очень, очень многое», — сказал Яо. Он спрогнозировал, что будущее станет более разнообразным, а не более единым, отметив: «кодирующие агенты только начинают, а мультимодальный, воплощённый интеллект — многие, многие новое как раз только начинает происходить».

«Раньше модели и продукты проходили через много поисков и делали множество крюков. Я думаю, что это нормально», — сказал Яо. «Самое важное — можем ли мы по-настоящему честно смотреть на себя, быть реальными, видеть обратную связь и затем меняться, а также сохранять терпение. Это самое главное во второй половине».

Тан Даошэн заявил, что Tencent приветствует внешнюю критику и предложения. «Мы — компания с очень разнообразными форматами бизнеса. Иногда мы можем быть быстрыми, иногда медленными, и в каких-то областях мы будем терпеть неудачи. Но это марафон, и мы считаем, что модели будут постоянно итеративно развиваться, потребности пользователей будут продолжать меняться, и будут появляться новые форматы продуктов», — сказал Тан.

FAQ

Что Яо Шуньюй объявил на конференции Tencent 5 июня?

Яо Шуньюй, главный специалист по ИИ Tencent, обсудил подход к разработке крупной языковой модели Hunyuan 3 на Tencent Cloud AI Industry Application Conference 5 июня. Он подробно описал три ключевых улучшения: полностью заново выстроив инфраструктуру для предобучения и обучения с подкреплением, модернизацию систем данных и оценивания, а также внедрение решений, основанных на «вкусе», в найме и разработке моделей. Яо также ответил на критику по поводу темпов развития ИИ в Tencent, охарактеризовав конкуренцию как марафон, а не спринт.

Почему Яо Шуньюй перешёл в Tencent из OpenAI?

Во время конференционного диалога Яо заявил, что культура была его главной причиной присоединиться к Tencent. Он описал первое впечатление от руководства Tencent как «очень честное» и «прямолинейное, без попыток что-то скрыть». Яо объяснил, что Tencent работает на основе доверия, а не метрик, с «откровенной, малогероичной и прагматичной культурой» и приверженностью долгосрочности, которую он считает критически важной для построения долгосрочной AI-организации. Его второстепенная причина — обширный портфель продуктов Tencent, который даёт подлинные источники задач для развития технологий ИИ.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев