O responsável máximo de IA da Tencent, Yao Shunyu, defende o ritmo de desenvolvimento numa conferência a 5 de junho

O principal cientista de IA da Tencent, Yao Shunyu, fez a sua primeira aparição pública a 5 de junho, na Conferência de Aplicações da Indústria de IA da Tencent Cloud, onde falou sobre o grande modelo de linguagem Hunyuan 3 da empresa e respondeu às críticas de que a Tencent ficou para trás no desenvolvimento de IA. Yao, que se juntou à Tencent depois da OpenAI e lidera a equipa do modelo Hunyuan, participou num diálogo com o Vice-Presidente Executivo Sénior da Tencent, Tang Daosheng, abordando a estratégia dos modelos de IA, o desenvolvimento de produtos e o futuro dos agentes inteligentes. O cientista de 28 anos abordou o cepticismo externo caracterizando a concorrência em IA como uma maratona, e não como um sprint, afirmando que o mundo não pode depender apenas do ChatGPT como uma única aplicação dominante.

Yao Shunyu Detalha a Abordagem de Desenvolvimento do Hunyuan 3

Yao descreveu três melhorias centrais no Hunyuan 3 durante o diálogo na conferência. "Na verdade, não há nenhum segredo. Construir modelos grandes hoje é, em certa medida, uma tarefa bastante aborrecida. Devíamos concentrar-nos em acertar a infraestrutura, em acertar os dados — a parte do algoritmo é relativamente simples", afirmou Yao. As melhorias incluíram a reconstrução de toda a infraestrutura para treino pré e aprendizagem por reforço, uma atualização abrangente dos sistemas de dados e de avaliação com maior ênfase em definir problemas reais e melhorar a qualidade dos dados, e a tomada de decisões orientadas por gosto na contratação, no ritmo de desenvolvimento do modelo e nas compensações.

Yao, que propôs a arquitetura ReAct durante a sua investigação de doutoramento, salientou que muitas decisões no desenvolvimento de modelos são "orientadas por gosto", e não baseadas em fórmulas. "Muitas decisões são, na verdade, muito orientadas por gosto", repetiu várias vezes durante o diálogo. A sua tese de doutoramento de 2019, intitulada "From Next Token Prediction to Digital Automation" (Da Predição do Próximo Token à Automatização Digital), explorou agentes de linguagem durante a era do GPT-2. "Naquela altura ainda era a era do GPT-2, e nem sequer conseguia gerar parágrafos contínuos — havia muitos pontos ásperos", recordou Yao. "Mas na altura senti que o GPT era uma coisa muito elegante, e gerar a saída do próximo token é uma tarefa extremamente simples, mas também muito geral. Eu acreditava que um dia teria o potencial não só para produzir o próximo token, mas para automatizar tudo neste mundo."

Yao identificou os agentes de programação como a forma mais essencial de agentes inteligentes porque são completos de Turing. Enunciou a estratégia em três partes da Tencent para o desenvolvimento de agentes: enfatizar um desenho de sistema abrangente, tirar totalmente partido dos dados que fluem de volta das linhas de produto e manter imaginação suficiente para exploração. Quanto à estratégia de desenvolvimento de modelos, Yao partilhou três direções: manter sistemas de dados abrangentes apesar de a codificação se tornar a via mais importante, tirar partido dos dados de feedback das linhas de produto através de experiência de co-design e explorar novos paradigmas na evolução da tecnologia e do produto.

Relativamente às trocas entre custo e desempenho, Yao afirmou que o desempenho é a pré-condição para a relação custo-eficácia. "Muita gente descobre que usar um modelo forte é mais barato do que usar um modelo fraco, porque faz as coisas certas mais depressa", explicou. Sugeriu que atingir um desempenho forte com modelos relativamente menores e manter um desempenho robusto na maioria das tarefas "poderá ser mais valioso na China de hoje".

A Tencent Define Requisitos Organizacionais para AGI

Yao apresentou o conceito de "a segunda metade da IA" num post de blogue no ano passado, um termo agora amplamente usado na indústria. Explicou que o núcleo deste conceito está numa mudança fundamental: enquanto nas últimas décadas do desenvolvimento de IA se procuraram "métodos", agora que as metodologias amadureceram, "encontrar bons problemas" tornou-se mais difícil. "No passado inventámos métodos como o AlphaGo para jogar Go, mas só conseguia jogar xadrez. Criámos um modelo especial para tradução, mas só conseguia fazer tradução. Mas com treino pré e treino pós, agora temos um martelo universal que consegue atingir qualquer prego", explicou Yao. "A coisa mais difícil é, na verdade, encontrar bons problemas para resolver."

Yao afirmou que a vasta carteira de produtos e cenários da Tencent fornecem fontes autênticas de problemas para a tecnologia de IA, que foi a sua segunda razão para se juntar à empresa. Identificou a cultura como a sua principal motivação. "Quando falei pela primeira vez com o Presidente Tang e outros líderes executivos, a minha primeira impressão foi que toda a gente era muito honesta sobre o que estamos a fazer bem e sobre o que não estamos a fazer bem — muito direto, sem cobrir as coisas", disse Yao. "No geral, a Tencent funciona com base na confiança, e não em métricas. Esta cultura franca, sem grande ego e pragmática, juntamente com o compromisso com o longotermismo, é crucial para construir uma organização de IA a longo prazo."

Segundo Yao, a tarefa mais importante na segunda metade da IA é estabelecer uma organização baseada em AGI a longo prazo na China. Essa organização exige construir um "triângulo equilibrado": tecnologia fundamental sólida, produtos que criam valor e um espírito de exploração na fronteira.

Yao e Tang Abordam Críticas sobre Ritmo na Conferência

Yao afirmou durante o diálogo que a IA é um jogo de longo prazo e que a segunda metade acabou de começar. "Eu não acho que o ChatGPT e o Claude Code vão ser as únicas superaplicações — isso seria um mundo muito sombrio. Hoje é como a década de 1970, quando os PCs apareceram pela primeira vez — ainda há muitas, muitas coisas que precisam de ser feitas", disse Yao. Previu que o futuro se tornará mais diverso em vez de mais singular, apontando que "os agentes de codificação estão apenas a começar, e a inteligência multimodal, incorporada — muitas, muitas coisas novas — estão apenas a começar a acontecer."

"No passado, os modelos e os produtos passaram por muita exploração e deram muitas voltas. Acho que isso é normal", afirmou Yao. "O mais importante é saber se conseguimos encarar-nos a nós próprios com honestidade, se conseguimos ser reais, se conseguimos ver feedback e depois mudar, e manter a paciência. Isso é o mais importante na segunda metade."

Tang Daosheng afirmou que a Tencent acolhe críticas e sugestões externas. "Somos uma empresa com formatos de negócio muito diversos. Às vezes podemos ser rápidos, às vezes lentos, e falharemos em algumas áreas. Mas isto é uma maratona, e acreditamos que os modelos irão iterar continuamente, as necessidades dos utilizadores vão continuar a mudar e novos formatos de produto irão surgir", disse Tang.

PERGUNTAS FREQUENTES

O que é que Yao Shunyu anunciou na conferência da Tencent de 5 de junho?

Yao Shunyu, o Chief AI Scientist da Tencent, discutiu a abordagem de desenvolvimento do grande modelo de linguagem Hunyuan 3 na Conferência de Aplicações da Indústria de IA da Tencent Cloud, a 5 de junho. Detalhou três melhorias centrais: reconstruir a infraestrutura para treino pré e aprendizagem por reforço, atualizar os sistemas de dados e de avaliação e implementar tomada de decisão orientada por gosto no recrutamento e no desenvolvimento do modelo. Yao respondeu ainda às críticas sobre o ritmo de desenvolvimento de IA da Tencent ao caracterizar a concorrência como uma maratona, e não como um sprint.

Porque é que Yao Shunyu se juntou à Tencent depois da OpenAI?

Yao afirmou durante o diálogo na conferência que a cultura foi a sua principal razão para se juntar à Tencent. Descreveu a sua primeira impressão sobre a liderança da Tencent como "muito honesta" e "direta, sem cobrir as coisas". Yao explicou que a Tencent opera com base na confiança, e não em métricas, com uma "cultura franca, sem grande ego e pragmática" e um compromisso com o longotermismo que considera crucial para construir uma organização de IA a longo prazo. A sua segunda razão foi a vasta carteira de produtos da Tencent, que fornece fontes autênticas de problemas para o desenvolvimento da tecnologia de IA.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário