O principal cientista de IA da Tencent, Yao Shunyu, fez a sua primeira aparição pública a 5 de junho, na Conferência de Aplicações da Indústria de IA da Tencent Cloud, onde falou sobre o grande modelo de linguagem Hunyuan 3 da empresa e respondeu às críticas de que a Tencent ficou para trás no desenvolvimento de IA. Yao, que se juntou à Tencent depois da OpenAI e lidera a equipa do modelo Hunyuan, participou num diálogo com o Vice-Presidente Executivo Sénior da Tencent, Tang Daosheng, abordando a estratégia dos modelos de IA, o desenvolvimento de produtos e o futuro dos agentes inteligentes. O cientista de 28 anos abordou o cepticismo externo caracterizando a concorrência em IA como uma maratona, e não como um sprint, afirmando que o mundo não pode depender apenas do ChatGPT como uma única aplicação dominante.
Yao descreveu três melhorias centrais no Hunyuan 3 durante o diálogo na conferência. "Na verdade, não há nenhum segredo. Construir modelos grandes hoje é, em certa medida, uma tarefa bastante aborrecida. Devíamos concentrar-nos em acertar a infraestrutura, em acertar os dados — a parte do algoritmo é relativamente simples", afirmou Yao. As melhorias incluíram a reconstrução de toda a infraestrutura para treino pré e aprendizagem por reforço, uma atualização abrangente dos sistemas de dados e de avaliação com maior ênfase em definir problemas reais e melhorar a qualidade dos dados, e a tomada de decisões orientadas por gosto na contratação, no ritmo de desenvolvimento do modelo e nas compensações.
Yao, que propôs a arquitetura ReAct durante a sua investigação de doutoramento, salientou que muitas decisões no desenvolvimento de modelos são "orientadas por gosto", e não baseadas em fórmulas. "Muitas decisões são, na verdade, muito orientadas por gosto", repetiu várias vezes durante o diálogo. A sua tese de doutoramento de 2019, intitulada "From Next Token Prediction to Digital Automation" (Da Predição do Próximo Token à Automatização Digital), explorou agentes de linguagem durante a era do GPT-2. "Naquela altura ainda era a era do GPT-2, e nem sequer conseguia gerar parágrafos contínuos — havia muitos pontos ásperos", recordou Yao. "Mas na altura senti que o GPT era uma coisa muito elegante, e gerar a saída do próximo token é uma tarefa extremamente simples, mas também muito geral. Eu acreditava que um dia teria o potencial não só para produzir o próximo token, mas para automatizar tudo neste mundo."
Yao identificou os agentes de programação como a forma mais essencial de agentes inteligentes porque são completos de Turing. Enunciou a estratégia em três partes da Tencent para o desenvolvimento de agentes: enfatizar um desenho de sistema abrangente, tirar totalmente partido dos dados que fluem de volta das linhas de produto e manter imaginação suficiente para exploração. Quanto à estratégia de desenvolvimento de modelos, Yao partilhou três direções: manter sistemas de dados abrangentes apesar de a codificação se tornar a via mais importante, tirar partido dos dados de feedback das linhas de produto através de experiência de co-design e explorar novos paradigmas na evolução da tecnologia e do produto.
Relativamente às trocas entre custo e desempenho, Yao afirmou que o desempenho é a pré-condição para a relação custo-eficácia. "Muita gente descobre que usar um modelo forte é mais barato do que usar um modelo fraco, porque faz as coisas certas mais depressa", explicou. Sugeriu que atingir um desempenho forte com modelos relativamente menores e manter um desempenho robusto na maioria das tarefas "poderá ser mais valioso na China de hoje".
Yao apresentou o conceito de "a segunda metade da IA" num post de blogue no ano passado, um termo agora amplamente usado na indústria. Explicou que o núcleo deste conceito está numa mudança fundamental: enquanto nas últimas décadas do desenvolvimento de IA se procuraram "métodos", agora que as metodologias amadureceram, "encontrar bons problemas" tornou-se mais difícil. "No passado inventámos métodos como o AlphaGo para jogar Go, mas só conseguia jogar xadrez. Criámos um modelo especial para tradução, mas só conseguia fazer tradução. Mas com treino pré e treino pós, agora temos um martelo universal que consegue atingir qualquer prego", explicou Yao. "A coisa mais difícil é, na verdade, encontrar bons problemas para resolver."
Yao afirmou que a vasta carteira de produtos e cenários da Tencent fornecem fontes autênticas de problemas para a tecnologia de IA, que foi a sua segunda razão para se juntar à empresa. Identificou a cultura como a sua principal motivação. "Quando falei pela primeira vez com o Presidente Tang e outros líderes executivos, a minha primeira impressão foi que toda a gente era muito honesta sobre o que estamos a fazer bem e sobre o que não estamos a fazer bem — muito direto, sem cobrir as coisas", disse Yao. "No geral, a Tencent funciona com base na confiança, e não em métricas. Esta cultura franca, sem grande ego e pragmática, juntamente com o compromisso com o longotermismo, é crucial para construir uma organização de IA a longo prazo."
Segundo Yao, a tarefa mais importante na segunda metade da IA é estabelecer uma organização baseada em AGI a longo prazo na China. Essa organização exige construir um "triângulo equilibrado": tecnologia fundamental sólida, produtos que criam valor e um espírito de exploração na fronteira.
Yao afirmou durante o diálogo que a IA é um jogo de longo prazo e que a segunda metade acabou de começar. "Eu não acho que o ChatGPT e o Claude Code vão ser as únicas superaplicações — isso seria um mundo muito sombrio. Hoje é como a década de 1970, quando os PCs apareceram pela primeira vez — ainda há muitas, muitas coisas que precisam de ser feitas", disse Yao. Previu que o futuro se tornará mais diverso em vez de mais singular, apontando que "os agentes de codificação estão apenas a começar, e a inteligência multimodal, incorporada — muitas, muitas coisas novas — estão apenas a começar a acontecer."
"No passado, os modelos e os produtos passaram por muita exploração e deram muitas voltas. Acho que isso é normal", afirmou Yao. "O mais importante é saber se conseguimos encarar-nos a nós próprios com honestidade, se conseguimos ser reais, se conseguimos ver feedback e depois mudar, e manter a paciência. Isso é o mais importante na segunda metade."
Tang Daosheng afirmou que a Tencent acolhe críticas e sugestões externas. "Somos uma empresa com formatos de negócio muito diversos. Às vezes podemos ser rápidos, às vezes lentos, e falharemos em algumas áreas. Mas isto é uma maratona, e acreditamos que os modelos irão iterar continuamente, as necessidades dos utilizadores vão continuar a mudar e novos formatos de produto irão surgir", disse Tang.
O que é que Yao Shunyu anunciou na conferência da Tencent de 5 de junho?
Yao Shunyu, o Chief AI Scientist da Tencent, discutiu a abordagem de desenvolvimento do grande modelo de linguagem Hunyuan 3 na Conferência de Aplicações da Indústria de IA da Tencent Cloud, a 5 de junho. Detalhou três melhorias centrais: reconstruir a infraestrutura para treino pré e aprendizagem por reforço, atualizar os sistemas de dados e de avaliação e implementar tomada de decisão orientada por gosto no recrutamento e no desenvolvimento do modelo. Yao respondeu ainda às críticas sobre o ritmo de desenvolvimento de IA da Tencent ao caracterizar a concorrência como uma maratona, e não como um sprint.
Porque é que Yao Shunyu se juntou à Tencent depois da OpenAI?
Yao afirmou durante o diálogo na conferência que a cultura foi a sua principal razão para se juntar à Tencent. Descreveu a sua primeira impressão sobre a liderança da Tencent como "muito honesta" e "direta, sem cobrir as coisas". Yao explicou que a Tencent opera com base na confiança, e não em métricas, com uma "cultura franca, sem grande ego e pragmática" e um compromisso com o longotermismo que considera crucial para construir uma organização de IA a longo prazo. A sua segunda razão foi a vasta carteira de produtos da Tencent, que fornece fontes autênticas de problemas para o desenvolvimento da tecnologia de IA.
Notícias relacionadas
A Anthropic defende uma desaceleração global da IA perante o risco de melhoria recursiva e autoaperfeiçoamento
O CEO da Google DeepMind prevê a chegada da AGI até 2030 numa conferência na Stanford
A crise de custos da IA alimenta novas comparações com uma bolha dot-com
A IA da Anthropic, Claude, escreve 80% do código de produção até maio de 2026
Engenheiros da Amazon prestam declarações contra centros de dados de IA face a 30.000 despedimentos