Líderes da indústria na Conferência Beijing Zhiyuan debateram preocupações com a homogeneização de modelos de IA, à medida que as principais performances de avaliação dos modelos convergem cada vez mais e acredita-se que a distância entre modelos de código aberto e fechado seja apenas de 3-6 meses. Chen Weiguang, sócio-gerente da Bluerun Ventures, Wang Zhongyuan, diretor do Zhiyuan Research Institute, Wang He, fundador e CTO da Galaxy General, e Li Dahai, CEO da MiniMax, discutiram as fontes de valor de longo prazo na era dos grandes modelos. O painel abordou se modelos de IA e indústrias de inteligência incorporada estão caminhando para a homogeneização e onde existem vantagens competitivas duradouras. Observadores da indústria veem o talento como chave na competição de IA entre EUA e China, com a inteligência incorporada representando a oportunidade da China de alcançar momentos de ruptura comparáveis aos de AlphaGo e ChatGPT.

Líderes da indústria rejeitam preocupações com homogeneização na Conferência Zhiyuan

Wang Zhongyuan afirmou que, embora vários rankings de grandes modelos sejam desorientadores e as próprias classificações não sejam totalmente confiáveis, empresas de modelos que ousam fazer demonstrações ao vivo e entrar em cenários do mundo real demonstram confiança e conseguem encontrar loops de dados fechados em cenários reais. Ele disse que, no geral, a iteração de desempenho de grandes modelos ainda está muito longe de atingir um gargalo; as rotas técnicas não convergiram, e o futuro pode apresentar múltiplos padrões, incluindo “um superpoder com múltiplos jogadores fortes” ou “múltiplos gigantes lado a lado”. Wang caracterizou as alegações de que a indústria caminhará para a homogeneização como prematuras.

Wang He, fundador da Galaxy General, ampliou a discussão de grandes modelos de linguagem para inteligência incorporada. Ele afirmou que os próprios grandes modelos de linguagem ainda têm muitas variáveis, com maior incerteza nas capacidades de entendimento multimodal e de vídeo. Wang caracterizou a inteligência incorporada como atualmente “na fase de GPT-1 para GPT-2”, com a indústria apenas entrando em um período de aceleração.

Wang He descreveu o “fosso” competitivo da inteligência incorporada como um sistema completo que abrange fornecimento de dados de origem (dados sintéticos, dados humanos, dados de robôs), capacidades de refinamento de dados, iteração de hardware e co-design software-hardware, capacidades de fusão de throughput de modelos e capacidades finais de entrega de hardware. Ele caracterizou isso como um sistema abrangente de “guerreiro hexagonal”, afirmando que não existem produtos maduros desse tipo no mundo todo e que o fosso permanece extremamente profundo.

O CEO da MiniMax, Li Dahai, citou o sucesso comercial da Anthropic como evidência direta contra a homogeneização. Ele afirmou que grandes modelos não podem ser apenas “talentos em T”, com capacidades horizontais gerais, mas precisam ter forças verticais. Li explicou que a Anthropic se tornou um fenômeno global porque construiu capacidades de codificação a um nível incomparável sobre sua base geral de modelo, sustentando alta valorização e desempenho comercial impressionante.

Li declarou que os grandes modelos estão sendo internalizados na evolução de sistemas, e não como pontos técnicos isolados. Ele afirmou que a otimização futura dos modelos deve coordenar profundamente com cenários de aplicação, comparando isso ao design de um motor que precisa coordenar com o veículo inteiro — onde direções de otimização diferem completamente para carros de corrida F1 versus carros de compras de supermercado. Li disse que a universalidade técnica e a universalidade comercial devem ser separadas, e que uma boa comercialização exige otimização extrema específica de cenário, permitindo que cada empresa estabeleça seu próprio fosso ao encontrar a direção certa.

Galaxy General relata inteligência incorporada na fase de GPT-1 a GPT-2

Wang He compartilhou as práticas da Galaxy General com o paradigma WAM (World Action Model). Antes do surgimento do paradigma WAM, a Galaxy General usou 1 bilhão de frames de dados de simulação para verificar possibilidades de escala para habilidades de agarrar. A empresa desenvolveu o GRASP-VLA para alcançar agarramento zero-shot de objetos arbitrários, sem que modelos que dependam de dados reais de teleoperação atinjam, até hoje, níveis de desempenho equivalentes.

Wang explicou que o surgimento do paradigma WAM quebrou completamente o gargalo de dados para inteligência incorporada. Modelos tradicionais de VLA exigem dados com rótulos de ação e só podem depender de dados de robôs. O WAM foca em Ação como núcleo, realizando planejamento de ações no nível visual por meio de previsão futura sem exigir rótulos de ação. Isso significa que robôs podem aprender diretamente lógica comportamental a partir de vídeos humanos, transformando uma quantidade massiva de dados de vídeo humano em material de treinamento.

Wang afirmou que a Galaxy General publicou o primeiro artigo WAM do mundo em março de 2025, e que em abril o diretor do NVIDIA Embodied Intelligence Lab, Jim Fan, declarou que o objetivo final dos robôs é WAM. Wang caracterizou o pré-treinamento de inteligência incorporada como entrando em um período explosivo, sem limitações para aquisição de dados. Ele disse que, nos próximos dois anos, a inteligência incorporada vai plenamente concretizar seu momento GPT-3.5, com o ingresso sendo dezenas de milhões de horas de dados de alta qualidade e investimentos de bilhões de capital.

IA multimodal e inteligência incorporada abrem novas rotas de escala

Wang Zhongyuan revelou que, nas discussões da indústria do ano passado sobre falha da Scaling Law, a raiz estava na ansiedade de que “os dados de pré-treinamento da internet acabaram”. Nos últimos dois anos, pós-treinamento, otimização de raciocínio e autoevolução recursiva de Agentes trouxeram uma nova onda de melhorias de capacidade. Wang disse que isso representa não necessariamente aumentos de parâmetros nos próprios modelos, mas sim todo o sistema se tornando cada vez mais capaz, com a IA transformando-se de uma ferramenta de chat em uma ferramenta de execução.

Como instituto de pesquisa, o Zhiyuan explora a próxima curva de crescimento de inteligência. Nos últimos dois anos, o instituto verificou o paradigma de escala no campo multimodal, com a série Wujie Emu3 usando menos de 1% de dados multimodais e dezenas de bilhões de parâmetros já mostrando melhorias claras de desempenho. O instituto agora começou a avançar em direção a modelos fundacionais do mundo físico, explorando rotas de escala para world models.

Li Dahai propôs a “lei de densidade de conhecimento” da MiniMax: inteligência geral de grandes modelos = densidade de conhecimento × contagem de parâmetros. Ele revelou que, ao implantar modelos de borda para empresas automotivas no ano passado, só conseguiram atingir 1B de parâmetros; neste ano, fizeram upgrade para 4B, e no próximo ano provavelmente chegará a dezenas de bilhões. À medida que a tecnologia de quantização melhora e a densidade de conhecimento aumenta, modelos mais fortes após a quantização ocupam os mesmos recursos de antes, com a expansão de escala de modelos de borda apenas começando.

Li disse que muitas conclusões em fases da indústria têm vida útil muito curta, pois o desenvolvimento constantemente derruba percepções antigas. Ele afirmou que não apenas modelos de borda têm enorme espaço para crescimento, como também o processamento de longo contexto e a otimização de baixo consumo dos grandes modelos de linguagem ainda têm potencial de escala muito longe de ter sido totalmente explorado, com a indústria ainda distante de uma fase de convergência.

O painel identifica vantagens da cadeia de suprimentos e de talentos da China

Wang Zhongyuan disse que o desenvolvimento de tecnologia de IA segue o mesmo caminho da condução autônoma: necessariamente passa por um processo que vai do temor e do medo à adaptação e uso; depois, à criação de sistemas completos de governança e mecanismos de alocação de responsabilidades. Quando a tecnologia consegue trazer melhorias de produtividade de 3-5 vezes, sua popularização não pode ser bloqueada, e a humanidade, que já vivenciou múltiplas rodadas de ondas tecnológicas, encontrará soluções correspondentes de governança.

Li Dahai disse que a sociedade humana essencialmente evoluiu por meio de “aprender com os erros” — regras de segurança de aviões e limites de velocidade nas estradas têm, cada um, lições dolorosas por trás. A tecnologia de IA vai melhorar a eficiência de descobrir vulnerabilidades e corrigir problemas, reduzindo muito esse custo. A indústria enfatiza fortemente bases de segurança desde o estágio inicial, e as empresas assumem proativamente a responsabilidade social. Li disse que o padrão de aprender com os erros talvez seja difícil de evitar completamente, e que riscos de segurança frequentemente surgem de dimensões inesperadas, tornando a melhoria de regras por meio de lições uma realidade que precisa ser encarada.

Sobre as vantagens de diferenciação da China em IA, Wang Zhongyuan afirmou que a cadeia de suprimentos da China, vantagens de manufatura e amplo mercado doméstico são suficientes para incubar e catalisar a implementação de novas tecnologias, com inteligência incorporada e world models provavelmente se tornando áreas em que a China alcança liderança diferenciada.

Wang He afirmou com firmeza que inteligência incorporada é a oportunidade da China. Ele expressou convicção de que o “momento AlphaGo” e o “momento ChatGPT” da inteligência incorporada serão realizados na China, dizendo que, se o zero para um for concluído na China, o um para cem certamente amadurecerá na China.

Li Dahai acrescentou o fator subjacente mais central: a China possui o maior número de jovens talentos de IA mais inteligentes do mundo, que é a vantagem mais fundamental. Combinado com vantagens de cadeia de suprimentos, ecossistema e cenários, a China certamente terá avanços significativos no campo de IA.

Perguntas frequentes

Em que estágio a Galaxy General disse que a inteligência incorporada chegou?

O fundador e CTO da Galaxy General, Wang He, afirmou na Conferência Beijing Zhiyuan que a inteligência incorporada está atualmente “na fase de GPT-1 para GPT-2”, com a indústria apenas entrando em um período de aceleração. Wang disse que, nos próximos dois anos, a inteligência incorporada vai plenamente concretizar seu momento GPT-3.5, com o ingresso sendo dezenas de milhões de horas de dados de alta qualidade e investimentos de bilhões de capital.

Como os participantes do painel responderam às preocupações sobre homogeneização de modelos de IA?

O diretor do Zhiyuan Research Institute, Wang Zhongyuan, afirmou que, no geral, a iteração de desempenho de grandes modelos está muito longe de atingir um gargalo e que as rotas técnicas não convergiram, caracterizando alegações de homogeneização como prematuras. O CEO da MiniMax, Li Dahai, citou o sucesso da Anthropic em capacidades de codificação como evidência de que as empresas podem construir diferenciação por meio de forças verticais. Wang He, da Galaxy General, descreveu o fosso competitivo da inteligência incorporada como um sistema completo que abrange fornecimento de dados, iteração de hardware e capacidades de modelo, dizendo que não existem produtos maduros desse tipo no mundo.

Quais vantagens o painel identificou para o desenvolvimento de IA na China?

Os participantes do painel identificaram múltiplas vantagens da China. Wang Zhongyuan citou a cadeia de suprimentos da China, vantagens de manufatura e amplo mercado doméstico como suficientes para catalisar a implementação de novas tecnologias. Li Dahai disse que a China possui o maior número de jovens talentos de IA mais inteligentes do mundo como a vantagem mais fundamental. Wang He expressou convicção de que momentos de ruptura da inteligência incorporada comparáveis aos de AlphaGo e ChatGPT serão realizados na China, dizendo que, se o zero para um for concluído na China, o um para cem certamente amadurecerá na China.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

4h atrás

Modelo de IA U2 da Yunzhisheng fica entre os 8 primeiros no mundo e abre acesso para desenvolvedores

5h atrás

Marc Andreessen defende regulação direcionada para IA à medida que os EUA restringem o acesso ao modelo da Anthropic

9h atrás

Modelos de IA da China chegam a 18,42 trilhões de chamadas semanais de tokens, liderando globalmente pela sétima semana consecutiva

Dan Ives diz que a fusão entre SpaceX e Tesla é provável dentro de um ano

Lucas Bennett1h atrás

CEO da Microsoft Nadella Propõe Estrutura de IA de Capital Humano e Capital de Token

Oliver Grant4h atrás

CEO da MiniMax: a inteligência do modelo Edge corresponde ao GPT-4, e a tecnologia de agentes precisa de tempo

Oliver Grant6h atrás

CEO da Microsoft: a “cidadela” de IA é um ciclo de aprendizado em loop; as empresas não podem terceirizar o aprendizado

Market Whisper7h atrás

Raoul Pal: poder de computação substitui o capital, o gargalo da IA vai disparar uma rotação de fundos cripto com a “terceira onda”

Market Whisper9h atrás

Comentário

0/400

Sem comentários