Xiaohu demonstra um fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo 3D interativo

2026-05-10 09:16:05

O observador de IA chinês xiaohu compartilhou em 10 de maio um exemplo de fluxo de trabalho que combina GPT e Gemini 3.1 Pro: primeiro, usar GPT para gerar imagens e, depois, usar Gemini 3.1 Pro para transformar as imagens em conteúdo interativo 3D. Isso permite transformar qualquer tema de conhecimento em aplicações científicas rotacionáveis e acionáveis. O post do xiaohu no Twitter mostra exemplos como exibições de planetas em 3D, modelos científicos interativos etc., que são uma prática concreta de “fluxo de trabalho entre modelos” (multi-model workflow).

Estrutura do fluxo de trabalho: GPT cria imagens → Gemini 3.1 Pro as transforma em 3D

O design do fluxo de trabalho em duas etapas:

Etapa um: usar GPT (GPT-image-1 ou geração de imagens embutida no ChatGPT) para produzir imagens temáticas e fornecer base visual

Etapa dois: inserir a imagem no Gemini 3.1 Pro, que transforma imagens 2D em conteúdo interativo 3D

Formato de saída: objetos 3D que podem ser rotacionados, ampliados e interagidos dentro do navegador

Cenários de uso: educação científica, demonstração de produtos, conteúdos de conhecimento interativo

“Fluxo de trabalho entre modelos” é uma das principais tendências da camada de aplicações de IA em 2026 — um único modelo não é mais uma solução universal; desenvolvedores conectam partes mais fortes de modelos diferentes para criar aplicações que um único modelo não conseguiria fazer.

Demonstração específica: planetas em 3D, conteúdo científico interativo, site de vendas com robôs

Vários exemplos publicados pelo xiaohu em paralelo:

Exibição de planetas em 3D: sistema solar rotacionável ou modelo de um único planeta

Conteúdo científico interativo: transformar conhecimento abstrato em visualização 3D, adequado para fins educacionais

Site futuro de máquina de venda com robôs: usar GPT para gerar imagens e a plataforma Tripo 3D para criar uma página de demonstração

As características em comum desses exemplos é “geração visual + conversão interativa” — o GPT fica responsável pela visão criativa, enquanto o Gemini ou outras ferramentas 3D ficam responsáveis por transformar imagens estáticas em formatos interativos acionáveis. Tirado uma peça por vez, cada trecho isolado não é algo novo, mas ao conectar, a experiência final é melhor do que a de qualquer ferramenta única.

Significado: fluxo de trabalho entre modelos se torna gradualmente o modo de desenvolvimento principal

Implicações concretas para desenvolvedores:

Escolher a ferramenta certa é mais importante do que escolher o modelo mais forte — o GPT é forte em visual, o Gemini em compreensão multimodal, o Claude em long context, e cada um tem seu ponto forte

O custo de integração de APIs de modelos cai, e conectar vários modelos em nível de implementação fica viável

Aplicações novas provavelmente serão “pipelines entre modelos”, e não uma extensão de “um único modelo mais forte”

O valor deste caso não está em uma ruptura técnica, e sim em um modelo de design de fluxo de trabalho

Eventos específicos que podem ser acompanhados depois: se a capacidade de geração 3D do Gemini 3.1 Pro será anunciada oficialmente pela Google como função de produto em atividades posteriores; se o fluxo de trabalho entre modelos receberá suporte a templates padrão em frameworks como LangChain/LlamaIndex; e exemplos concretos de adoção em casos comerciais (como educação, e-commerce, marketing).

Este artigo, em que o xiaohu demonstra o fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo interativo 3D, surgiu pela primeira vez em 鏈新聞 ABMedia.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

05-10 06:21

O Google está testando contratações por meio de exames que permitem que engenheiros usem ferramentas de IA

05-10 04:13

A Microsoft disponibiliza como código aberto o modelo Phi-Ground 4B, superando o OpenAI Operator e o Claude em precisão ao clicar na tela

05-09 05:53

Google vai exigir uso de IA em entrevistas de código, lançando contratações com o Gemini ainda este ano

Disputa no Code Mode da Anthropic entre MCP e CLI: ferramentas travam o runtime, tokens caem de 150K para 2K

ChainNewsAbmedia05-10 09:15

Garry Tan: Eu agora raramente dou prompts para IA! O CEO da YC analisa os “fluxos de trabalho de IA com capitalização”

ChainNewsAbmedia05-10 06:44

Anthorpic 推 agente de IA exclusivo para finanças, insiders dizem que o Claude não consegue substituir analistas de forma crítica

ChainNewsAbmedia05-09 17:13

Nasce o ecossistema de Space Computing da NVIDIA, com o Space-1 Vera Rubin levando o poder de computação de IA do nível de data centers para o espaço

ChainNewsAbmedia05-09 16:13

Os braços cibernéticos do GPT-5.5-Cyber da OpenAI armam os defensores cibernéticos

Cryptonews05-08 18:42

Comentário

0/400

Sem comentários