O Google anunciou o Gemini 3.5 Live Translate, um modelo de IA de tradução fala-a-fala que oferece tradução instantânea de voz para voz em mais de 70 idiomas. O lançamento amplia a disponibilidade de tradução em tempo real além dos requisitos anteriores para telefones ou fones de ouvido específicos da Google, oferecendo menor latência do que as implementações anteriores. A Google vem buscando tradução em tempo real há anos como um de seus experimentos pioneiros de aprendizado de máquina; antes disso, lançou tradução em tempo real limitada no app Translate no ano passado, antes do envio mais amplo de hoje.
Especificações Técnicas e Família do Modelo do Gemini 3.5 Live Translate
O Gemini 3.5 Live Translate faz parte da família de versões 3.5 lançada no I/O. Antes de hoje, a Google havia disponibilizado apenas a versão Flash, com um modelo Pro esperado para sair nas próximas semanas. O modelo de fala-a-fala é ajustado para detectar e traduzir automaticamente em mais de 70 idiomas.
De acordo com a Google, o Gemini 3.5 Live Translate é rápido o suficiente para acompanhar uma conversa normal, ficando apenas alguns segundos atrás do falante e, ao mesmo tempo, igualando entonação, ritmo e tom. O modelo gera saída de voz que soa mais como o falante original do que como um robô genérico. A Google lançou demonstrações gravadas sob condições controladas mostrando essas capacidades.
Implantação no Ecossistema da Google e Acesso do Usuário
O Gemini 3.5 Live Translate está sendo disponibilizado em várias partes do ecossistema da Google. O modelo está disponível no Google Meet para tradução de fala durante chamadas de vídeo. Os usuários podem acessar os recursos de tradução sem esperar períodos prolongados de verificação.
Acesso a API para Desenvolvedores e Recursos de Processamento Automático
Desenvolvedores podem começar a construir com um preview público na Gemini Live API ou no AI Studio. O modelo processa a fala continuamente e lida com todas as entradas multilíngues automaticamente, economizando que os desenvolvedores configurem manualmente as opções. Ele também filtra ruídos de fundo em ambientes movimentados.
FAQ
Quais idiomas o Gemini 3.5 Live Translate suporta?
O Gemini 3.5 Live Translate oferece suporte a mais de 70 idiomas com detecção e recursos de tradução automáticos.
Onde os usuários podem acessar o Gemini 3.5 Live Translate?
O modelo está sendo disponibilizado em várias partes do ecossistema da Google, incluindo o Google Meet para tradução de fala, e os desenvolvedores podem acessá-lo por meio do preview público da Gemini Live API ou do AI Studio.
Como o Gemini 3.5 Live Translate lida com o processamento de fala?
O modelo processa a fala continuamente, lida automaticamente com entradas multilíngues sem configuração manual e filtra ruídos de fundo em ambientes movimentados, ao mesmo tempo em que combina a entonação, o ritmo e o tom do falante.