O Google Anuncia o Gemini 3.5 com Tradução Ao Vivo para Voz em 70+ Idiomas

O Google anunciou o Gemini 3.5 Live Translate, um modelo de IA de tradução fala-a-fala que oferece tradução instantânea de voz para voz em mais de 70 idiomas. O lançamento amplia a disponibilidade de tradução em tempo real além dos requisitos anteriores para telefones ou fones de ouvido específicos da Google, oferecendo menor latência do que as implementações anteriores. A Google vem buscando tradução em tempo real há anos como um de seus experimentos pioneiros de aprendizado de máquina; antes disso, lançou tradução em tempo real limitada no app Translate no ano passado, antes do envio mais amplo de hoje.

Especificações Técnicas e Família do Modelo do Gemini 3.5 Live Translate

O Gemini 3.5 Live Translate faz parte da família de versões 3.5 lançada no I/O. Antes de hoje, a Google havia disponibilizado apenas a versão Flash, com um modelo Pro esperado para sair nas próximas semanas. O modelo de fala-a-fala é ajustado para detectar e traduzir automaticamente em mais de 70 idiomas.

De acordo com a Google, o Gemini 3.5 Live Translate é rápido o suficiente para acompanhar uma conversa normal, ficando apenas alguns segundos atrás do falante e, ao mesmo tempo, igualando entonação, ritmo e tom. O modelo gera saída de voz que soa mais como o falante original do que como um robô genérico. A Google lançou demonstrações gravadas sob condições controladas mostrando essas capacidades.

Implantação no Ecossistema da Google e Acesso do Usuário

O Gemini 3.5 Live Translate está sendo disponibilizado em várias partes do ecossistema da Google. O modelo está disponível no Google Meet para tradução de fala durante chamadas de vídeo. Os usuários podem acessar os recursos de tradução sem esperar períodos prolongados de verificação.

Acesso a API para Desenvolvedores e Recursos de Processamento Automático

Desenvolvedores podem começar a construir com um preview público na Gemini Live API ou no AI Studio. O modelo processa a fala continuamente e lida com todas as entradas multilíngues automaticamente, economizando que os desenvolvedores configurem manualmente as opções. Ele também filtra ruídos de fundo em ambientes movimentados.

FAQ

Quais idiomas o Gemini 3.5 Live Translate suporta?
O Gemini 3.5 Live Translate oferece suporte a mais de 70 idiomas com detecção e recursos de tradução automáticos.

Onde os usuários podem acessar o Gemini 3.5 Live Translate?
O modelo está sendo disponibilizado em várias partes do ecossistema da Google, incluindo o Google Meet para tradução de fala, e os desenvolvedores podem acessá-lo por meio do preview público da Gemini Live API ou do AI Studio.

Como o Gemini 3.5 Live Translate lida com o processamento de fala?
O modelo processa a fala continuamente, lida automaticamente com entradas multilíngues sem configuração manual e filtra ruídos de fundo em ambientes movimentados, ao mesmo tempo em que combina a entonação, o ritmo e o tom do falante.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários