A Google lança o Gemini 3.1 Flash TTS com expressão emocional melhorada e capacidades de múltiplos locutores

Mensagem da Gate News, 17 de abril — A Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto-para-voz com funcionalidades de expressão emocional e controlo melhoradas, a 15 de abril. O novo modelo será lançado progressivamente através de APIs para programadores, do Vertex AI empresarial e de ferramentas de colaboração.

As principais capacidades do modelo incluem etiquetas de áudio baseadas em linguagem natural para afinar a velocidade, a entoação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas vocais mais subtis. Uma funcionalidade de múltiplos locutores permite a geração simultânea de diálogos, possibilitando fluxos de conversa mais naturais adequados para podcasts, conteúdos áudio e assistentes de IA. O modelo suporta mais de 70 línguas e dialetos, refletindo acentos e expressões regionais para experiências de voz localizadas em todo o mundo.

A Google sublinhou o desempenho e a eficiência de custos, obtendo pontuações elevadas em benchmarks de avaliação humana às cegas, ao mesmo tempo que reduz os custos computacionais com a sua arquitetura Flash — concebida para adoção empresarial em grande escala. O áudio gerado inclui marcações de watermark SynthID para identificar conteúdos gerados por IA e combater a desinformação.

A medida reflete a intensificação da concorrência em interfaces de voz. A OpenAI está a combinar funcionalidades de voz em tempo real com IA conversacional para interações mais semelhantes às humanas, enquanto a Meta está a alargar investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria referem que, embora a atuação de alto nível e o trabalho criativo possam continuar, por agora, a ser impulsionados por humanos, os mercados de produção repetitiva e em grande escala poderão assistir a uma adoção gradual da IA na dobragem, na publicidade e nos setores de audiolivros.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Amazon e a OpenAI alargam a parceria: modelos disponíveis na Bedrock, fim da exclusividade da Microsoft

A OpenAI anunciou a 3 de maio a expansão da sua colaboração com os serviços de cloud da Amazon (AWS), com os modelos da OpenAI e os agentes de codificação Codex a serem disponibilizados aos clientes AWS através do Amazon Bedrock. De acordo com a CNBC, esta expansão é um passo-chave seguinte após o fim, no final de abril, do contrato de exclusividade de cloud entre a OpenAI e a Microsoft — a OpenAI passa de “Microsoft cloud-only” para um modelo de implementação multi-cloud. Entretanto, a AWS já concluiu a integração inicial dos produtos da OpenAI na plataforma Bedrock. Contexto: fim do acordo exclusivo OpenAI-Microsoft e extensão da licença de IP até 2032 No final de abril, a OpenAI e a Microsoft chegaram a um novo acordo: termina a estrutura original de “acesso exclusivo da Microsoft aos produtos e ao IP da OpenAI”, Op

ChainNewsAbmedia2h atrás

Investigadores Implementam a tecnologia DPN-LE para Editar Traços de Personalidade de IA, Editando Apenas 0,5% dos Neurónios

De acordo com a BlockBeats, a 3 de maio, o investigador de IA Brian Roemmele revelou que a sua Zero-Human Company implementou a tecnologia DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar com precisão

GateNews3h atrás

Claude verifica o relógio a cada 15 minutos após ganhar acesso à ferramenta de ajuste do tempo

De acordo com o programador Om Patel, o Claude AI começou a consultar frequentemente o relógio após obter acesso a uma ferramenta de tempo a 3 de maio, com o modelo a verificar de 15 em 15 minutos. A observação destaca que os grandes modelos de linguagem anteriormente não tinham perceção temporal nativa e não estavam cientes da hora atual ou

GateNews4h atrás

Founders Fund encerra um fundo flagship de 6 mil milhões de dólares, o maior desde o início, a 3 de maio

De acordo com a Bloomberg, a Founders Fund concluiu o levantamento para o seu mais recente fundo emblemático em 6 mil milhões de dólares a 3 de maio, excedendo significativamente o seu fundo anterior de cerca de 3,4 mil milhões de dólares. O fundo, cofundado pelo bilionário Peter Thiel, irá concentrar-se em sectores de elevado crescimento, incluindo inteligência

GateNews5h atrás

Última sondagem POLITICO: 45% dos norte-americanos dizem que o investimento em cripto é demasiado arriscado, 44% receiam que a IA esteja a avançar demasiado depressa

De acordo com uma sondagem da POLITICO, apesar de as indústrias de IA e de cripto estarem a injectar um financiamento político significativo nas eleições legislativas de meio de mandato dos EUA de 2026, o público americano continua em grande medida céptico em relação a ambos os sectores. O inquérito revelou que 45% dos americanos acreditam que investir em criptomoedas não tem valor de

GateNews5h atrás

OpenAI’s Sam Altman defende uma IPO em 2027, enquanto a Aliança Flare apoia a listagem no 4.º trimestre de 2026

A directora financeira da OpenAI, Sarah Friar, tem uma postura cautelosa em relação ao calendário do IPO de 2026, salientando que os contratos de capacidade de computação e centros de dados, avaliados em quase 1 bilião de dólares, superam em muito as receitas anuais atuais de 25 mil milhões de dólares; se o crescimento não conseguir cobrir os compromissos, o risco será penalizado por uma desvalorização pelo mercado. O desacordo em relação à abertura do capital defendida publicamente pelo CEO Sam Altman para o 4.º trimestre de 2026 torna-se evidente, com a Friar a inclinar-se para o adiamento para 2027 a fim de estabelecer disciplina financeira; a empresa emitiu várias declarações para negar a existência de divergências internas.

ChainNewsAbmedia7h atrás
Comentar
0/400
Nenhum comentário