Mensagem da Gate News, 17 de abril — A Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto-para-voz com funcionalidades de expressão emocional e controlo melhoradas, a 15 de abril. O novo modelo será lançado progressivamente através de APIs para programadores, do Vertex AI empresarial e de ferramentas de colaboração.
As principais capacidades do modelo incluem etiquetas de áudio baseadas em linguagem natural para afinar a velocidade, a entoação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas vocais mais subtis. Uma funcionalidade de múltiplos locutores permite a geração simultânea de diálogos, possibilitando fluxos de conversa mais naturais adequados para podcasts, conteúdos áudio e assistentes de IA. O modelo suporta mais de 70 línguas e dialetos, refletindo acentos e expressões regionais para experiências de voz localizadas em todo o mundo.
A Google sublinhou o desempenho e a eficiência de custos, obtendo pontuações elevadas em benchmarks de avaliação humana às cegas, ao mesmo tempo que reduz os custos computacionais com a sua arquitetura Flash — concebida para adoção empresarial em grande escala. O áudio gerado inclui marcações de watermark SynthID para identificar conteúdos gerados por IA e combater a desinformação.
A medida reflete a intensificação da concorrência em interfaces de voz. A OpenAI está a combinar funcionalidades de voz em tempo real com IA conversacional para interações mais semelhantes às humanas, enquanto a Meta está a alargar investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria referem que, embora a atuação de alto nível e o trabalho criativo possam continuar, por agora, a ser impulsionados por humanos, os mercados de produção repetitiva e em grande escala poderão assistir a uma adoção gradual da IA na dobragem, na publicidade e nos setores de audiolivros.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Amazon e a OpenAI alargam a parceria: modelos disponíveis na Bedrock, fim da exclusividade da Microsoft
A OpenAI anunciou a 3 de maio a expansão da sua colaboração com os serviços de cloud da Amazon (AWS), com os modelos da OpenAI e os agentes de codificação Codex a serem disponibilizados aos clientes AWS através do Amazon Bedrock. De acordo com a CNBC, esta expansão é um passo-chave seguinte após o fim, no final de abril, do contrato de exclusividade de cloud entre a OpenAI e a Microsoft — a OpenAI passa de “Microsoft cloud-only” para um modelo de implementação multi-cloud. Entretanto, a AWS já concluiu a integração inicial dos produtos da OpenAI na plataforma Bedrock.
Contexto: fim do acordo exclusivo OpenAI-Microsoft e extensão da licença de IP até 2032
No final de abril, a OpenAI e a Microsoft chegaram a um novo acordo: termina a estrutura original de “acesso exclusivo da Microsoft aos produtos e ao IP da OpenAI”, Op
ChainNewsAbmedia2h atrás
Investigadores Implementam a tecnologia DPN-LE para Editar Traços de Personalidade de IA, Editando Apenas 0,5% dos Neurónios
De acordo com a BlockBeats, a 3 de maio, o investigador de IA Brian Roemmele revelou que a sua Zero-Human Company implementou a tecnologia DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar com precisão
GateNews3h atrás
Claude verifica o relógio a cada 15 minutos após ganhar acesso à ferramenta de ajuste do tempo
De acordo com o programador Om Patel, o Claude AI começou a consultar frequentemente o relógio após obter acesso a uma ferramenta de tempo a 3 de maio, com o modelo a verificar de 15 em 15 minutos. A observação destaca que os grandes modelos de linguagem anteriormente não tinham perceção temporal nativa e não estavam cientes da hora atual ou
GateNews4h atrás
Founders Fund encerra um fundo flagship de 6 mil milhões de dólares, o maior desde o início, a 3 de maio
De acordo com a Bloomberg, a Founders Fund concluiu o levantamento para o seu mais recente fundo emblemático em 6 mil milhões de dólares a 3 de maio, excedendo significativamente o seu fundo anterior de cerca de 3,4 mil milhões de dólares. O fundo, cofundado pelo bilionário Peter Thiel, irá concentrar-se em sectores de elevado crescimento, incluindo inteligência
GateNews5h atrás
Última sondagem POLITICO: 45% dos norte-americanos dizem que o investimento em cripto é demasiado arriscado, 44% receiam que a IA esteja a avançar demasiado depressa
De acordo com uma sondagem da POLITICO, apesar de as indústrias de IA e de cripto estarem a injectar um financiamento político significativo nas eleições legislativas de meio de mandato dos EUA de 2026, o público americano continua em grande medida céptico em relação a ambos os sectores. O inquérito revelou que 45% dos americanos acreditam que investir em criptomoedas não tem valor de
GateNews5h atrás
OpenAI’s Sam Altman defende uma IPO em 2027, enquanto a Aliança Flare apoia a listagem no 4.º trimestre de 2026
A directora financeira da OpenAI, Sarah Friar, tem uma postura cautelosa em relação ao calendário do IPO de 2026, salientando que os contratos de capacidade de computação e centros de dados, avaliados em quase 1 bilião de dólares, superam em muito as receitas anuais atuais de 25 mil milhões de dólares; se o crescimento não conseguir cobrir os compromissos, o risco será penalizado por uma desvalorização pelo mercado. O desacordo em relação à abertura do capital defendida publicamente pelo CEO Sam Altman para o 4.º trimestre de 2026 torna-se evidente, com a Friar a inclinar-se para o adiamento para 2027 a fim de estabelecer disciplina financeira; a empresa emitiu várias declarações para negar a existência de divergências internas.
ChainNewsAbmedia7h atrás