De acordo com a Beating, Thinking Machines, o laboratório fundado pela ex-CTO da OpenAI Mira Murati, lançou uma prévia de pesquisa de seu modelo Interaction, com processamento nativo em tempo real de áudio e vídeo e micro-respostas de 200 milissegundos. O modelo permite ouvir, ver e falar simultaneamente, com suporte a interrupções em tempo real por parte do usuário.
O modelo TML-Interaction-Small usa uma arquitetura MoE de 276 bilhões de parâmetros, com 12 bilhões de parâmetros ativados por inferência. Os dados oficiais mostram uma latência de alternância de turnos de fala de 0,40 segundos e uma pontuação FD-bench V1.5 de 77,8, ambas superando GPT-Realtime-2.0 e Gemini 3.1 Flash Live. Acesso limitado à prévia está planejado para os próximos meses.
Related News
A OpenAI também segue o modelo de consultoria da Palantir? Investe US$ 4 bilhões para criar uma empresa independente e envia a FDE para realizar uma integração profunda do trabalho com IA nas empresas
A OpenAI lança uma empresa de implantação de US$ 4 bilhões: incorpora a Tomoro
Funcionários da OpenAI vendem ações de US$ 6,6 bilhões, com lucro médio de US$ 11 milhões por pessoa