OpenAI выпускает три голосовые модели в Realtime API; GPT-Realtime-2 предлагает контекстное окно на 128K

2026-05-08 01:25:27

Beating: OpenAI выпустила три голосовые модели в своей Realtime API: GPT-Realtime-2 для голосового общения с рассуждениями, GPT-Realtime-Translate для перевода в реальном времени и GPT-Realtime-Whisper для потоковой транскрибации. GPT-Realtime-2 — первая голосовая модель OpenAI с возможностями рассуждений на уровне GPT-5: она расширяет контекстное окно с 32K до 128K токенов и поддерживает до 1-2 часов плотного разговора.

GPT-Realtime-2 улучшила на 15,2% результат в бенчмарке Big Bench Audio и на 13,8% — в Audio MultiChallenge по сравнению с GPT-Realtime-1.5. GPT-Realtime-Translate поддерживает 70+ входных языков и перевод на 13 выходных языков. Цены: GPT-Realtime-2 — $32 за 32k входных токенов и $64 за 128k выходных токенов; Translate — $0,034 за минуту; Whisper — $0,017 за минуту.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-08 00:42

OpenAI запускает функцию безопасных доверенных контактов вчера, чтобы предупреждать пользователей о риске

05-08 00:08

OpenAI запускает модель GPT-5.5-Cyber и фреймворк Trusted Access для защитников кибербезопасности

05-07 12:21

Tether выпустила медицинскую AI-модель QVAC MedPsy и набрала 62,62 балла в версии с 17 млрд параметров

05-07 12:16

Запуск B.AI API: представлены четыре новых модели, включая GPT-5.5 Instant, в течение 48 часов после релиза OpenAI

05-07 02:01

OpenAI запускает протокол MRC вместе с AMD, Broadcom, Intel, Microsoft и Nvidia

Детальный анализ