OpenAI выпускает три голосовые модели в Realtime API; GPT-Realtime-2 предлагает контекстное окно на 128K

Beating: OpenAI выпустила три голосовые модели в своей Realtime API: GPT-Realtime-2 для голосового общения с рассуждениями, GPT-Realtime-Translate для перевода в реальном времени и GPT-Realtime-Whisper для потоковой транскрибации. GPT-Realtime-2 — первая голосовая модель OpenAI с возможностями рассуждений на уровне GPT-5: она расширяет контекстное окно с 32K до 128K токенов и поддерживает до 1-2 часов плотного разговора.

GPT-Realtime-2 улучшила на 15,2% результат в бенчмарке Big Bench Audio и на 13,8% — в Audio MultiChallenge по сравнению с GPT-Realtime-1.5. GPT-Realtime-Translate поддерживает 70+ входных языков и перевод на 13 выходных языков. Цены: GPT-Realtime-2 — $32 за 32k входных токенов и $64 за 128k выходных токенов; Translate — $0,034 за минуту; Whisper — $0,017 за минуту.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

DeepMind AlphaEvolve междисциплинарные результаты: умножение матриц 4×4 обновило рекорд Страссена 1969 года, обучение Gemini ускорилось на 1%

Google DeepMind 7 мая (по американскому времени) опубликовала отчёт о междисциплинарных результатах AlphaEvolve. Официальный блог DeepMind подводит итоги конкретных достижений AlphaEvolve с момента запуска: найден метод умножения 4×4 комплексных матриц, который лучше алгоритма Strassen 1969 (48 умножений скаляров), совместно с математиками, включая Терренса Тао (Terence Tao), решены несколько математических трудных задач по Эрдёшу (Эрдős), сэкономлено 0,7% мировых вычислительных ресурсов для дата-центров Google, ключевое ускорение kernel при обучении Gemini увеличено на 23%, а общее время обучения Gemini сокращено на 1%. Архитектура: Gemini Flash — широкомасштабный поиск + Gemini

ChainNewsAbmedia9м назад

OpenAI Codex запускает расширение для Chrome: можно тестировать Web App в браузере, получать Context между страницами, работать параллельно

OpenAI 7 мая (по американскому времени) опубликовала Chrome-расширение для Codex, позволяющее Codex-кодирующим агентам работать прямо в браузере Chrome на macOS и Windows. Официальная документация OpenAI по Codex поясняет, что расширение даёт Codex возможность тестировать web app, получать контекст на нескольких вкладках, использовать Chrome DevTools и выполнять другие задачи параллельно — при этом оно не перехватывает управление браузером пользователя. OpenAI также сообщила, что еженедельно активные пользователи Codex превысили 4 миллиона, что в 8 раз больше по сравнению с началом года. Что можно делать внутри браузера: тестировать web app, получать контекст между вкладками, использовать DevTools Chrome-расширение

ChainNewsAbmedia12м назад

OpenAI выпускает GPT-Realtime-2: переносит рассуждения GPT-5 в голосовых агентов, контекст увеличен до 128K

OpenAI 7 мая (по американскому времени) на конференции для разработчиков представила три новых Realtime-модели: GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper, все они доступны разработчикам через Realtime API. Официальное объявление OpenAI поясняет, что GPT-Realtime-2 — это первая в OpenAI модель, обладающая GPT-5

ChainNewsAbmedia13м назад

Полевое посещение китайских AI-лабораторий: исследователь раскрывает, что «пробелы в чипах и данных» — ключевая причина разницы между Китаем и США

Глубокое посещение нескольких AI-лабораторий в Китае Натан Ламберт отметил, что ключевое преимущество страны — в культуре, талантах и прагматичном настрое: исследования направлены в первую очередь на повышение качества моделей, студенты выступают ключевыми основными вкладчиками, а внутренние конфликты в организациях случаются реже из‑за конкуренции внутри команд; при этом есть пробелы в чипах, данных и креативности, а внешние вычислительные мощности ограничены контролем со стороны США, тогда как низкое качество данных подталкивает к созданию собственной тренировочной среды. Компании открывают исходный код, но сохраняют ключевые технологии для собственных точных доработок; если США ужесточат открытый экосистемный доступ, это может повлиять на глобальное лидерство.

ChainNewsAbmedia23м назад

a16z возглавляет раунд финансирования $16M для шведского AI-стартапа Pit

По данным Bloomberg, шведская AI-компания Pit привлекла 16 миллионов долларов в раунде финансирования под руководством Andreessen Horowitz при участии Lakestar и руководителей из крупных AI- и технологических компаний. В раунд также вошли семьи Стена и Лундин из Швеции. Pit уже обеспечила пилотные проекты с Voi,

GateNews26м назад

Обсуждение просочившегося разговора о механизме предварительного допроса по ИИ в Белом доме; на следующий день заявление Хассетта было опровергнуто официальными лицами

Глава Национального экономического совета (NEC) при Белом доме Кевин Хассетт 7 мая в интервью Fox Business заявил, что администрация Трампа обсуждает подготовку через указ главы государства требований к моделям ИИ проходить проверку госбезопасности до их публичного выпуска, и привёл аналогию с тем, как FDA утверждает лекарства до вывода на рынок. Но, как сообщает Politico 8 мая, высокопоставленные чиновники Белого дома затем заявили, что эти слова были «вырваны из контекста».

MarketWhisper32м назад
комментарий
0/400
Нет комментариев