Google запустит Gemini 3.2 Flash на I/O 20 мая, обеспечив производительность, сопоставимую с GPT-5.5, при стоимости в 1/15

2026-05-14 06:25:38

AT-1,01%

ON0,63%

MAY0,11%

Генеральный директор Abacus.AI Бинду Редди заявил, что Google планирует представить Gemini 3.2 Flash на своей конференции I/O 20 мая; при этом производительность достигнет 92% от GPT-5.5 на задачах кодирования и рассуждений, одновременно сократив расходы на инференс до одной-пятнадцатой — одной-двадцатой от показателей последнего. Большинство запросов будут обрабатываться с задержкой ниже 200 миллисекунд. Редди объяснил прорыв дистилляцией и техниками sparsity от Google: они сжимают флагманскую модель до уровня Flash без типичного провала производительности, обычно наблюдаемого при оптимизации моделей.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-14 06:11

IBM расширяет интеграцию ИИ и блокчейна на Think 2026 5 мая

05-14 04:53

GPT-5.6 Успешно Доступен через Codex OAuth, размер контекстного окна увеличивается до 1,5 млн токенов; ожидается запуск в июне

05-14 04:40

Tencent раскрывает стратегию ИИ: поставки отечественных чипов ускорятся во 2-м полугодии 2026 года, монетизация для C-сегмента «всё ещё на ранней стадии»

05-13 00:50

Google запускает Googlebook — новую категорию блокнотов с ИИ, завершающую 15-летнюю эпоху Chromebook

05-12 20:41

Google представляет интеллект Gemini для Android, запускается на Galaxy S26 и Pixel 10 этим летом

Детальный анализ