По данным Beating, Google Gemini 3.1 Flash-Lite перешёл из режима предпросмотра в общую доступность (GA) 8 мая, став самым дешёвым и быстрым в серии Gemini 3. Стоимость ввода установлена на уровне $0,25 за миллион токенов, а вывода — $1,50 за миллион токенов: ввод на 75% дешевле, чем у Claude 4.5 Haiku ($1,00), а вывод — на 70% дешевле ($5,00). Модель поддерживает контекстное окно в 1 миллион токенов и достигает пропускной способности 363 токена в секунду — на 45% быстрее, чем её предшественник Gemini 2.5 Flash.
Бенчмарки производительности показывают GPQA Diamond (рассуждения на уровне аспирантуры по науке) на уровне 86,9%, что выше Claude 4.5 Haiku (73,0%) и GPT-5 mini (82,3%). MMMU-Pro (мультимодальное рассуждение) достигает 76,8%. Среди ранних пользователей — платформа для клиентской поддержки Gladly, которая сообщает о снижении затрат на 60% и 99,6% успешности на рабочих нагрузках в продакшене, а также JetBrains, интегрировавшая Flash-Lite в инструменты IDE для помощи пользователям.
Related News