Google запустит Gemini 3.2 Flash на I/O 20 мая, обеспечив производительность, сопоставимую с GPT-5.5, при стоимости в 1/15

AT1,59%
ON-11,97%
MAY-6,58%

Генеральный директор Abacus.AI Бинду Редди заявил, что Google планирует представить Gemini 3.2 Flash на своей конференции I/O 20 мая; при этом производительность достигнет 92% от GPT-5.5 на задачах кодирования и рассуждений, одновременно сократив расходы на инференс до одной-пятнадцатой — одной-двадцатой от показателей последнего. Большинство запросов будут обрабатываться с задержкой ниже 200 миллисекунд. Редди объяснил прорыв дистилляцией и техниками sparsity от Google: они сжимают флагманскую модель до уровня Flash без типичного провала производительности, обычно наблюдаемого при оптимизации моделей.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев