De acordo com a Beating, o Google Gemini 3.1 Flash-Lite passou de pré-visualização para disponibilidade geral (GA) a 8 de maio, tornando-se o modelo mais barato e rápido na série Gemini 3. O preço de entrada está fixado em 0,25 USD por milhão de tokens e o de saída em 1,50 USD por milhão de tokens — os custos de entrada são 75% inferiores aos do Claude 4.5 Haiku (1,00 USD) e a saída é 70% mais barata (5,00 USD). O modelo tem uma janela de contexto de 1 milhão de tokens e atinge uma taxa de transferência de 363 tokens por segundo, 45% mais rápida do que o seu antecessor Gemini 2.5 Flash.
Os testes de desempenho mostram GPQA Diamond (raciocínio em ciências ao nível de pós-graduação) a 86,9%, ultrapassando os 73,0% do Claude 4.5 Haiku e os 82,3% do GPT-5 mini. MMMU-Pro (raciocínio multimodal) chega a 76,8%. Entre os primeiros utilizadores estão a plataforma de atendimento ao cliente Gladly, que reporta uma redução de custos de 60% e uma taxa de sucesso de 99,6% em cargas de trabalho em produção, e a JetBrains, ao integrar o Flash-Lite nas ferramentas de assistência do IDE.
Related News
A NVIDIA lançou o Nemotron 3 Nano Omni, uma solução de multimodalidade de código aberto
A OpenAI DevDay 2026 terá lugar a 29/9, em São Francisco
A Genesis AI lança a plataforma robótica GENE-26.5 com financiamento US$105M