Google lança Gemini 3.1 Flash-Lite, seu modelo de IA mais rápido e barato até agora — criado para responder em segundos e reduzir custos pela metade

O Google apresentou oficialmente o Gemini 3.1 Flash-Lite, uma nova versão de sua família de modelos de inteligência artificial voltada para velocidade e baixo custo. O sistema promete respostas até 2,5 vezes mais rápidas e preços reduzidos, mantendo desempenho competitivo em tarefas de raciocínio e análise multimodal.

A corrida global por modelos de inteligência artificial mais eficientes acaba de ganhar um novo capítulo. O Google anunciou o Gemini 3.1 Flash-Lite, uma versão otimizada de sua plataforma de IA que promete combinar velocidade, baixo custo e desempenho competitivo. A novidade foi projetada principalmente para desenvolvedores que precisam processar grandes volumes de dados rapidamente, sem aumentar os custos de computação.

Um modelo projetado para velocidade e baixo custo

Segundo o Google, o Gemini 3.1 Flash-Lite foi criado para lidar com grandes quantidades de solicitações sem comprometer o orçamento de empresas e desenvolvedores.

A empresa afirma que o modelo pode gerar respostas até 2,5 vezes mais rápido que o Gemini 2.5 Flash. Mesmo com a redução de latência, o desempenho geral permanece comparável — ou até superior — em diversas tarefas.

Essa combinação de velocidade e eficiência financeira é o principal objetivo do modelo. A ideia é tornar aplicações baseadas em IA mais acessíveis para produtos que exigem respostas em tempo real.

Desempenho competitivo nos testes de IA

Nos benchmarks usados para medir capacidades de inteligência artificial, o novo modelo apresentou resultados sólidos.

O Gemini 3.1 Flash-Lite alcançou uma pontuação Elo de 1432 no ranking da plataforma Arena.ai. Em avaliações mais técnicas, o sistema registrou 86,9% no teste GPQA Diamond, voltado para medir raciocínio profundo em questões científicas de nível avançado.

Em outro benchmark, o MMMU Pro, o modelo obteve 76,8%. Esse teste avalia a capacidade de processar simultaneamente texto, imagens e diferentes tipos de informação em problemas multidisciplinares.

Os resultados indicam que, mesmo sendo uma versão mais leve, o Flash-Lite consegue competir com modelos maiores em tarefas complexas.

Competindo com GPT, Claude e Grok

Chatgpt Pago — © Photo by Jaque Silva/NurPhoto via Getty Images

O lançamento posiciona o novo modelo diretamente na disputa com outras IAs de alto desempenho do mercado.

Entre os rivais citados estão o GPT-5 mini, o Claude 4.5 Haiku e o Grok 4.1 Flash. De acordo com os testes divulgados, o Gemini 3.1 Flash-Lite apresenta bom desempenho em áreas como conhecimento científico, compreensão de vídeo e raciocínio em múltiplos idiomas.

Essas capacidades são particularmente importantes para aplicações que dependem de análise multimodal, como sistemas de atendimento automatizado, análise de documentos ou ferramentas educacionais.

Controle do nível de raciocínio

Uma das funcionalidades herdadas de versões mais avançadas do Gemini é o controle do nível de “pensamento” do modelo.

Essa opção permite que desenvolvedores definam quanto poder computacional será utilizado em cada tarefa. Uma consulta simples, como uma tradução curta, pode exigir menos processamento. Já tarefas mais complexas — como gerar interfaces ou analisar grandes conjuntos de dados — podem receber mais recursos.

Esse tipo de controle ajuda empresas a equilibrar desempenho e custo operacional.

Preços reduzidos pela metade

Um dos pontos mais importantes do Gemini 3.1 Flash-Lite é o preço.

O modelo anterior, Gemini 3 Flash, foi lançado com custo de 0,50 dólar por milhão de tokens de entrada e 3 dólares por milhão de tokens de saída.

Na nova versão Lite, esses valores foram reduzidos pela metade. O preço passa a ser de 0,25 dólar para tokens de entrada e 1,50 dólar para tokens de saída.

A estratégia mostra que o Google está apostando em tornar a IA mais barata para desenvolvedores que precisam escalar seus serviços.

Nem tudo é perfeito: programação ainda é um desafio

Gemini Google Ia — © X – @MiguelMaestroIA

Apesar das melhorias, o modelo ainda apresenta limitações em algumas áreas.

Nos testes do LiveCodeBench, que avaliam habilidades de programação, o Gemini 3.1 Flash-Lite ficou atrás de modelos como GPT-5 mini e Grok 4.1 Fast.

Isso indica que o modelo não foi projetado principalmente para tarefas intensivas de geração de código. Em vez disso, ele se destaca em processos repetitivos, análise de dados e execução de instruções complexas.

Disponibilidade para desenvolvedores

O Gemini 3.1 Flash-Lite já está disponível em versão preliminar para desenvolvedores.

O acesso pode ser feito por meio da API no Google AI Studio e também através da plataforma Vertex AI, voltada para empresas.

Enquanto essa versão foi pensada principalmente para aplicações técnicas e corporativas, o Gemini 3.1 Flash tradicional continua sendo a opção mais equilibrada para usuários finais.

Com esse lançamento, o Google reforça sua estratégia de expandir o ecossistema de inteligência artificial com modelos mais rápidos, mais baratos e capazes de atender diferentes tipos de aplicações.

[ Fonte: Hipertextual ]

Google lança Gemini 3.1 Flash-Lite, seu modelo de IA mais rápido e barato até agora — criado para responder em segundos e reduzir custos pela metade

Um modelo projetado para velocidade e baixo custo

Desempenho competitivo nos testes de IA

Competindo com GPT, Claude e Grok

Controle do nível de raciocínio

Preços reduzidos pela metade

Nem tudo é perfeito: programação ainda é um desafio

Disponibilidade para desenvolvedores

Últimas notícias

Cristiano Ronaldo chega à última Copa cercado por uma discussão que antes era impensável

Dois dos objetos mais brilhantes do céu vão protagonizar um espetáculo raro nos próximos dias

Mais de 20 mil contas do Instagram foram invadidas após hackers explorarem assistente de suporte com IA da Meta

Ridley Scott vai levar os piratas de volta aos cinemas com Hugh Jackman em uma nova versão de ‘A Ilha do Tesouro’

Google quer liberar 64 milhões de mosquitos nos Estados Unidos para combater mosquitos: parece contraditório, mas a estratégia já mostrou resultados impressionantes

Cientistas descobrem que bactérias no intestino dos peixes podem influenciar um dos grandes ciclos químicos dos oceanos

Astrônomos pesam um buraco negro colossal do universo primitivo: sua massa é tão absurda que o Sol parece uma bolinha de gude

A série que está sendo comparada a Dark pode se tornar a próxima obsessão da ficção científica

Artigos relacionados

Google lança Gemini 3.1 Flash-Lite, seu modelo de IA mais rápido e barato até agora — criado para responder em segundos e reduzir custos pela metade

Um modelo projetado para velocidade e baixo custo

Desempenho competitivo nos testes de IA

Competindo com GPT, Claude e Grok

Controle do nível de raciocínio

Preços reduzidos pela metade

Nem tudo é perfeito: programação ainda é um desafio

Disponibilidade para desenvolvedores

Cristiano Ronaldo chega à última Copa cercado por uma discussão que antes era impensável

Dois dos objetos mais brilhantes do céu vão protagonizar um espetáculo raro nos próximos dias

Mais de 20 mil contas do Instagram foram invadidas após hackers explorarem assistente de suporte com IA da Meta

Ridley Scott vai levar os piratas de volta aos cinemas com Hugh Jackman em uma nova versão de ‘A Ilha do Tesouro’

Google quer liberar 64 milhões de mosquitos nos Estados Unidos para combater mosquitos: parece contraditório, mas a estratégia já mostrou resultados impressionantes

Cientistas descobrem que bactérias no intestino dos peixes podem influenciar um dos grandes ciclos químicos dos oceanos

Astrônomos pesam um buraco negro colossal do universo primitivo: sua massa é tão absurda que o Sol parece uma bolinha de gude

A série que está sendo comparada a Dark pode se tornar a próxima obsessão da ficção científica

Artigos relacionados

Mais de 20 mil contas do Instagram foram invadidas após hackers explorarem assistente de suporte com IA da Meta

O futuro dos robôs humanoides esbarrou em uma pergunta simples: quem vai comprá-los?

Nova encíclica do Papa sobre inteligência artificial pode abrir caminho para funcionários recusarem o uso da tecnologia no trabalho

OpenAI prepara a maior transformação da história do ChatGPT: a conversa pode deixar de ser o centro da experiência

O truque pouco conhecido do WhatsApp que permite enviar mensagens sem salvar contatos na agenda

Elon Musk quer colocar 100 mil satélites em órbita e promete uma internet espacial até 20 vezes mais rápida: o plano que pode transformar a IA e as comunicações globais