O novo modelo de IA do Google cria imagens em menos de 4 segundos — e agora também transforma fotos em vídeos usando apenas comandos de texto

O Google ampliou seu ecossistema de inteligência artificial com duas novidades voltadas à criação de conteúdo. O Nano Banana 2 Lite promete gerar imagens realistas em menos de quatro segundos, enquanto o Gemini Omni Flash permite criar e editar vídeos a partir de textos, imagens ou outros vídeos utilizando apenas instruções em linguagem natural.

A disputa entre as gigantes da tecnologia pela liderança em inteligência artificial acaba de ganhar mais um capítulo. Poucas horas após anunciar novos recursos para geração de imagens, o Google revelou duas ferramentas que prometem tornar a criação de conteúdo ainda mais rápida e integrada.

As novidades são o Nano Banana 2 Lite, uma versão otimizada do seu modelo de geração de imagens, e o Gemini Omni Flash, uma IA desenvolvida para criar e editar vídeos por meio de comandos de texto. Juntas, as duas soluções permitem iniciar um projeto com uma simples descrição, gerar uma imagem em segundos e transformá-la em vídeo dentro do mesmo fluxo de trabalho.

Nano Banana 2 Lite prioriza velocidade sem abrir mão da qualidade

O Nano Banana 2 Lite é a mais nova versão da família Nano Banana, conhecida por produzir imagens realistas a partir de descrições em texto.

Baseado no modelo Gemini 3.1 Flash Lite, o sistema foi desenvolvido para reduzir drasticamente o tempo de processamento. Segundo o Google, ele consegue gerar uma imagem completa em menos de quatro segundos, desempenho significativamente superior ao da versão anterior.

A empresa afirma que esse ganho de velocidade não compromete a qualidade. O modelo mantém consistência visual entre personagens, interpreta com precisão os comandos do usuário e ainda consegue inserir textos legíveis nas imagens, algo que continua sendo um desafio para muitos modelos de inteligência artificial.

O Nano Banana 2 Lite já começou a ser integrado aos principais serviços da empresa, incluindo a Pesquisa Google, o Modo IA, o aplicativo Gemini, o Google Fotos e o NotebookLM.

Cada versão atende a um perfil diferente

Apesar da chegada da versão Lite, o Google não pretende substituir o Nano Banana 2.

A estratégia da empresa é oferecer modelos voltados para diferentes necessidades. Enquanto o Nano Banana 2 Lite privilegia respostas quase instantâneas, o Nano Banana 2 continua sendo a opção indicada para quem busca maior qualidade de imagem, ainda que com um tempo de processamento um pouco maior.

A família também inclui o Nano Banana Pro, destinado a aplicações profissionais e projetos que exigem maior capacidade de raciocínio durante a geração das imagens.

Gemini Omni Flash leva a edição de vídeos para outro nível

A segunda novidade é o Gemini Omni Flash, modelo apresentado anteriormente pelo Google e que agora começa a chegar para um número maior de usuários por meio do aplicativo Gemini e da plataforma Google Flow.

A ferramenta permite criar vídeos a partir de textos, imagens ou até mesmo outros vídeos. Além disso, o usuário pode modificar praticamente qualquer elemento da cena apenas descrevendo as mudanças desejadas em linguagem natural, sem recorrer a programas tradicionais de edição.

Segundo o Google, o modelo utiliza o conhecimento contextual do Gemini para construir cenas com maior coerência narrativa, lógica e histórica.

Imagem e vídeo passam a fazer parte do mesmo processo criativo

O maior diferencial aparece quando os dois modelos trabalham em conjunto.

Uma imagem criada pelo Nano Banana 2 Lite pode servir como ponto de partida para que o Gemini Omni Flash gere um vídeo completo. O sistema mantém o contexto durante toda a conversa, permitindo realizar até três edições consecutivas sobre o mesmo conteúdo sem perder as instruções fornecidas anteriormente.

No momento, os vídeos podem ter até dez segundos de duração, mas o Google informou que esse limite deverá aumentar nas próximas atualizações.

A tecnologia ainda possui algumas limitações

Apesar dos avanços, o Gemini Omni Flash ainda apresenta algumas restrições.

O modelo pode ter dificuldade para manter exatamente a mesma aparência de um personagem quando há mudanças de cenário ou movimentos de câmera. Também ainda não permite utilizar referências de áudio nem expandir vídeos que já tenham sido criados.

A ferramenta será disponibilizada por meio da API do Gemini e do Google AI Studio. O custo informado pelo Google é de US$ 0,10 por segundo de vídeo gerado, o mesmo valor cobrado pelo modelo Veo 3.1 Fast.

Com esses lançamentos, o Google reforça sua estratégia de integrar geração de imagens e vídeos em um único ecossistema de inteligência artificial. A empresa aposta em modelos especializados para diferentes perfis de usuários, oferecendo desde ferramentas ultrarrápidas para tarefas do dia a dia até soluções mais avançadas para projetos criativos e profissionais.

[ Fonte: Hipertextual ]