A Google acaba de lançar o Gemini 2.5 Flash Image, a mais recente atualização do seu modelo de imagem.
Este lançamento não é apenas uma melhoria; é uma resposta direta ao feedback dos usuários, focando em imagens de maior qualidade e em um controle criativo muito mais poderoso.
O modelo, também conhecido como nano-banana, chega para expandir as capacidades de geração de imagens com recursos que vão muito além da simples criação.
Vamos explorar o que ele oferece e como ele se destaca no mercado.
- 11 livros sobre inteligência artificial que você precisa conhecer
- Tella AI: como acelerar a criação e edição de vídeos com IA
- Topview AI: crie vídeos realistas de produtos com avatares gerados por IA
Menu de navegação
ToggleO que é o Gemini 2.5 Flash Image?
O Gemini 2.5 Flash Image é um modelo de inteligência artificial de última geração, projetado para transformar a maneira como interagimos com o conteúdo visual.
Ele foi construído com base nas capacidades do Gemini 2.0 Flash, mas com foco em resolver desafios criativos que modelos anteriores não conseguiam.
A grande novidade é a capacidade de gerar e editar imagens com maior controle e precisão, utilizando apenas linguagem natural.
O modelo já está disponível para desenvolvedores e empresas por meio da Gemini API, do Google AI Studio e do Vertex AI, com um preço de $30.00 por 1 milhão de tokens de saída.
Principais recursos do Gemini 2.5 Flash Image
A evolução do modelo se manifesta em quatro recursos principais que, juntos, abrem um leque de novas possibilidades.
Coerência de personagem aprimorada
Manter a consistência de um personagem ou objeto em múltiplas imagens é um dos maiores desafios da geração de imagens por IA.
Com o Gemini 2.5 Flash Image, você pode:
- Colocar o mesmo personagem em diferentes cenários.
- Exibir um produto de vários ângulos em novos ambientes.
- Gerar ativos de marca consistentes, mantendo o tema e o estilo visual.
Edição de imagem com linguagem natural

O novo modelo permite transformações direcionadas e edições locais precisas usando prompts simples.
A edição de imagens com IA nunca foi tão intuitiva.
Você pode:
- Remover objetos ou pessoas de uma foto.
- Desfocar o fundo para destacar o tema principal.
- Mudar a pose de um objeto.
- Adicionar cor a uma foto em preto e branco.
Conhecimento de mundo nativo
Historicamente, os modelos de geração de imagem se destacavam pela estética, mas falhavam na compreensão semântica do mundo real.
O Gemini 2.5 Flash Image muda essa realidade.
Ele herda o vasto conhecimento de mundo do Gemini, permitindo novas aplicações, como a capacidade de:
- Ler e entender diagramas desenhados à mão.
- Ajudar com questões do mundo real.
- Seguir instruções de edição complexas em uma única etapa.
Fusão de múltiplas imagens
Um dos recursos mais impressionantes é a capacidade de entender e combinar várias imagens de entrada em uma única composição.
Com um único prompt, você pode:
- Colocar um objeto de uma foto em uma nova cena.
- Reestilizar um ambiente com um esquema de cores ou textura diferente.
- Unir elementos de várias fotos para criar uma nova imagem fotorrealista.
Como começar a usar o Gemini 2.5 Flash Image
Para os desenvolvedores, a Google atualizou o “build mode” do Google AI Studio com templates que demonstram as capacidades do modelo, como a consistência de personagem e a edição de fotos.
Você pode remixar e personalizar esses aplicativos de demonstração com prompts.
A Google também estabeleceu parcerias com plataformas como OpenRouter.ai e fal.ai para ampliar o acesso ao Gemini 2.5 Flash Image, garantindo que mais de 3 milhões de desenvolvedores possam experimentar as novas funcionalidades.
Segurança e ética em primeiro lugar
Em linha com o compromisso da Google com o uso responsável da IA, todas as imagens criadas ou editadas com o Gemini 2.5 Flash Image incluirão uma marca d’água digital invisível SynthID.
Isso permite que as imagens sejam identificadas como geradas ou editadas por IA, garantindo transparência e segurança.