O Google introduziu a imagem flash Gemini 2.5, uma geração de imagens e um modelo de edição de capacidades de ativação, incluindo a mistura de várias imagens em uma única imagem. Os desenvolvedores podem usar o modelo para criatividade multimodal para aplicativos visuais.
Introduzido em 26 de agosto e também identificado como “Nano Banana”, a imagem flash Gemini 2.5 permite que os desenvolvedores mantenham o caráter para consistência, faça transformações direcionadas usando a linguagem natural e use o conhecimento de Gêmeos para gerar e editar imagens. O modelo está disponível na API Gemini e no Google AI Studio para desenvolvedores e vértice ai para empresa. Para ajudar na construção da imagem Flash 2.5 Flash, o Google fez atualizações no modo de construção do Google AI Studio. Os desenvolvedores podem testar rapidamente os recursos do modelo com aplicativos personalizados de IA e remixá-los ou dar vida a um único prompt, de acordo com o Google. Os aplicativos podem ser compartilhados no Google AI Studio ou código salvo no GitHub.
A imagem flash Gemini 2.5 permite transformação direcionada e edições locais precisas com linguagem natural, disse o Google. Por exemplo, o modelo pode embaçar o fundo de uma imagem, remover uma mancha em uma camiseta, remover uma pessoa inteira de uma foto, alterar a pose de um sujeito, adicione cor a uma foto em preto e branco, tudo com um prompt simples. Os principais recursos do modelo incluem:
