O Google DeepMind introduziu a Gemma 3, uma atualização da família de modelos generativos de IA generativa, apresentando multimodalidade que permite que os modelos analisem imagens, respondam perguntas sobre imagens, identifiquem objetos e executem outras tarefas que envolvem a análise e a compreensão de dados visuais.

A atualização foi anunciada em 12 de março e pode ser testada no Google AI Studio para o desenvolvimento da IA. A GEMMA 3 também melhora significativamente a matemática, a codificação e as instruções seguintes, de acordo com o Google DeepMind.

A GEMMA 3 suporta entradas e saídas de texto em linguagem de visão, lida com janelas de contexto de até 128 mil tokens e entende mais de 140 idiomas. Também foram feitas melhorias para matemática, raciocínio e bate -papo, incluindo saídas estruturadas e chamada de função. A GEMMA 3 vem em quatro tamanhos de “amigável para desenvolvedores” de 1B, 4B, 12B e 27B e em versões pré-treinadas e de uso geral. “A janela de contexto de 128K-Token permite que a Gemma 3 processe e compreenda grandes quantidades de informações, facilmente enfrentando tarefas complexas”, disse o anúncio do Google DeepMind.