Com a introdução de seu incorporação, o Google está fornecendo um modelo de incorporação de texto multilíngue projetado para ser executado diretamente em telefones celulares, laptops e outros dispositivos de borda para a IA generativa de primeiro celular.
Apresentado em 4 de setembro, o IncledDinggemma apresenta um design de 308 milhões de parâmetros que permite que os desenvolvedores criem aplicativos usando técnicas como RAG (geração de recuperação de recuperação) e pesquisa semântica que será executada diretamente no hardware direcionado, explicou o Google. Com base na arquitetura do modelo leve GEMMA 3, o incorporação de incorporação é treinado em mais de 100 idiomas e é pequeno o suficiente para ser executado em menos de 200 MB de RAM com quantização. Dimensões de saída personalizáveis são apresentadas, variando de 768 dimensões a 128 dimensões via representação Matryoshka e uma janela de contexto de 2K token.
A incorporação do incorporador capacita os desenvolvedores a construir aplicativos centrados no dispositivo, flexíveis e centrados na privacidade, de acordo com o Google. Os pesos do modelo para incorporação podem ser baixados de Hugging Face, Kaggle e Vertex AI. Ao trabalhar com o modelo Gemma 3N, o EmbeddingGemma pode desbloquear novos casos de uso para pipelines para móveis, pesquisa semântica e muito mais, disse o Google. O incorporador trabalha com ferramentas como transformadores de sentenças, llama.cpp, MLX, Ollama, Litert, Transformers.js, Lmstudio, Weaviate, Cloudflare, Llandeindex e Langchain. A documentação para incorporação pode ser encontrada em AI.google.dev.
