O Google está integrando seu modelo de linguagem grande Gemini 1.0 Pro com sua plataforma de IA e aprendizado de máquina, Vertex AI, para ajudar as empresas a desbloquear novos recursos de modelos de linguagem grande (LLMs), incluindo análise de texto, imagem e vídeo.

A API Gemini, que foi disponibilizada ao público em geral, também pode ser usada no data warehouse do Google, BigQuery, para desenvolver aplicativos analíticos generativos baseados em IA.

“O modelo Gemini 1.0 Pro foi projetado para maior escala de entrada-saída e melhor qualidade de resultados em uma ampla gama de tarefas, como resumo de texto e análise de sentimento. Agora você pode acessá-lo usando instruções SQL simples ou a API DataFrame incorporada do BigQuery diretamente no console do BigQuery”, disse Gerrit Kazmaier, gerente geral de análise de dados do Google Cloud, em um comunicado.

A empresa também deverá integrar a versão vision do modelo Gemini Pro nos próximos meses.

Além disso, o Google está estendendo o processamento de documentos e as APIs de fala para texto da Vertex AI ao BigQuery para ajudar as empresas a analisar dados não estruturados, como documentos e áudio.

No início deste mês, a empresa anunciou a prévia da pesquisa vetorial do BigQuery, que, quando integrada ao Vertex AI, pode permitir a pesquisa de similaridade vetorial em dados dentro do BigQuery, juntamente com outros recursos, como geração aumentada de recuperação (RAG), agrupamento de texto e resumo.

Hyoun Park, analista principal da Amalgam Insights, vê o suporte RAG como uma aposta para os fornecedores de data warehouse atualmente.

“A geração aumentada de recuperação é um recurso que todo data warehouse precisará oferecer suporte, pois se refere ao acesso a dados de uma fonte de terceiros quando alguém faz uma pergunta”, disse Park. “Por exemplo, se alguém fizer uma pergunta de RH, o RAG também solicitará ao sistema de RH do funcionário dados relevantes e atuais para contextualizar a pergunta. A capacidade relevante aqui é acessar uma atualização em tempo real de uma tabela ou fonte de dados específica quando alguém faz uma pergunta a um LLM.”

Outras empresas estão caminhando na mesma direção. Steven Dickens, vice-presidente e líder de prática do The Futurum Group, disse que empresas fortes de warehouse, como Teradata e Cloudera, também estão adicionando recursos vetoriais ao lado de players como Oracle e Elastic.