A Oracle está adicionando novos recursos generativos com foco em IA ao seu serviço de nuvem de análise de dados Heatwave, anteriormente conhecido como MySQL HeatWave.

O novo nome destaca como HeatWave oferece mais do que apenas suporte MySQL, e também inclui HeatWave Gen AI, HeatWave Lakehouse e HeatWave AutoML, disse Nipun Agarwal, vice-presidente sênior de HeatWave da Oracle.

Em sua conferência anual CloudWorld em setembro de 2023, a Oracle apresentou uma série de atualizações focadas em IA generativa para o que era então o MySQL HeatWave.

Essas atualizações incluíram uma interface orientada por um modelo de linguagem grande (LLM), permitindo que usuários corporativos interagissem com diferentes aspectos do serviço em linguagem natural, um novo Vector Store, Heatwave Chat e suporte AutoML para HeatWave Lakehouse.

Algumas dessas atualizações, juntamente com recursos adicionais, foram combinadas para formar a oferta HeatWave Gen AI dentro do HeatWave, disse a Oracle, acrescentando que todos esses recursos e recursos agora estão disponíveis gratuitamente sem custo adicional.

Suporte LLM no banco de dados para reduzir custos

Pela primeira vez entre os fornecedores de banco de dados, a Oracle adicionou suporte para LLMs dentro de um banco de dados, disseram analistas.

Espera-se que o suporte LLM no banco de dados do HeatWave Gen AI, que aproveita LLMs menores com menos parâmetros, como Mistral-7B e Llama 3-8B da Meta em execução dentro do banco de dados, reduza o custo de infraestrutura para as empresas, acrescentaram.

“Essa abordagem não apenas reduz o consumo de memória, mas também permite o uso de CPUs em vez de GPUs, tornando-a econômica, o que, dado o custo das GPUs, se tornará uma tendência, pelo menos no curto prazo, até que a AMD e a Intel alcancem a Nvidia, ” disse Ron Westfall, diretor de pesquisa do Grupo Futurum.

Outra razão para usar LLMs menores dentro do banco de dados é a capacidade de ter mais influência no modelo com ajuste fino, disse David Menninger, diretor executivo da Ventana Research do ISG.

“Com um modelo menor, o contexto fornecido por meio de técnicas de geração aumentada de recuperação (RAG) tem maior influência nos resultados”, explicou Menninger.

Westfall também deu o exemplo dos modelos Granite da IBM, dizendo que a abordagem para usar modelos menores, especialmente para casos de uso corporativo, estava se tornando uma tendência.

Os LLMs no banco de dados, de acordo com a Oracle, permitirão que as empresas pesquisem dados, gerem ou resumam conteúdo e executem RAG com o Vector Store da HeatWave.

Separadamente, o HeatWave Gen AI também vem integrado ao OCI Generative Service da empresa, fornecendo às empresas acesso a modelos pré-treinados e outros modelos básicos de fornecedores de LLM.

Loja de vetores renomeada e processamento de vetores em expansão

Vários fornecedores de bancos de dados que ainda não ofereciam bancos de dados vetoriais especializados adicionaram recursos vetoriais a seus produtos nos últimos 12 meses – entre eles MongoDB, DataStax, Pinecone e CosmosDB para NoSQL – permitindo que os clientes construíssem IA e tecnologias generativas baseadas em IA. casos de uso sobre dados armazenados nesses bancos de dados sem mover os dados para um armazenamento de vetores ou banco de dados separado.

A Vector Store da Oracle, já apresentada em setembro, cria automaticamente embeddings após a ingestão de dados para processar consultas com mais rapidez.

Outro recurso adicionado ao HeatWave Gen AI é o processamento vetorial escalável que permitirá que o HeatWave suporte VECTOR como um tipo de dados e, por sua vez, ajudará as empresas a processar consultas com mais rapidez.

“Simplificando, é como adicionar RAG a um banco de dados relacional padrão”, disse Menninger. “Você armazena algum texto em uma tabela junto com a incorporação desse texto como um tipo de dados VECTOR. Então, quando você consulta, o texto da sua consulta é convertido em uma incorporação. A incorporação é comparada com as da tabela e as de menor distância são as mais parecidas.”

Uma interface gráfica via HeatWave Chat

Outro novo recurso adicionado ao HeatWave Gen AI é o HeatWave Chat – um plug-in de código visual para MySQL Shell que fornece uma interface gráfica para HeatWave GenAI e permite que os desenvolvedores façam perguntas em linguagem natural ou SQL.

A retenção do histórico de bate-papo torna mais fácil para os desenvolvedores refinarem os resultados da pesquisa de forma iterativa, disse Menninger.

HeatWave Chat vem com outro recurso chamado Lakehouse Navigator, que permite que usuários corporativos selecionem arquivos do armazenamento de objetos para criar um novo armazenamento de vetores.

Essa integração foi projetada para melhorar a experiência do usuário e a eficiência de desenvolvedores e analistas que criam uma loja de vetores, disse Westfall.