A capacidade de indexar, consultar e analisar grandes quantidades de dados provenientes de fontes em tempo real continua sendo uma grande dor de cabeça para qualquer pessoa envolvida na construção de sistemas de banco de dados.

A recuperação de dados leva tempo e mesmo isso pressupõe que a natureza das consultas esteja dentro de determinados parâmetros. Superar o problema é possível, mas pode exigir muitos recursos e envolver engenharia complexa.

Entretanto, os casos de utilização de dados em tempo real continuam a multiplicar-se, nomeadamente em aplicações de inteligência artificial (IA) ligadas à automatização da cibersegurança, à deteção de fraudes nos serviços financeiros e à análise empresarial em setores como o da indústria transformadora.

Estas aplicações assumem cada vez mais a capacidade de compreender o que se passa nos dados com base numa visão do mundo tal como é no presente, e não como era há horas ou dias atrás.

Trazendo recuperação em tempo real para IA

Estas questões explicam de alguma forma porque é que a empresa de IA mais famosa do mundo, OpenAI, anunciou na semana passada que está a adquirir a pequena mas interessante empresa de bases de dados analíticas em tempo real Rockset num acordo cujos termos não foram divulgados.

Fundada em 2016, a Rockset é especializada em solucionar o desafio de ingestão de dados em tempo real. Como OpenAI descreveu em um tweet explicando a aquisição no X:

Integraremos a tecnologia da Rockset em nossos produtos, capacitando as empresas a transformar seus dados em inteligência acionável.

Em um anúncio separado, o CEO e cofundador da Rockset, Venkat Venkataramani, referiu-se a um tema semelhante:

Rockset se tornará parte da OpenAI e impulsionará a infraestrutura de recuperação que apoia o conjunto de produtos da OpenAI. Estaremos ajudando a OpenAI a resolver os difíceis problemas de banco de dados que os aplicativos de IA enfrentam em grande escala.

Rockset disse que os clientes atuais não experimentariam nenhuma mudança imediata em seus serviços, mas seriam transferidos para OpenAI em algum momento.

Melhorando a pilha de IA

Sendo sua primeira aquisição significativa, a OpenAI tem muito a ganhar com a tecnologia que a Rockset trará para sua plataforma.

No momento, isso se refere principalmente ao ChatGPT Enterprise, que está focado no uso de modelos de dados de IA pré-treinados com alguma capacidade de treinamento em conjuntos de dados personalizados para aplicações como chatbots empresariais.

No entanto, a sua capacidade de lidar com fluxos de dados em tempo real é limitada além de alguma integração com o Bing, o que dificulta a sua atratividade em muitos contextos.

Embora a tecnologia da Rockset não seja específica para IA, ela é incrivelmente útil para aplicações onde a ingestão de dados do mundo real é importante, especialmente ao usar técnicas que aceleram a produção, como geração aumentada de recuperação (RAG).

Adicionar a capacidade em tempo real do Rockset também pode ser importante à medida que a empresa tenta escalar sua plataforma empresarial no longo prazo para competir com os serviços que estão sendo desenvolvidos por rivais de IA “full stack”, como Google e Amazon, bem como outros chatbots alimentados por grandes modelos de linguagem. (LLM).

Nesta última frente, em março, a Amazon fez um investimento de US$ 4 bilhões na startup Anthropic, que há poucos dias lançou a versão mais recente de seu conceituado chatbot, Claude 3.5 Sonnet.

Separadamente, a OpenAI também está adquirindo a Multi (anteriormente Remotion), uma pequena empresa de colaboração e compartilhamento de tela voltada para Mac com sede na cidade de Nova York.

Multi disse que fecharia após 24 de julho, “após o qual excluiremos todos os dados do usuário”. Os funcionários da empresa ingressariam então na OpenAI.