O provedor de data lakehouse Databricks disse que está adquirindo a Lilac AI, com sede em Boston, para ajudar as empresas a explorar e usar seus dados não estruturados para construir aplicativos generativos baseados em IA.
“Hoje, temos o prazer de anunciar que Lilac está ingressando no Databricks. Lilac é uma ferramenta escalável e fácil de usar para cientistas de dados pesquisarem, agruparem e analisarem qualquer tipo de conjunto de dados de texto com foco em IA generativa”, escreveu a empresa em uma postagem no blog.
A Lilac AI, de acordo com listagens em seu portal, ofereceu um serviço chamado Garden que permitiria às empresas pesquisar, quantificar e editar dados para grandes modelos de linguagem (LLMs) que serão usados em aplicações generativas baseadas em IA.
Isso significa que o Garden permitirá que cientistas e pesquisadores de dados explorem clusters de dados, derivem novas categorias de dados usando feedback e classificadores humanos e personalizem conjuntos de dados com base nesses insights.
A oferta, de acordo com Databricks, também pode ser usada para permitir análises de resultados de modelos para viés ou toxicidade e preparação de dados para RAG e LLMs de ajuste fino ou pré-treinamento.
A integração da ferramenta Lilac's Garden, após a aquisição, ajudará o cliente corporativo da Databricks a acelerar o desenvolvimento de aplicações generativas de IA, escreveram os executivos seniores.
Além disso, os executivos da empresa disseram que veem o Lilac como um complemento essencial às ferramentas ponta a ponta do MosiacML para o desenvolvimento de aplicativos generativos baseados em IA.
No ano passado, em junho, a Databricks adquiriu a LLM e o fornecedor de software de treinamento de modelos MosaicML por US$ 1,3 bilhão para impulsionar suas ofertas de IA generativa.
A popularidade do Lilac AI como um projeto de código aberto nas comunidades de ciência de dados e pesquisa de IA e na própria equipe Mosiac AI da Databricks, que tem aproveitado o Lilac para selecionar dados no ano passado, foi a razão por trás da aquisição, escreveram Zaharia e outros executivos seniores .
Os fundadores da Lilac, Daniel Smilkov e Nikhil Thorat, têm pelo menos uma década de experiência no Google. Enquanto Thorat co-criou o TensorFlow.js e foi o ex-líder técnico da interface de usuário do Google Image Search, Smilkov co-liderou o TensorFlow.js na gigante da Internet.
A Databricks, pelo menos no ano passado, tem adquirido empresas para aumentar suas capacidades generativas de IA para competir com rivais, como a Snowflake.
Antes da aquisição da Lilac AI e MosiacML, a empresa adquiriu a Okera, fornecedora de plataforma de governança de dados centrada em IA, por uma quantia não revelada em maio do ano passado.
Esperava-se que a aquisição aumentasse as capacidades de governança de dados da Databricks, ao mesmo tempo em que treina e gerencia grandes modelos de linguagem (LLMs), como seu LLM proprietário de código aberto Dolly 2.0.
A Snowflake também tem adquirido empresas que não apenas impulsionam suas ofertas de IA generativa, mas também reforçam suas capacidades de gerenciamento de dados.
Em maio do ano passado, a empresa de armazenamento de dados baseada em nuvem adquiriu a Neeva, uma startup com sede em Mountain View, Califórnia, por uma quantia não revelada, em um esforço para adicionar pesquisa generativa baseada em IA à sua plataforma Data Cloud.
Em fevereiro de 2023, a Snowflake adquiriu a LeapYear para aumentar suas capacidades de sala limpa de dados.
A aquisição da LeapYear ocorreu apenas um mês depois que a Snowflake concordou em comprar o provedor de plataforma de previsão de séries temporais baseada em inteligência artificial Myst AI, elevando a contagem de aquisições da empresa para sete empresas em três anos.