Skip to content
Tudo SEO
  • SEO
  • CMS
  • Tutoriais & Conselhos
  • Contato
Tudo SEO

Databricks corre com Snowflake para abrir o código-fonte do catálogo de dados

12 de junho de 202412 de junho de 2024

Poucos dias depois de o fornecedor rival de data lakehouse, Snowflake, ter dito que abriria o código-fonte de seu Catálogo Polaris, a Databricks está abrindo o código-fonte de sua oferta de Catálogo Unity.

O Catálogo Unity do Databricks, que foi disponibilizado ao público em junho de 2022 e posteriormente atualizado com os recursos do Okera, costumava ser uma oferta de governança unificada de código fechado que fornecia controle de acesso centralizado, auditoria, linhagem e recursos de descoberta de dados em todos os espaços de trabalho do Databricks.

Quando a Snowflake lançou o Catálogo Polaris em sua conferência anual no início deste mês, ela disse que abriria o código dentro de três meses. Ele oferece recursos semelhantes ao Unity Catalog, mas é construído sobre o popular formato de tabela de dados de código aberto Apache Iceberg.

“É difícil olhar para o anúncio do Catálogo Unity sem pensar na disputa consistente que existe entre Databricks e Snowflake pela atenção empresarial”, disse Hyoun Park, analista-chefe da Amalgam Insights.

“Ao abrir o código do Unity antes do Polaris, a Databricks quer se posicionar como a primeira a abrir o código do seu catálogo de dados”, acrescentou Park.

Agora, a Databricks diz que abriu o Unity Catalog sob a licença Apache 2.0 e também abriu todas as suas APIs.

A licença Apache 2.0, introduzida pela Apache Software Foundation em 2004, é uma licença de software que permite aos usuários modificar e distribuir código sem qualquer custo.

Depois de ser de código aberto, o catálogo fornecerá aos usuários uma interface universal que suporta dados em qualquer formato e ambiente de computação, como a capacidade de ler tabelas com clientes Delta Lake, Apache Iceberg e Apache Hudi por meio do Delta Lake UniForm, disse a empresa. .

A versão agora de código aberto também suporta os padrões de interface Iceberg REST Catalog e Hive Metastore (HMS), acrescentou.

Além disso, o Unity Catalog continuará a fornecer governança unificada entre ativos de IA, como modelos de aprendizado de máquina (ML) e ferramentas generativas de IA.

A mudança para abrir as APIs do Unity Catalog, de acordo com o vice-presidente de pesquisa da IDC, Stewart Bond, fornece acesso aberto à inteligência sobre os dados mantidos no ambiente Databricks.

“Isso é significativo, pois oferece oportunidades para uma empresa incluir inteligência sobre dados em Databricks para serem integrados e compartilhados com catálogos que mantêm inteligência sobre dados armazenados em outros lugares”, disse Bond, acrescentando que é uma forma de apoiar a unificação da inteligência de dados. para que consumidores, engenheiros e executivos de dados não precisem usar diversas ferramentas para descobrir, gerenciar e controlar todos os dados em uma determinada empresa.

Esta abordagem de apoio à unificação de dados, de acordo com Steven Dickens, líder de prática do Grupo Futurum para nuvem híbrida, elimina a dependência do fornecedor, permitindo que as empresas escolham as melhores ferramentas e plataformas para as suas necessidades, garantindo ao mesmo tempo uma governação e segurança consistentes em todo o seu património de dados.

Uma corrida para ser visto como mais open source

O código aberto do Catálogo Unity, que também acompanha a decisão da Snowflake de abrir o Catálogo Polaris em três meses, está sendo visto pelos analistas como uma corrida para ser visto como mais código aberto e atrair usuários do catálogo de dados.

Dickens, da Futurum, disse que a mudança do Databricks para o Unity Catalog de código aberto representa um desafio significativo para rivais como Snowflake, Teradata e Dremio.

“A ênfase na interoperabilidade e no compromisso com o código aberto garante que o Databricks possa atender a uma gama mais ampla de necessidades dos clientes, reduzindo o atrito associado à compatibilidade do formato de dados”, disse ele.

“Teradata e Dremio, embora fortes em seus respectivos nichos, não demonstraram o mesmo nível de integração e ferramentas abrangentes para governança de dados e IA”, acrescentou Dickens.

No entanto, Bond, da IDC, destacou que o sucesso do Catálogo Unity, agora de código aberto, dependerá da quantidade de metadados sobre dados armazenados em plataformas concorrentes que estão sendo disponibilizados para processos externos.

“O Unity ainda é um catálogo muito técnico. Torná-lo de código aberto pode acelerar inovações nas experiências do usuário em nível empresarial e tornar o Unity mais competitivo”, disse Bond.

Juliana Ribeiro
Juliana Ribeiro

Juliana Ribeiro é uma respeitada e talentosa redatora que trabalha do Tudo SEO. Com um profundo entendimento das nuances do SEO e seu impacto na visibilidade digital, Juliana usa sua expertise para educar e inspirar os leitores.

Entrando na indústria da escrita como redatora freelancer, ela rapidamente subiu na hierarquia para se tornar uma voz confiável no campo do SEO. Sua jornada na revista é marcada por muitos artigos perspicazes que ajudaram muitas empresas a entender melhor e aproveitar o SEO para melhorar sua visibilidade online.

Juliana também dedicou uma grande parte de seu tempo para estudar as últimas tendências em SEO e manter-se atualizada sobre todas as mudanças no algoritmo do Google. Através de seu trabalho, ela se esforça para quebrar conceitos complexos em ideias fáceis de entender para profissionais de marketing de todos os níveis.

O código do Visual Studio reforça o suporte ao MCP
O código do Visual Studio reforça o suporte ao MCP
14 de junho de 202514 de junho de 2025
A SmartBear revela a automação de teste acionada por IA para aplicativos iOS e Android
A SmartBear revela a automação de teste acionada por IA para aplicativos iOS e Android
13 de junho de 202513 de junho de 2025
Nifty novos projetos Python para assistir e tentar
Nifty novos projetos Python para assistir e tentar
13 de junho de 202513 de junho de 2025
O GitHub lança o servidor MCP remoto em visualização pública para alimentar os fluxos de trabalho do desenvolvedor orientado pela IA
O GitHub lança o servidor MCP remoto em visualização pública para alimentar os fluxos de trabalho do desenvolvedor orientado pela IA
13 de junho de 202513 de junho de 2025
A Europa é capturada em um dilema em nuvem
A Europa é capturada em um dilema em nuvem
13 de junho de 202513 de junho de 2025

© 2025 Tudo SEO | [email protected]

Scroll to top
  • SEO
  • CMS
  • Tutoriais & Conselhos
  • Contato