A tendência dos dados abertos está a consolidar-se em todo o mundo e irá desencadear inovações incalculáveis.
A McKinsey observa que os dados abertos, que são dados que podem ser livremente utilizados e redistribuídos livremente, poderiam contribuir anualmente com 3 biliões de dólares para a economia global e têm o potencial de “liberar a inovação e transformar todos os sectores da economia”. O Banco Mundial também reconhece “o enorme potencial dos dados abertos”, observando que o uso de dados governamentais abertos pelas empresas privadas “apenas começou a ser explorado”.
A União Europeia, que muitas vezes lidera em termos de adoção de iniciativas digitais, tem a sua Diretiva de Dados Abertos, que recentemente adicionou novos “conjuntos de dados de alto valor” que os organismos do setor público têm de disponibilizar para utilização gratuita. Esses conjuntos de dados fornecem dados geoespaciais, ambientais, meteorológicos, estatísticos, de mobilidade e de empresas, com o objetivo de promover a transformação digital da sociedade e melhorar a mobilidade, os cuidados médicos, a conservação de energia e a sustentabilidade, por exemplo.
Tal como salientado pelo comissário Thierry Breton, «as start-ups e as PME poderão utilizar estes dados para desenvolver novos produtos e soluções inovadoras que melhorem a vida dos cidadãos na UE e em todo o mundo».
Fundação de mapas de abertura
Na Overture Maps Foundation, estamos acumulando o que acreditamos ser a maior coleção do mundo de dados de mapas abertos de nível empresarial que qualquer pessoa, em qualquer lugar, pode usar para construir serviços de mapeamento interoperáveis. Com os dados certos, serviços como navegação, pesquisa local, gestão logística e realidade aumentada baseada em localização podem ser realizados rapidamente.
No entanto, à medida que os requisitos de precisão, atualidade e recursos avançados continuam a se expandir, a necessidade de uma camada base aberta de dados também cresce. Ao se basearem em camadas de dados comuns e abertas, os dados de valor agregado podem ser mais facilmente combinados e fornecer melhor interoperabilidade entre plataformas. A tarefa de criar e manter estas funcionalidades de mapeamento avançadas e ricas em dados – necessárias para mapear um mundo em constante mudança – é demasiado grande, demasiado complexa e demasiado dispendiosa para ser enfrentada por qualquer entidade.
Os melhores dados de mapas foram, até agora, proprietários. Os custos para construir e manter esses dados só aumentaram à medida que aumentou a procura por dados melhores. Dado um grande número de fontes e formas de recolher e apresentar os dados, a interoperabilidade tem sido difícil, lenta e limitante. Ao construir uma ampla rede de usuários que consomem serviços de mapas e fornecem feedback sobre a precisão dos dados, a indústria pode construir os melhores dados de mapas disponíveis. A utilização aberta através de licenciamento aberto é fundamental para expandir esse alcance.
A ideia básica dos dados de mapas abertos é a mesma do software de código aberto: construir colaborativamente um ativo que qualquer pessoa possa usar, alterar e depois redistribuir. O modelo aberto, pioneiro há cerca de três décadas para desenvolver o sistema operacional Linux, deu origem a uma indústria de software de código aberto que vale agora trilhões, observa um relatório recente da Harvard Business School. Se não fosse pelo software de código aberto, as empresas “precisariam gastar 3,5 vezes mais em software do que gastam atualmente”, afirma o relatório.
Algumas das maiores empresas de tecnologia e localização do mundo, como AWS, Meta, TomTom e Microsoft, são grandes defensoras do código aberto porque reconhecem o valor do código aberto para as suas empresas e para a economia. Portanto, não deveria ser surpresa que essas mesmas empresas se uniram no final de 2022 para lançar o Overture, que está entre os maiores projetos de dados abertos do mundo hospedados na The Linux Foundation.
A missão da Overture é construir dados de mapas abertos que darão suporte a uma ampla gama de aplicações de mapeamento e análise geoespacial. Os dados cartográficos são a representação digital do mundo físico… um conjunto de dados massivo, complexo e inter-relacionado. Para construir isso, o Overture agrega, remove duplicatas, melhora, padroniza e mantém dados resultantes de muitos sinais diferentes para construir conjuntos de dados fundamentais abrangentes que são valiosos para os cartógrafos.
Por exemplo, o tema Edifícios da Overture combina dados de crowdsourcing do OpenStreetMap, dados governamentais do Programa de Mapas Comunitários da Esri e pegadas de edifícios geradas por IA da Microsoft e do Google. O conjunto de dados combinado inclui 2,3 mil milhões de edifícios, tornando-o o maior conjunto de dados de edifícios abertos do mundo. Endereços, redes rodoviárias e locais de interesse são outros temas que dependerão fortemente da agregação de fontes de dados abertas.
Dados abertos versus código aberto
Embora existam muitas semelhanças entre projetos de dados abertos e projetos de código aberto, também existem diferenças notáveis. Essas diferenças podem impactar quem decide trabalhar com cada uma.
Em meus nove meses na Overture, avaliei como e por que o código-fonte aberto e os dados abertos diferem. Eu apontaria seis diferenças principais que têm implicações importantes para projetos de dados abertos:
- Geração de dados. O código de software é gerado a partir do cérebro humano ou de um número crescente de assistentes de codificação baseados em IA. Por outro lado, os dados são criados através de medição ou observação, exigindo sistemas ou projetos para fazer esta detecção. No caso de dados cartográficos, a detecção pode incluir a construção de uma nova estrada, uma mudança de local de negócio ou a destruição de um edifício existente. A comunidade num projeto de dados abertos precisa de obter acesso ou desenvolver estes sistemas para medir e gerar dados abertos. Muitas vezes, esta é uma necessidade contínua, medindo os dados à medida que evoluem ou mudam ao longo do tempo.
- Precisão. Os dados abertos refletem fatos. Portanto, deve ser o mais preciso possível. Os dados do mapa são uma representação digital do mundo físico. Essa representação precisa ser o mais fiel possível à realidade. No desenvolvimento de software de código aberto, é comum escrever código que é refinado posteriormente para atender a casos de uso específicos. Isso leva a um compartilhamento mais rápido: o código sai para o mundo mais rápido e é melhorado com mais rapidez. Com dados abertos, o rigor em torno da precisão terá de ser muito maior desde o início.
- Oportunidade. Alguns tipos de dados medem coisas que mudam constantemente, como qualidade do ar, condições das estradas ou avaliações comerciais. Eles precisam ser atualizados todos os meses, semanas ou até diariamente. Por causa disso, os projetos de dados abertos funcionam como uma linha de produção. Atualmente, produzimos uma nova divulgação de dados todos os meses e faremos esforços para aumentar essa frequência. Com software de código aberto, alguém pode publicar código que não é usado, analisado ou revisado por dias, meses e até anos. Os desenvolvedores que trabalham com dados abertos enfrentarão diferentes requisitos de tempo e expectativas em relação ao modo como trabalham.
- Custo e tamanho. O código-fonte aberto normalmente envolve tamanho de dados gerenciável. Nos casos de uso mais simples, o código pode ser executado localmente em um laptop. O custo para armazenar e fornecer código normalmente não é um fator. Os dados são diferentes. Big data, como dados de mapas do mundo, chega a terabytes e petabytes. Mesmo nos casos de uso mais básicos, esses dados precisam ser armazenados e fornecidos aos usuários e mantenedores, o que pode exigir investimentos iniciais substanciais.
- Licenciamento. Os dados têm que vir de algum lugar. Pode ser “propriedade” de alguém, como uma empresa privada, ou pode combinar qualquer número de repositórios de dados abertos existentes. Como os dados são derivados de fontes diferentes, os esquemas de dados precisam ser mesclados em um sistema coerente. Às vezes, alguns dados simplesmente não podem ser mesclados com outros dados sem a permissão explícita do proprietário dos dados. O código-fonte aberto também vem com licenças, mas se estivermos escrevendo código, a licença da base de código existente é conhecida e o autor é livre para escrever nele.
- Proteção de privacidade. Os dados podem incluir informações pessoais, como endereços e números de telefone que pertencem a pessoas reais, e podem incluir imagens do mundo que contenham elementos identificáveis. É preciso ter cuidado para garantir que todas as informações de identificação pessoal sejam removidas. Esse tipo de limpeza normalmente não ocorre ao escrever ou reutilizar código-fonte aberto.
A estrada à frente
Demorou décadas para que o código-fonte aberto se espalhasse pelo mainstream. Os dados abertos podem aproveitar as aprendizagens do movimento de código aberto, mas terão de desenvolver as suas próprias melhores práticas à medida que avançam. À medida que isso acontecer, levará a novos produtos e serviços em indústrias, governos e economias inteiras.
Os dados abertos beneficiarão as empresas que fornecem serviços proprietários com base nos dados abertos, tal como o código aberto beneficiou as empresas que se baseiam no código-fonte aberto. Consumidores, governos e empresas obterão benefícios em termos de mais e melhores bens e serviços.
Marc Prioleau é diretor executivo da Overture Maps Foundation.
–
O New Tech Forum oferece um local para líderes de tecnologia – incluindo fornecedores e outros colaboradores externos – explorarem e discutirem tecnologias empresariais emergentes com profundidade e amplitude sem precedentes. A seleção é subjetiva, baseada na escolha das tecnologias que acreditamos serem importantes e de maior interesse para os leitores do InfoWorld. A InfoWorld não aceita material de marketing para publicação e reserva-se o direito de editar todo o conteúdo contribuído. Envie todos consultas para [email protected].