O que sempre me fascinou na lei de Moore é que, durante mais de meio século, as inovações tecnológicas da computação que consideramos certas – do PC aos relógios inteligentes e aos carros autónomos – dependeram da resolução de um problema pequeno e específico: a distância entre transistores em um chip. À medida que o nosso mundo movido por software se torna cada vez mais orientado pelos dados, desbloquear e desbloquear as próximas décadas de inovação depende dos dados: como os recolhemos, trocamos, consolidamos e utilizamos.
De certa forma, a velocidade, a facilidade e a precisão da troca de dados tornaram-se a nova lei de Moore.
TL;DR: A importação segura e eficiente de uma infinidade de tipos de arquivos de dados de milhares ou mesmo milhões de diferentes fontes externas não gerenciadas é um problema crescente e generalizado. A maioria das organizações tem dificuldade com a importação de arquivos porque as soluções tradicionais de ETL (extrair, transformar e carregar) e iPaaS (plataforma de integração como serviço) são projetadas para transferir dados apenas entre sistemas de TI e bancos de dados gerenciados de maneira rigorosa.
Abaixo, explicarei o que é importação de dados e os problemas comuns que as empresas enfrentam ao controlar arquivos não gerenciados. Discutirei como as novas plataformas emergentes de troca de dados são projetadas para resolver esses problemas e como essas plataformas funcionam individualmente e em conjunto com soluções ETL tradicionais para torná-las mais rápidas e ágeis.
Seis desafios de troca de arquivos de dados
Os arquivos de dados geralmente exigem mapeamento, revisão, limpeza e validação de dados. Eles podem precisar de supervisão humana antes de serem importados para bancos de dados gerenciados e sistemas de negócios. Os arquivos de dados apresentam aos desenvolvedores e às equipes de TI uma variedade de desafios:
- Integração de clientes: A necessidade de carregar dados do cliente nos aplicativos de software que os clientes usam pode introduzir atrasos ou complicações que diminuem a satisfação do cliente e provocam rotatividade.
- Fazendo upload de arquivos: aplicativos que permitem que clientes, clientes potenciais, funcionários, parceiros ou fornecedores carreguem arquivos de dados também podem induzir atrasos, erros e reclamações dos usuários finais. Alguns usuários que não conseguirem concluir a tarefa simples irão embora e nunca mais retornarão.
- Orquestrando fluxos de trabalho de dados: Muitas vezes, as empresas precisam orquestrar fluxos de trabalho de dados complexos entre diversas partes interessadas, sistemas e processos, ao mesmo tempo em que oferecem experiências contínuas de troca de dados que proporcionam o mais alto valor comercial para todos os participantes.
- Migrando dados: A preparação de dados para grandes projetos de migração de TI pode ser uma tarefa complexa e quase sempre introduz erros de dados, problemas de versão, atrasos e frustração. A transferência de dados de sistemas legados para um novo sistema empresarial requer uma extensa revisão de dados entre as partes interessadas do negócio e os especialistas em implementação. Os dados de sistemas antigos precisam ser preparados para importação para um novo sistema, o que geralmente envolve o envio e recebimento de arquivos Excel por e-mail para revisão e limpeza de dados.
- Automatizando importações de arquivos: a maioria das empresas precisa coletar periodicamente dados de parceiros, agentes ou funcionários remotos ou agregar dados de departamentos ou divisões remotas. O volume e a complexidade dos dados disponíveis crescem constantemente, transformando a coleta, importação e processamento de dados em tarefas complicadas e propensas a erros. Esses arquivos podem ser enviados por email, colocados em uma pasta compartilhada ou enviados via FTP. Freqüentemente, esses arquivos exigem que recursos sejam dedicados a um processo de mapeamento, formatação, limpeza e revisão antes que possam ser combinados com outros dados.
- Revendo dados manualmente: as importações de dados frequentemente exigem revisão manual, com tratamento de exceções e aprovações tanto no envio quanto no recebimento. Os usuários precisam ser capazes de carregar rapidamente um arquivo, examiná-lo, preencher quaisquer espaços em branco e tomar decisões simples de mapeamento. O lado receptor pode precisar revisar exceções, revisar dados de forma consolidada ou até mesmo enviar solicitações aos usuários para corrigir ou atualizar certas partes dos dados. O componente humano no processo de integração de dados requer uma abordagem totalmente nova para gerenciar a troca de dados.
Soluções alternativas para importação de dados versus uma solução de troca de dados desenvolvida especificamente
A maioria das equipes de TI depende de uma série de soluções alternativas para trazer arquivos de dados para seus negócios, geralmente com problemas significativos de qualidade de dados e com um custo alto. As empresas tentam resolver esses problemas de arquivos de dados contratando equipes externas de serviços de TI, usando modelos e regras de usuário final ou criando uma solução personalizada.
Além dos custos diretos de pessoal e manutenção necessários para essas soluções alternativas, o custo de oportunidade da perda e do atraso na receita aumenta enormemente o impacto da importação de dados. Uma solução de troca de dados irá agilizar, acelerar e proteger os processos de importação de dados, melhorando a velocidade dos negócios e proporcionando um ROI rápido e sustentado.
A solução certa irá:
- Reduza erros de dados;
- Acelerar a tomada de decisões oportuna;
- Reduza o tempo e o custo de desenvolvimento interno;
- Aumentar a usabilidade dos dados;
- Acelere o tempo de valorização;
- Melhore a segurança e a conformidade.
Construir vs. comprar (ou uma mistura de ambos)
Além de criar um importador de arquivos do zero, as empresas podem recorrer a diversas bibliotecas de código aberto e soluções comerciais para completar sua arquitetura de integração de dados corporativos. Construir é sempre um compromisso de longo prazo e envolverá o desenvolvimento de novos recursos à medida que as necessidades de importação de arquivos mudam (como adicionar novos idiomas ou lidar com questões regulatórias que podem surgir com o suporte a um novo cliente), além de oferecer suporte e manutenção à ferramenta ao longo do tempo .
Algumas empresas optam por adquirir uma ferramenta de importação de CSV, escolhendo entre as diversas opções que surgiram nos últimos anos. Essas ferramentas oferecem funcionalidades básicas, mas normalmente são limitadas a um caso de uso estritamente definido e não podem atender às necessidades variadas e em evolução dos casos de uso corporativos.
A terceira opção é uma abordagem “construir com” que fornece a funcionalidade e a escalabilidade do software, juntamente com a flexibilidade para atender às necessidades comerciais específicas de uma organização. Uma plataforma de importação de arquivos baseada em API permite que os desenvolvedores criem importações de arquivos de dados totalmente personalizáveis, usando código para impulsionar negócios e lógica de dados sem a necessidade de manter o encanamento subjacente.
Quer uma organização faça você mesmo, terceirize ou construa com uma plataforma, existem certas funções básicas que qualquer solução de troca de dados precisa suportar.
Análise de dados é o processo de agregar informações (em um arquivo) e dividi-las em partes distintas. Um recurso de análise de dados que oferece a capacidade de transformar um arquivo em uma matriz de dados discretos e simplifica esse processo para os usuários finais. Junto com a análise, adequada estruturação de dados garante que os dados sejam recebidos no sistema e rotulados adequadamente. As APIs esperam um formato específico de dados e falharão sem ele.
Data de validade envolve a verificação dos dados para garantir que correspondam a um formato ou valor esperado, evitando a ocorrência de problemas no futuro e eliminando a necessidade de os usuários finais removerem e recarregarem os dados. Após validação, mapeamento e correspondência de dados referem-se a pegar os dados de origem anteriormente desconhecidos e combiná-los com um destino conhecido. Sem mapeamento de dados, as importações falharão quando os elementos de dados — como títulos de colunas — não corresponderem exatamente.
Transformação de dados envolve fazer alterações nos dados à medida que eles fluem para o sistema para garantir que atendam a um valor esperado ou desejado. Em vez de enviar dados de volta aos usuários com uma mensagem de erro, os dados passam por pequenos ajustes sistemáticos para garantir que sejam utilizáveis.
Entrada/saída de dados refere-se a todas as maneiras pelas quais os dados podem ser movidos para dentro e para fora da ferramenta. Pode ser tão simples quanto fazer download e upload ou tão complexo quanto automatizar importações e postar exportações em uma API externa. A entrada e saída de dados devem estar alinhadas com as necessidades operacionais de uma organização.
Desempenho em escala e facilitando colaboração entre vários usuários é imperativo. O que pode ser suficiente no curto prazo pode rapidamente evoluir para um sistema lento, a menos que você considere as necessidades futuras.
Segurança, conformidadee acesso as funcionalidades garantem que a solução de importação de dados funcione perfeitamente, se alinhe aos requisitos regulatórios, proteja a integridade dos dados e aumente a transparência. Esses elementos formam a base de uma ferramenta confiável de importação de arquivos.
ETL + importação de dados = mais fortes juntos
As soluções de troca e importação de dados são projetadas para funcionar perfeitamente junto com as soluções de integração tradicionais. As ferramentas ETL integram sistemas estruturados e bancos de dados e gerenciam a transferência e sincronização contínuas de registros de dados entre esses sistemas. Adicionar uma solução para troca de arquivos de dados junto a uma ferramenta ETL permite que as equipes facilitem a importação e troca contínua de arquivos de dados variáveis não gerenciados.
Os sistemas de troca de dados e ETL podem ser implementados em trilhas separadas, independentes e paralelas, ou para que a solução de troca de arquivos de dados alimente os dados reestruturados, limpos e validados na ferramenta ETL para consolidação adicional em sistemas empresariais downstream.
Uma plataforma de troca de dados integrada a uma ferramenta ETL tradicional oferece diversas vantagens no gerenciamento e transferência de dados:
- Coleta de dados de muitas fontes (pequenas ou grandes)
- Qualquer fonte
- Humano no circuito
- Colaboração de dados
- Integração de dados efêmeros
- Limpeza e validação de dados inteligentes e escaláveis
- Porta segura para dados externos
A combinação de uma plataforma de troca de dados com uma ferramenta ETL criará um ecossistema moderno de integração e gestão de dados que permitirá às empresas utilizar melhor todos os seus dados e começar a colher os benefícios da nova lei de Moore.
David Boskovic, fundador e CEO da Flatfile.
–
Generative AI Insights oferece um local para líderes de tecnologia – incluindo fornecedores e outros colaboradores externos – explorarem e discutirem os desafios e oportunidades da inteligência artificial generativa. A seleção é ampla, desde aprofundamentos tecnológicos até estudos de caso e opiniões de especialistas, mas também subjetiva, com base em nosso julgamento de quais tópicos e tratamentos servirão melhor ao público tecnicamente sofisticado do InfoWorld. A InfoWorld não aceita material de marketing para publicação e reserva-se o direito de editar todo o conteúdo contribuído. Contato [email protected].