Muitas vezes fico surpreso ao ver como a imprensa enquadra as falhas da computação em nuvem. Por exemplo, manchetes como “A nuvem não consegue entregar”. Eles podem gerar cliques, mas são enganosos. A tecnologia em nuvem sempre cumpriu o que foi prometido. A questão é que o erro humano é a principal causa das falhas na nuvem, o que não mudou ao longo das gerações desta tecnologia.
Como já escrevi muitas vezes aqui, a maioria das falhas tecnológicas tem um único padrão típico: mal-entendidos, falta de liderança e, em muitos casos, falta de conhecimento e experiência. À medida que nos propusemos a impulsionar projetos substanciais de IA generativa na nuvem, é hora de refletir e ver como podemos fazer melhor.
Principais razões para o fracasso
As razões pelas quais as falhas ocorrem variam muito. Os quatro principais que vejo incluem:
Arquitetura inadequada. Muitas vezes, as empresas migram para a nuvem sem planejamento ou compreensão adequada da computação em nuvem. Podem surgir problemas significativos de desempenho ou confiabilidade. Ou, mais provavelmente, sistemas extremamente subotimizados na nuvem que consomem de 5 a 10 vezes mais dinheiro do que deveriam. Nós superamos essas questões até a morte aqui, e não vou me alongar sobre isso.
Acordos de nível de serviço (SLAs) mal definidos. Por que os padrões de desempenho esperados não são atendidos? Isso se deve principalmente a SLAs mal definidos entre a organização e o provedor de serviços em nuvem. Já vi projetos que matam onde um pouco de matemática poderia ter poupado muita dor a todos após a implantação. Embora os SLAs possam ser confusos, nunca vi um caso em que um provedor de nuvem não cumprisse seu objetivo. Em vez disso, os acordos não estavam alinhados com o que os utilizadores da nuvem esperavam e com o que foi entregue, principalmente porque as pessoas não prestaram atenção ao acordo antes de o executar.
Má gestão de recursos de nuvem e excesso de custos. Recursos mal gerenciados podem levar a estouros de orçamento ou gargalos de desempenho, muitas vezes confundidos com deficiências da nuvem. É por isso que o finops existe agora. Aqui, novamente, ao rastrear esses custos até a causa real do problema, muitas vezes há um desalinhamento entre o que os usuários da nuvem pensavam que estava sendo entregue por um preço específico e o que realmente foi entregue quando os recursos não foram gerenciados corretamente.
Processos de segurança e conformidade inadequados e tecnologia de suporte. Os desinformados presumem que o provedor de nuvem deve cuidar de todas as necessidades de segurança. Esse nunca é o caso, dado o modelo de responsabilidade partilhada. Os clientes da nuvem são responsáveis por proteger seus aplicativos e dados na nuvem. Isso envolve compreender profundamente estratégias complexas de gerenciamento de identidade e acesso (IAM), criptografia e monitoramento. Em muitos casos, as empresas não têm talento para lidar com estas questões e esperar pelo melhor. Isso leva a violações que compõem o ciclo de notícias de 24 horas.
Como fazer melhor
Não sou a favor de colocar a tecnologia de computação em nuvem em algum pedestal onde ela não possa fazer nada de errado. No entanto, se você observar os padrões de falhas, verá que os humanos são o elo mais fraco na maior parte do tempo. Decisões erradas podem ser atribuídas a mal-entendidos, falta de experiência e, o maior problema, à falta de pessoal qualificado.
Suspeito que a falta de talento seja resultado do mercado de computação em nuvem estar caminhando agora em duas direções. Primeiro, a tecnologia está a tornar-se muito mais complexa; as soluções são altamente heterogêneas e têm muitas partes móveis. Em segundo lugar, o número de arquitetos qualificados de computação em nuvem, engenheiros de segurança, engenheiros de banco de dados, etc., está crescendo abaixo do ritmo da demanda.
Quando as empresas contratam candidatos pouco qualificados que cometem erros estúpidos, os problemas são descobertos depois de meses, às vezes anos. A maioria das coisas funciona bem durante a implantação, mas os pontos fracos são descobertos mais tarde. É quando você recebe uma grande conta de computação em nuvem ou seus dados são violados.
Portanto, dado que esta é realmente uma questão de pessoas e não de tecnologia, o foco precisa estar nas pessoas, que é o que a maioria de vocês não queria ouvir. É hora de treinamento e contratação estratégica e de ser muito exigente em relação a quem você confia para tomar decisões importantes sobre como a tecnologia deve ser aproveitada, incluindo a tecnologia de nuvem.
Isso pode ser feito, mas você precisa ser proativo e estar disposto a gastar algum dinheiro. É aqui que a maioria das empresas fica aquém, especialmente aquelas que consideram a TI apenas uma despesa. Suas tentativas de economizar dinheiro acabam custando 10 mil vezes mais do que qualquer dinheiro economizado. Some o verdadeiro custo dos erros, bem como o acúmulo de dívida técnica.
A questão maior é compreender a importância de tudo isso. Muito do que estou listando aqui acontece quando a empresa não prioriza a liderança de TI. Você pode reclamar dos erros táticos, como não alocar dinheiro suficiente para contratar e manter talentos. No entanto, isso vem de cima – assim como a maioria dos problemas e soluções. Nós precisamos fazer melhor.