Como venho dizendo há mais ou menos um ano, as conferências na nuvem se tornaram conferências generativas de IA, assim como as conferências de data centers, conferências de bancos de dados e você escolhe. É claramente mais do que apenas uma tendência – é um impulso revolucionário. Mas já vimos isso acontecer muitas vezes nos últimos 30 anos para saber que nada é garantido como uma verdadeira tendência. Lembra da “tecnologia push?” Exatamente.

À medida que as empresas avançam rumo à IA generativa, a seleção de uma infraestrutura apropriada é fundamental para um desempenho ideal e uma boa relação custo-benefício. A comparação da computação em nuvem com as soluções locais tradicionais revela algumas coisas interessantes quando as plataformas em nuvem hospedam aplicativos generativos de IA. Essas fraquezas podem significar que as plataformas de computação em nuvem pública não são um problema quando se trata do melhor lugar para os sistemas generativos de IA viverem. Vamos explorar isso.

Conveniência versus eficiência de custos

A nuvem é a melhor plataforma para IA generativa quando se trata de conveniência. As plataformas de nuvem pública estão bem enraizadas em todo o ecossistema de ferramentas generativas de IA e assistência ao desenvolvimento, o que torna a construção e implantação de sistemas generativos de IA em plataformas de nuvem pública o “botão fácil” da IA.

Este fato por si só tornará a nuvem a primeira plataforma usada pela maioria dos empreendedores, considerando que eles estão apenas ficando espertos sobre os casos de uso da genAI e como os sistemas devem ser implantados. Concentrei-me na nuvem na maioria dos meus projetos de IA nos últimos 10 anos por motivos semelhantes. É apenas mais fácil.

Mas é mais econômico? A história nos diz que optamos pela nuvem em busca de facilidade de implantação e escalabilidade, mas aprendemos rapidamente que as plataformas em nuvem geralmente custam mais do que as análogas locais. Sua milhagem pode variar e depende especificamente do seu caso de uso. Mas pode-se afirmar de maneira geral que a nuvem será uma plataforma mais cara para IA generativa, no geral. Isso vem de um cara que tem um blog na nuvem, um podcast na nuvem, um livro na nuvem e um canal na nuvem no YouTube.

Aprendendo com o passado recente

Isto não significa que as empresas devam comprar ou construir os seus próprios centros de dados. Melhores opções incluem provedores de colocation (colo) e provedores de serviços gerenciados que alugam hardware e espaço de data center e também podem operar esses sistemas para você.

Além disso, você deve considerar as micronuvens que estão surgindo. São startups de provedores de nuvem .ai que fornecem GPUs e TPUs como serviço. Eles terão que cobrar menos do que os provedores de nuvem pública para competir. Assim, podem ser mais rentáveis ​​para qualquer empresa que queira arriscar com eles. É seguro presumir que a maioria deles será engolida pelos grandes fornecedores dentro de alguns anos.

As lições que aprendemos no passado recente são aplicáveis ​​aqui. As nuvens públicas são boas, mas têm um custo que muitas empresas consideram pouco útil, cerca de 2,5 vezes maior do que pensavam. Esse número é arbitrário, mas bastante preciso, com base na minha experiência.

É claro que a maior parte destes custos excessivos são feridas autoinfligidas. Muitas empresas transferiram cargas de trabalho para a nuvem na expectativa de modernizá-las em algum momento, para que gastassem menos dinheiro. Isso nunca aconteceu e agora alguns deles estão sendo devolvidos aos sistemas locais. Os sistemas de IA generativos serão, em sua maioria, totalmente novos, portanto, esses tipos de erros de “chutar a lata no caminho” não devem ocorrer.

O que considerar?

Claro, existem outras questões além do custo. A segurança vem à mente. Armazenar dados confidenciais na nuvem aumenta as preocupações com a segurança, pois os provedores de nuvem podem não oferecer o mesmo nível de segurança que as configurações locais. Certas indústrias têm exigências regulatórias específicas relativas ao armazenamento e processamento de dados.

Parte disso é percepção versus realidade. Em muitos casos, os provedores de nuvem pública pode fornecer melhor segurança do que no local. No entanto, alguns casos de uso envolvem dados muito confidenciais e modelos de conhecimento que são uma situação arriscada para os negócios caso esses dados sejam perdidos. Muitas empresas insistem, portanto, em manter os dados e os modelos de IA internamente.

Além disso, a infraestrutura em nuvem pode introduzir latência devido à transmissão de dados para locais de processamento remotos, e a natureza distribuída das configurações de nuvem pode trazer à tona preocupações com a privacidade dos dados. Além disso, o acesso aos serviços em nuvem requer uma conexão estável à Internet para operações contínuas. As interrupções podem interromper a disponibilidade do serviço, impactando a continuidade operacional.

Por fim, os cenários de nuvem híbrida podem encontrar desafios para estruturar adequadamente os dados para múltiplas plataformas e gerenciar vários recursos em diferentes ambientes. Gerenciar processos de sincronização e garantir a consistência dos dados pode ser complexo em um ambiente de dados distribuídos, que é o que é a computação em nuvem.

Tudo isto significa que as pessoas que vêem a nuvem como a única plataforma para sistemas generativos de IA ainda não calcularam a conta. Suspeito que alguns anos na nuvem, milhões pagos em taxas de infraestrutura em nuvem e o fato de o hardware ser agora barato levarão muitas empresas de volta aos data centers tradicionais para IA generativa.

Em resposta, penso que muitos fornecedores de nuvens irão baixar temporariamente os seus preços na esperança de atrair grandes empresas e depois aumentá-los mais tarde. Investiram milhares de milhões para entrar solidamente no espaço da IA ​​generativa e, eventualmente, terão de recuperar o seu investimento.

Todos nós temos decisões a tomar sobre o que retornará mais valor aos nossos respectivos negócios. Vejo as linhas de batalha sendo traçadas agora. Que vença a plataforma que retornar mais valor.