Como a maioria do pessoal de TI sabe, as GPUs estão em alta demanda e são essenciais para executar e treinar modelos generativos de IA. O setor de nuvem alternativa, também conhecido como micronuvens, está passando por um aumento significativo. Empresas como CoreWeave, Lambda Labs, Voltage Park e Together AI estão na vanguarda deste movimento. CoreWeave, que começou como um empreendimento de mineração de criptomoedas, tornou-se um importante fornecedor de infraestrutura de GPU.

Esta mudança ilustra uma tendência mais ampla em que as empresas dependem cada vez mais de serviços de GPU alojados na nuvem, principalmente devido ao elevado custo e aos requisitos técnicos de instalação e manutenção do hardware necessário no local. Como os provedores de nuvem pública não estão descontando esses serviços de computação, as micronuvens oferecem um caminho melhor para muitas empresas.

Por que não optamos pelos serviços de nuvem “tradicionais” fornecidos pela AWS, Google Cloud e Microsoft Azure, que também oferecem uma variedade de recursos de GPU? A resposta, como sempre, é dinheiro. As micronuvens costumam ser uma solução mais econômica para projetos de IA que exigem GPUs. O custo do aluguel de GPUs populares, como o A100 40GB da Nvidia, pode ser significativamente menor no CoreWeave ou outra plataforma de micronuvem, em comparação com o Azure ou o Google Cloud (verifique os preços atuais; esta é uma observação muito geral).

Empresas, tenham cuidado

Apesar da vitalidade deste sector, o futuro permanece algo incerto. A viabilidade de crescimento destes fornecedores depende da garantia de um fornecimento consistente de GPUs em grandes quantidades e a preços competitivos. Além disso, com os principais operadores de cloud a investirem em hardware de processamento de IA personalizado, as pressões competitivas poderão intensificar-se e manifestar-se como preços mais baixos que mantêm a competitividade dos grandes fornecedores de cloud.

Além disso, embora as GPUs sejam atualmente preferíveis para tarefas generativas de IA devido à sua velocidade e capacidade de fazer muitas coisas ao mesmo tempo, nem todas as cargas de trabalho de IA exigem GPUs. Como mencionei antes, as GPUs são um exagero para a maioria das cargas de trabalho generativas de IA. Hoje em dia, muitas vezes são mais um símbolo de status do que uma necessidade.

As CPUs ainda podem ser usadas para tarefas menos urgentes, onde um ritmo mais lento é aceitável. Alguns novos e promissores processadores semelhantes a GPU estão em desenvolvimento e podem oferecer processamento mais específico para IA generativa a um custo menor do que as GPUs atuais.

O principal objetivo do uso de qualquer recurso, incluindo processadores, é fazer o máximo com o mínimo. Para a maioria dos casos de uso de IA, os custos trarão muitas empresas de volta à realidade e o entusiasmo será jogado pela janela.

Um futuro brilhante para micronuvens

Esta é uma notícia de advertência para as empresas que podem ficar cegas pelo hype. As perspectivas imediatas para as micronuvens são optimistas. Os analistas esperam que o crescente campo da IA ​​generativa continue a impulsionar a demanda, o que deve encorajar mais startups de nuvem de IA centradas em GPU.

Meu conselho? Se as GPUs forem necessárias para projetos futuros, as empresas deverão considerar soluções que exijam GPUs. O custo da mudança, pelo menos por enquanto, não deve ser um determinante para a maioria destas arquitecturas.

Estes novos participantes poderão oferecer uma forte concorrência aos intervenientes na nuvem estabelecidos, especialmente para os clientes que estão abertos à adoção de tecnologias mais novas e mais baratas para gerir os seus ambientes multicloud. As empresas estão lutando com o alto custo da nuvem, que excede seus orçamentos. Uma alternativa mais barata será um desenvolvimento bem-vindo.

Há quase duas décadas, os grandes players começaram a surgir no mercado de computação em nuvem. Entre 2012 e 2016, passamos de cerca de três dúzias de empresas de nuvem para apenas um punhado, à medida que o mercado de nuvem se normalizava. Espero ver o mesmo padrão aqui.

Qualquer novo iniciante tem grandes preocupações. Podem perder financiamento, ser esmagados por intervenientes maiores ou sofrer uma miríade de outras catástrofes imprevistas. Muito provavelmente eles serão adquiridos no futuro e combinados com um sistema de nuvem maior, ou talvez algumas dessas novas empresas unirão forças. Alguns destes resultados representam problemas para as empresas, mas a maioria não. O futuro das micronuvens continua brilhante.