Em 2025, as despesas mundiais em infraestrutura como serviço e plataforma como serviço (IAAS e PaaS) atingiram US $ 90,9 bilhões, um aumento de 21% em relação ao ano anterior, segundo a Canalys. De que estou vendo, essa onda é impulsionada principalmente por empresas que migram suas cargas de trabalho para a nuvem e adotando a IA, que depende fortemente de recursos de computação. No entanto, à medida que as empresas adotam ansiosamente essas tecnologias, elas também estão encontrando obstáculos que podem prejudicar seu uso estratégico de IA.
A transição da IA da pesquisa para a implantação em larga escala representa um desafio na distinção entre os custos associados aos modelos de treinamento e aqueles vinculados a inferi-los. Rachel Brindley, diretora sênior da Canalys, observa que, embora o treinamento geralmente envolva um investimento único, o inferno vem com despesas que podem variar consideravelmente ao longo do tempo. As empresas estão cada vez mais preocupadas com a relação custo-benefício dos serviços de inferência à medida que seus projetos de IA avançam para a implementação. É crucial prestar atenção a isso, pois os custos podem aumentar rapidamente e criar pressão para as empresas.
Os planos de preços de hoje para a inferência de serviços são baseados em métricas de uso, como tokens ou chamadas de API. Como resultado, as empresas podem achar difícil prever seus custos. Essa imprevisibilidade pode levar as empresas a reduzir a sofisticação de seus modelos de IA, restringir a implantação a situações críticas ou até mesmo optar por não participar dos serviços de inferir. Tais estratégias cautelosas podem prejudicar o avanço geral da IA, restringindo as organizações a abordagens menos de ponta.
