A Microsoft não é a única a fazer ondas. A AWS já se estabeleceu com chips personalizados, como Trainium for Machine Learning Training, Inferentia para cargas de trabalho de inferência e seu sistema Nitro para virtualização e segurança avançadas. O Google trouxe suas unidades de processamento de tensores (TPUs) para o mercado anos atrás como uma solução personalizada para tarefas de aprendizado de máquina. Combinados, essas inovações não estão apenas preenchendo a lacuna deixada pelas GPUs convencionais, eles estão redefinindo como pensamos sobre cargas de trabalho em escala.
Outros participantes do setor estão seguindo o exemplo. A Nvidia, mais conhecida por suas GPUs, introduziu chips Bluefield e a AMD está se inclinando para o seu portfólio de Pensando. O resultado é um ecossistema cada vez mais dependente de aceleradores personalizados sintonizados com tarefas específicas – muito longe dos dias em que um punhado de marcas dominava o mercado de chips.
Corrigindo a escassez de GPU e mais
A motivação abrangente para investir em silício personalizada é clara: as GPUs tradicionais, embora poderosas, geralmente são muito famintas de poder, caras e de uso geral para lidar com as demandas diferenciadas da computação em nuvem moderna. Com mais demanda do que a oferta das GPUs da NVIDIA, por exemplo, soluções alternativas, como chips projetados personalizados, oferecem mais controle sobre os índices de desempenho de preços, eficiência energética e requisitos de refrigeração.