O termo “ponto de inflexão” é usado em demasia, mas certamente se aplica ao estado atual da inteligência artificial. Os fornecedores de tecnologia – e as empresas que deles dependem – podem escolher um de dois caminhos para o desenvolvimento da IA: proprietário ou código aberto. Esta dicotomia existe há décadas, com ambos os lados alcançando grandes níveis de sucesso. No entanto, eu diria que os riscos para a IA são maiores do que alguma vez vimos e que o modelo de código aberto é fundamental para a produção e consumo produtivo, economicamente viável e seguro da IA.

E, em termos de código aberto, o projeto Kubernetes deve servir como modelo para a forma como desenvolvemos, governamos, financiamos e apoiamos projetos de IA, grandes modelos de linguagem (LLMs), paradigmas de formação e muito mais.

Kubernetes é uma história de sucesso de código aberto – não para uma única empresa, mas para todas as empresas, fundações sem fins lucrativos e colaboradores individuais independentes envolvidos. Sim, é uma solução de orquestração de contêineres que atendeu efetivamente a uma necessidade do mercado. Mas, o que é mais importante neste contexto, o Kubernetes é uma das comunidades com melhor funcionamento na história do desenvolvimento tecnológico.

Desde que o Kubernetes se juntou à Cloud Native Computing Foundation (CNCF) em 2016, milhares de organizações e dezenas de milhares de indivíduos contribuíram para o projeto, de acordo com um relatório da CNCF. Esses indivíduos incluem empresas com fins lucrativos, fundações sem fins lucrativos, universidades, governos e, principalmente, contribuintes independentes (ou aqueles não afiliados ou pagos por uma organização).

Compartilhando o custo da inovação

Em finanças e desenvolvimento de produtos, é comum pensar em termos de criação e captura de valor. O projeto Kubernetes criou imenso valor no mercado. E, se você pensar bem, o projeto Kubernetes também capturou valor para qualquer pessoa envolvida nele. Os colaboradores – sejam eles indivíduos, empresas, organizações sem fins lucrativos ou governos – ganham não apenas voz sobre o que o projeto pode fazer, mas também o prestígio de estarem conectados a uma tecnologia e comunidade amplamente utilizada e altamente respeitada. Assim como trabalhar no Goldman Sachs ou no Google, se você contribuir para o projeto Kubernetes por três a quatro anos, poderá conseguir um emprego em qualquer lugar.

Para as empresas, qualquer custo investido no pagamento de desenvolvedores, engenheiros de qualidade, redatores de documentação, gerentes de programas, etc., para trabalhar no Kubernetes tem potencial para um retorno significativo, especialmente quando comparado com esforços proprietários para desenvolver uma base de código igualmente cara. Se eu for uma empresa proprietária, posso investir US$ 100 milhões em pesquisa e desenvolvimento para obter um retorno de US$ 200 milhões com a venda de um produto. Se eu for uma empresa de código aberto, posso investir US$ 20 milhões, enquanto outras organizações podem investir os US$ 80 milhões restantes, mas ainda assim recebo um retorno de US$ 200 milhões. Existem muitos negócios de US$ 100 milhões a US$ 300 milhões construídos em código aberto, e é muito melhor ter outras pessoas ajudando você a financiar a pesquisa e desenvolvimento de sua base de código!

Este modelo será ainda mais importante para a IA porque os custos associados à IA são astronómicos. E quanto mais popular a IA se torna, e quanto maiores se tornam os LLMs, maiores serão os custos. Estou falando de custos gerais, desde as pessoas que desenvolvem e mantêm modelos de IA até o poder computacional necessário para executá-los. Fazer com que todas as organizações gastem bilhões de dólares em modelos básicos simplesmente não será escalável.

Nos círculos de start-ups, é do conhecimento geral que o capital de risco não quer financiar mais novos negócios com base na venda de um modelo de base. Isto ocorre em parte porque há muita concorrência (por exemplo, Meta e Mistral estão distribuindo seus modelos de base gratuitamente) e em parte porque os VCs antecipam que obterão melhores retornos sobre o investimento ao construir soluções sobre esses modelos de base.

O custo financeiro é apenas uma métrica, a carga cognitiva é outra. O número de empresas e indivíduos envolvidos no projeto Kubernetes não traz apenas benefícios financeiros; também garante que o código esteja em conformidade com as expectativas e atenda aos padrões de qualidade. Muitas mãos facilitam o trabalho, mas também multiplicam ideias, conhecimentos e escrutínio. Projetos de IA sem essa massa crítica de desenvolvedores são insustentáveis ​​e não terão a mesma qualidade ou velocidade. Isso poderia levar à consolidação no espaço de IA, como a orquestração de contêineres anterior (Apache Mesos e Docker Swarm não podiam competir com o Kubernetes). A massa crítica é particularmente importante com a IA porque os riscos são potencialmente muito maiores. Quanto menos participantes (e menos alinhados com os princípios do código aberto), maior a chance de preconceitos e erros não verificados, cujas repercussões nem podemos imaginar neste momento.

Pelo lado positivo, se todos contribuírem para um modelo de código aberto, poderíamos estar a falar de biliões de parâmetros. Com base nos princípios de código aberto, esses modelos (parâmetros 7B, 70B, 1T) poderiam ser usados ​​com base no tamanho para todos os tipos de coisas diferentes e também seriam treinados de forma transparente. Você obteria as melhores e mais brilhantes ideias – e análises – de todas essas pessoas diferentes para treiná-lo.

Uma proposta de valor matadora

Isso equivale a uma proposta de valor bastante matadora para a IA de código aberto: é mais barata, inclui ótimas ideias de muitas pessoas e qualquer pessoa pode usá-la para o que quiser. O projeto upstream do InstructLab – que permite a praticamente qualquer pessoa melhorar os LLMs em menos tempo e com um custo menor do que é possível atualmente – está tentando alcançar exatamente o que descrevi.

Além disso, não descarte a parte da cadeia de suprimentos de IA. É tudo uma questão de redução de riscos: você quer colocar isso nas mãos de um fornecedor que faz tudo isso secretamente? Ou você quer divulgá-lo na comunidade de código aberto e confiar em um grupo de empresas, organizações sem fins lucrativos, governos e colaboradores individuais — trabalhando juntos para mostrar e verificar seu trabalho — para fazer isso? Eu sei qual deles me deixa menos nervoso.

O Kubernetes não é o único projeto de código aberto que pode servir como um exemplo poderoso para IA – Linux, alguém? – mas o cronograma relativamente curto do Kubernetes (até agora) fornece uma imagem clara dos fatores que levaram ao sucesso do projeto e como isso aconteceu para as empresas de produtos, empresas de serviços, organizações sem fins lucrativos, governos e outras organizações que fazem uso dele.

Um ambiente de código aberto que inclua muitos colaboradores, todos reunidos em torno de permitir que as pessoas usem e ajustem projetos de maneira sensata e segura, é o único caminho para um futuro realista para IA confiável. Em vez de depender de instituições globais ou da interdependência económica, a IA de código aberto fornece uma solução que deverá satisfazer qualquer realista obstinado, céptico e ofensivo que acredite que a maioria das empresas privadas não faz o que é melhor, mas sim o que pode fazer. 🙂

Na Red Hat, Scott McCarty é gerente sênior de produto principal do RHEL Server, indiscutivelmente o maior negócio de software de código aberto do mundo. Scott é um veterano em startups de mídia social, um veterano em comércio eletrônico e um experiente tecnólogo de pesquisa governamental, com experiência em uma variedade de empresas e organizações, desde startups de sete pessoas até empresas de tecnologia com 12.000 funcionários. Isso culminou em uma perspectiva única sobre desenvolvimento, entrega e manutenção de software de código aberto.

O New Tech Forum oferece um local para explorar e discutir tecnologias empresariais emergentes com profundidade e amplitude sem precedentes. A seleção é subjetiva, baseada na escolha das tecnologias que acreditamos serem importantes e de maior interesse para os leitores do InfoWorld. A InfoWorld não aceita material de marketing para publicação e reserva-se o direito de editar todo o conteúdo contribuído. Envie todas as perguntas para [email protected].