O que vem após o transbordamento da pilha?

Por mais de uma década, o Stack Overflow tem sido o fórum preferido para desenvolvedores que buscam respostas para perguntas de codificação. No auge em meados de 2010, o site viu mais de 200.000 novas perguntas a cada mês. Esses dias se foram. Desde a chegada de assistentes de IA, como o ChatGPT, o uso do Stack Overflow caiu de um penhasco. De fato, de março de 2023 a março de 2024, o volume de novas perguntas caiu de ~ 87.000 para ~ 58.800, um declínio de 32% em apenas um ano. Até o final de 2024, as perguntas mensais caíram 40% ano a ano, atingindo níveis não vistos desde 2009. Os desenvolvedores, que anteriormente confiaram na validação da comunidade para obter respostas precisas, agora confiam cada vez mais as respostas de um algoritmo, que são imediatas e confiantes (mas nem sempre corretas).

Essa mudança cria um problema irônico: esses grandes modelos de idiomas (LLMs) devem suas impressionantes bases de conhecimento a conteúdo gerado pelo ser humano de plataformas como o Stack Overflow, criando o tipo de dilema de canibal. Escrevi longamente sobre esse problema, mas a verdadeira questão não é sobre como recuperar o que perdemos, mas como mudar para o futuro. À medida que essas comunidades desaparecem, o que os LLMs usarão para treinamento futuro e como os desenvolvedores garantirão a precisão e a confiabilidade das respostas que essas ferramentas fornecem?

Paradoxalmente, os assistentes de IA que deslocam o excesso de pilha são os próprios produtos do sucesso do Stack Overflow. LLMs como o ChatGPT se tornaram “inteligentes”, treinando em vastos tesouros de conteúdo gerado pelo ser humano-muito raspado de sites como o Stack Overflow. Toda resposta bem explicada, todas as práticas recomendadas debatidas e todo trenó de código voto nesses fóruns se tornava uma moagem de IA. Em um sentido muito real, os dados que fluem das plataformas de perguntas e respostas da comunidade são a base na qual as iterações futuras do LLMS são construídas. Os primeiros modelos foram treinados em conjuntos de dados que incluíam milhões de postos de transbordamento de pilha, capturando as nuances dos problemas de programação e suas soluções.