Embora a maioria dos projetos de código aberto tenha pools de colaboradores muito limitados e muitas vezes sejam obras de um único desenvolvedor (ou uma única empresa), é mais fácil atrair colaboradores voluntários quando um projeto está dentro de uma base neutra. Como tal, a AWS demonstrou o quão sério era o sucesso do OpenSearch Open Source quando mudou o projeto para a Fundação Linux no final de 2024, estabelecendo a OpenEarch Software Foundation (OSSF). Isso não era apenas o admin arruinado; Foi estratégico. Colocar o projeto em uma base neutra abordou diretamente as preocupações sobre a AWS controlando o projeto. De repente, o Comitê Diretor Técnico (TSC) ostentou representantes da SAP, Uber, Oracle, Bytedance e outros. Além disso, o OpenSearch agora pode reivindicar mais de 1.400 colaboradores únicos (mais de 350 ativos), centenas de mantenedores em dezenas de organizações e atividades que abrangem mais de 100 repositórios do GitHub até o início de 2025. Criticamente, a porcentagem de contribuições e mantenedores de fora da AWS aumentou significativamente, sinalizando o progresso em direção à diversificação genuína.

Para a AWS, cujos princípios de liderança quase exigem controle sobre os resultados dos clientes (“entregar resultados” etc.), essa é uma mudança revolucionária na maneira como faz negócios.

Ficando melhor o tempo todo

Claramente, o OpenSearch está no caminho correto. Com a solidificação da governança, o OpenEarch buscou desenvolvimento agressivo, guiado por um roteiro público, empurrando além de suas raízes para enfrentar os desafios modernos de dados, especialmente na pesquisa e observabilidade de IA/vetor. O OpenSearch foi significativamente além da mera compatibilidade do Elasticsearch. Impulsionada pelas necessidades do usuário, o OpenSearch adicionou pesquisa de similaridade vetorial, pesquisa híbrida combinando palavras-chave e métodos semânticos e recursos internos de pesquisa neural. Somente em 2024, o OpenSearch fez grandes avanços-adiantando a integração com o FAISS do Facebook, a aceleração do hardware SIMD e a quantização de vetores para pesquisas semânticas de alto desempenho.