• Um banco de dados vetorial, que armazena incorporações de documentos, é dimensionado rapidamente e oferece suporte ao armazenamento distribuído para indexação avançada e consulta vetorial.
  • Uma biblioteca de vetores, que é uma maneira mais rápida e leve de armazenar incorporações de vetores.
  • Suporte vetorial integrado ao banco de dados existente para armazenar incorporações de vetores e dar suporte a consultas.

A melhor escolha depende de suas circunstâncias específicas. Por exemplo, um banco de dados vetorial nativo é o método mais robusto, mas é muito caro e exige muitos recursos para ser prático para organizações menores. Uma biblioteca de vetores é mais rápida e melhor para momentos em que a latência é o inimigo, enquanto a integração de recursos de vetores é mais fácil, mas não é escalonável o suficiente para necessidades corporativas pesadas.

3. Construa um processo de recuperação sólido.

Está bem no nome – RAG tem tudo a ver com recuperar os dados certos para construir respostas precisas. No entanto, você não pode simplesmente apontar sua infraestrutura RAG para fontes de dados e esperar que ela recupere as melhores respostas. Você precisa ensinar aos sistemas RAG como recuperar informações relevantes, com forte ênfase na relevância. Muitas vezes, os sistemas RAG coletam dados em excesso, resultando em ruído e confusão excessivos.

“A pesquisa experimental mostrou que a qualidade da recuperação é significativamente mais importante do que a quantidade, com sistemas RAG que recuperam menos documentos, mas mais relevantes, superando, na maioria dos casos, aqueles que tentam recuperar o máximo de contexto possível, resultando em uma superabundância de informações, muitas das quais podem não ser suficientemente relevantes”, observa Iván Palomares Carrascosa, consultor de projetos de aprendizagem profunda e LLM.