A geração de recuperação com agente de recuperação (RAG) é uma técnica usada para “aterrar” modelos de idiomas grandes (LLMs) com fontes de dados específicas, geralmente fontes que não foram incluídas no treinamento original dos modelos. As três etapas de Rag são recuperadas de uma fonte especificada, o aumento do prompt com o contexto recuperado da fonte e, em seguida, geração usando o modelo e o prompt aumentado.

A certa altura, Rag parecia que seria a resposta para tudo o que há de errado com o LLMS. Embora Rag possa ajudar, não é uma correção mágica. Além disso, o RAG pode apresentar seus próprios problemas. Finalmente, à medida que os LLMs melhoram, adicionando janelas de contexto maiores e melhores integrações de pesquisa, o RAG está se tornando menos necessário para muitos casos de uso.

Enquanto isso, vários tipos novos e aprimorados de arquiteturas de trapos foram introduzidas. Um exemplo combina RAG com um banco de dados de gráfico. A combinação pode tornar os resultados mais precisos e relevantes, principalmente quando os relacionamentos e o conteúdo semântico são importantes. Outro exemplo, o Agentic Rag, expande os recursos disponíveis para o LLM para incluir ferramentas e funções, bem como fontes de conhecimento externas, como bancos de dados de texto.