• Facilidade de uso, com desenvolvedores capazes de começar por meio de uma API que permite prototipagem e experimentação rápidas.
  • Orquestração gerenciada, para lidar com recuperação de dados e integração LLM.
  • Personalização e suporte de código aberto, com desenvolvedores capazes de escolher entre análise, fragmentação, anotação, incorporação, armazenamento vetorial e modelos de código aberto. Os desenvolvedores também podem personalizar seus próprios componentes.
  • Flexibilidade de integração, para conectar-se a vários bancos de dados vetoriais, como Pinecone e Weaviate, ou usar o Vertex AI Search.

Na postagem introdutória do blog, o Google citou casos de uso do Vertex AI RAG Engine na indústria em serviços financeiros, saúde e jurídico. A postagem também forneceu links para recursos, incluindo um caderno de primeiros passos, exemplos de integrações com Vertex AI Vector Search, Vertex AI Feature Store, Pinecone e Weaviate, e um guia para ajuste de hiperparâmetros para recuperação com RAG Engine.