Você pode usar as mesmas ferramentas de consulta para pesquisar índices de vetores, bem como o restante dos seus dados, oferecendo a opção de pesquisar com base em semelhanças em seus dados ou por correspondências exatas. Essa abordagem é semelhante a como os mecanismos de pesquisa em larga escala funcionam e ajudará a encontrar e classificar os resultados de grandes conjuntos de dados semiestruturados, por exemplo, pesquisando revisões relevantes em um site de comércio eletrônico. O Fabric requer uma política vetorial para cada contêiner do Cosmos DB, que define tamanho, dimensionalidade e a função de distância subjacente usada para procurar vetores semelhantes. Tecnologias de pesquisa como o Diskann exigem uma alta dimensionalidade, com pelo menos 1.000 dimensões (e no máximo 4.096).
Consultando Cosmos DB em tecido
Quando você consulta dados armazenados no Cosmos DB através do OneLake da Fabric, você está trabalhando com uma cópia espelhada dos dados do Cosmos DB. À medida que você armazena os dados, eles são copiados no formato Delta Parquet usado em tecido, permitindo que você use qualquer uma das ferramentas de consulta suportadas, incluindo o desktop power bi para análise ad hoc. As consultas aqui podem ser feitas em todos os seus dados operacionais, não apenas no Cosmos DB, tratando -os como um todo unificado e ainda aproveitando o conjunto de recursos do Cosmos DB para aplicativos que precisam usar esses dados.
Isso também permite que você aproveite outros recursos de tecido com os dados do COSMOS DB, por exemplo, usando-os para adicionar rapidamente incorporação e um índice vetorial aos seus dados, para que possam ser usados como parte dos dados de aterramento para um aplicativo de IA com base na geração de recuperação de agosto (RAG).
