O objetivo é ajudar os desenvolvedores a construir sistemas de IA mais precisos e sensíveis ao contexto, ao mesmo tempo que reduz a complexidade da integração de recursos de pesquisa, recuperação e aterramento na web em aplicativos corporativos, escreveu a empresa em uma postagem no blog.
As APIs já sustentam a base do Microsoft Copilot e ChatGPT e, ao contrário das APIs de pesquisa tradicionais, são projetadas para recuperar informações altamente relevantes e, ao mesmo tempo, minimizar o consumo de tokens, ajudando a reduzir os custos de inferência e a latência de resposta, disse a Microsoft.
Reduzindo o custo e a complexidade do aterramento da web
Esse foco na redução dos custos de inferência e na latência de resposta para fornecer os recursos de pesquisa do Web IQ será valioso para CIOs e desenvolvedores, disse Phil Fersht, analista-chefe da HFS Research.
“Os desenvolvedores normalmente costuram isso sozinhos usando APIs de pesquisa, web scraping, geração de recuperação aumentada, bancos de dados vetoriais, lógica de classificação personalizada, ferramentas de rastreamento e camadas de orquestração separadas. Isso funciona, mas é confuso, frágil e caro de manter”, disse ele.
