A última vez que olhei para o Copilot Studio, era uma forma de estender as ferramentas originais do Power Virtual Agents para incorporar IA generativa e oferecer suporte a interações conversacionais mais gerais. Ao utilizar ferramentas Azure OpenAI para trabalhar com fontes de dados adicionais, o Copilot Studio tornou-se uma ferramenta muito mais flexível com capacidades melhoradas de compreensão linguística.
No Build 2024, a Microsoft traçou um novo caminho para os recursos de IA do Power Platform, alinhando-os com as ferramentas de desenvolvimento de baixo e sem código da plataforma e adicionando suporte para fluxos e conectores do Power Automate. É uma grande mudança para a Power Platform, mas que aproveita a adoção da IA generativa pela Microsoft como uma ferramenta para construir e executar agentes autônomos.
A nova prévia do Copilot Studio equivale, portanto, a uma refatoração completa da estratégia de IA da Power Platform, evoluindo além dos chatbots para fluxos de trabalho orquestrados por IA. Embora os chatbots ainda sejam suportados, agora há muito mais para construir na tela de desenvolvimento sem código baseada na Web do Copilot Studio.
Colocando o robô em RPA
No centro do novo Copilot Studio está uma compreensão aprimorada de como modelos como o GPT 4.0 podem funcionar com descrições de interface estruturadas, como aquelas usadas pelo OpenAPI para gerar solicitações dinamicamente e para analisar e formatar respostas usando linguagem natural. Aqui, em vez de usar OpenAPI, a IA generativa está sendo usada para orquestrar conectores novos e existentes do Power Platform, permitindo que você converse com seu agente e veja suas respostas em qualquer cliente de chat compatível.
Há muito o que gostar nesta abordagem. Trabalhar com transações longas sempre foi um problema, e as ferramentas de memória semântica no centro dos fluxos de trabalho orientados por IA são uma solução promissora, especialmente quando são usadas para manter o ser humano informado.
O aspecto mais importante desse redesenho é a capacidade planejada de usar um gatilho para executar um fluxo que abrange uma série de diferentes tarefas orientadas por IA. Em vez de serem ferramentas de chat únicas, agora são uma forma de gerenciar transações de longa duração, modificando etapas com base no último conjunto de resultados.
Como isso funciona é simples. Digamos que você esteja acionando um conjunto de ações com base em um e-mail recebido. Você pode usar o Copilot Studio para mapear um fluxo de trabalho iniciado por um evento no Microsoft Graph. Isso pode envolver extrair os detalhes do remetente do Dynamics 365, gerar automaticamente uma resposta com base no email recebido e no histórico de interação do CRM do remetente e enviar uma mensagem para o Teams, detalhando as ações tomadas e listando possíveis acompanhamentos que exigem recursos humanos. intervenção.
Esse é um conjunto de ações muito diferente daquelas gerenciadas pela primeira geração do assistente de IA da Power Platform. Agora é uma maneira de trabalhar com fluxos de trabalho de longa duração, quase ad hoc, que exigem o gerenciamento de informações entre operações, bem como uma combinação de ações automatizadas e manuais. Ao usar um agente para gerenciar isso, não apenas podemos enviar respostas em linguagem natural com base nos dados do aplicativo, mas também encaminhar notificações e interações para a pessoa certa.
Construindo agentes no Copilot Studio
Isso requer integração com diversas nuvens da Microsoft, especialmente o Microsoft Graph e o Dataverse da Power Platform. Como resultado, a última geração do Copilot Studio se baseia na metáfora de design de fluxo do Power Automate. Em vez de criar aplicativos de bate-papo (ou melhor, também de criar aplicativos de bate-papo), agora estamos usando IA para gerenciar e controlar fluxos de trabalho. Na verdade, o que estamos fazendo é usar o Copilot Studio com fluxos existentes do Power Automate, para que você possa incorporar IA nos processos de negócios existentes.
Os fluxos são tratados como parte de um conjunto de ações disponíveis: conversacionais, conectores, fluxo e prompts. As ações conversacionais são um dos novos recursos mais interessantes, funcionando como plug-ins ChatGPT ou habilidades no Kernel Semântico. Eles se comportam como um tópico do Copilot Studio, mas em vez de se conectar ao conteúdo, permitem que seu agente do Copilot Studio acesse APIs e dados externos. Você pode até conectá-los a código personalizado e lógica de negócios, combinando técnicas tradicionais de desenvolvimento de software empresarial com IA sem código.
Aterramento com conectores e dados reais
Um dos novos recursos mais importantes é o conector Copilot. Assim como os conectores usados no Power Apps e no Power Automate, eles vinculam seu aplicativo a dados externos e APIs. Ferramentas como esta são mais importantes numa aplicação baseada em IA, especialmente numa que utilize IA generativa, pois fornecem a base necessária para reduzir o risco de resultados fora de controlo.
De forma útil, o Copilot Studio pode usar conectores Power Platform existentes, ampliando o que a Microsoft descreve como seu “conhecimento”. Este é um conjunto de fontes de informação que inclui as ferramentas de chatbot existentes e fontes de informação da Microsoft, como Dataverse e Fabric, bem como o uso do Dataverse como uma forma de preparar dados de outras fontes empresariais para uso em resultados orientados por RAG (geração aumentada de recuperação). . Há limites sobre o que você pode usar, com apenas duas fontes do Dataverse por aplicativo (e apenas quinze tabelas em cada fonte). Os dados personalizados de aplicativos de linha de negócios são importados como JSON, prontos para uso.
Pode parecer que não são muitos dados, mas você não está usando o Copilot Studio para construir e executar aplicativos autônomos em grande escala; eles realmente exigem trabalhar com estruturas como o Prompt Flow do Azure AI Studio.
Adicionar um conector a um agente no Copilot Studio é bastante simples. Comece adicionando conhecimento à sua aplicação, adicionando uma conexão corporativa. Essas conexões herdam as permissões do usuário, garantindo que os usuários obtenham resultados sem quebrar os limites de segurança. Essa abordagem é essencial se você estiver criando aplicativos de IA para setores regulamentados.
Fluxo de trabalho baseado em IA com ações de conversação
As coisas ficam mais interessantes quando você começa a usar ações conversacionais em seus aplicativos. É aqui que o agente subjacente começa a exibir comportamentos autônomos, analisando a solicitação de um usuário e usando-a para construir uma orquestração em um conjunto conhecido de ações, conexões e componentes, antes de usar IA generativa para montar uma resposta em linguagem natural.
Aqui, a solicitação do usuário é um prompt de orquestração usado para iniciar a interação. Numa versão futura, o sistema subjacente utilizará o seu conhecimento das APIs que está a utilizar para solicitar informações adicionais, conforme necessário. Por enquanto, no entanto, você está limitado a uma maneira útil, embora básica, de adicionar uma extensão de linguagem natural a um aplicativo de IA existente que você já construiu e testou no Copilot Studio.
Tudo que você precisa fazer é editar seu aplicativo, adicionando uma extensão ou ação, escolhendo uma ação conversacional. Você precisará então definir algumas configurações básicas antes de editar a ação. Um gatilho é um prompt que define a ação, descrevendo para que ela é usada. Isso é usado para determinar quando e como essa ação é invocada.
Depois de definir o gatilho, você poderá construir a ação. Este é um fluxo de processo que não possui UI. A ferramenta de edição da Microsoft não mostra nenhum componente de interação do usuário, garantindo que o processo seja executado dentro do seu copiloto e não interrompa seu fluxo. Depois de publicada, você poderá adicionar a ação ao catálogo do Microsoft 365 Copilot, onde ela será tratada como um plug-in e ativada como parte de uma conversa do usuário com o copiloto.
O custo do Copilot Studio atualizado é surpreendentemente baixo. Por ser um serviço em segundo plano, não é licenciado por usuário, mas usa um preço por mensagem, com 25.000 mensagens por US$ 200 por mês. Uma mensagem é uma solicitação que desencadeia uma resposta, com uma mensagem que requer operações generativas de IA contando como duas mensagens padrão. Não está claro como você pode adquirir capacidade adicional neste momento. Existe uma opção alternativa de US$ 30 por usuário para uso apenas com o Microsoft 365.
O lançamento inicial do Copilot Studio nos proporcionou uma maneira descomplicada de construir chatbots, infundindo tecnologias existentes com IA generativa. Esta nova atualização, agora em versão prévia, vai muito além, vinculando ferramentas modernas de IA à automação de processos, oferecendo a promessa de desenvolvimento sem código de agentes autônomos. A combinação de técnicas familiares com orquestração alimentada por IA permite que a geração atual de ferramentas de IA faça o que faz de melhor: trabalhar com APIs bem definidas e semanticamente ricas e fornecer resultados em um formato amigável.