No centro da estratégia de desenvolvimento de aplicativos da AI da Microsoft está o semântico, um conjunto de ferramentas de código aberto para gerenciar e orquestrar os avisos de IA. Desde o seu lançamento como uma maneira de simplificar as aplicações de geração de recuperação de construção (RAG), ele se tornou uma estrutura para a construção e gerenciamento da IA ​​Agentic.

Na Ignite, em 2024, a Microsoft anunciou vários novos recursos para o kernel semântico, posicionando-o como sua ferramenta preferida para a criação de aplicativos de IA Agentic em larga escala. Esse anúncio formou a base do roteiro de 2025 do kernel semântico, com os primeiros elementos já sendo entregues.

Construindo fluxos de trabalho agênticos com estrutura de agente

Um dos novos recursos mais importantes do kernel semântico é a estrutura do agente, que em breve sairá da pré -visualização para a disponibilidade geral. Isso garantirá um conjunto estável e suportado de ferramentas prontas para fornecer aplicativos de IA corporativos de grau de produção. A estrutura do agente formará a base da integração planejada do kernel semântico com o Autogen da Microsoft Research, juntamente com o lançamento de um tempo de execução comum para agentes que são construídos usando as duas plataformas.

A estrutura do agente visa ajudar a criar aplicativos em torno de padrões semelhantes a agentes, oferecendo uma maneira de adicionar autonomia aos aplicativos e entregar o que a Microsoft chama de “aplicativos orientados a objetivos”. Esta é uma boa definição do que a IA Agentic Modern deve ser: uma maneira de usar as ferramentas de IA para construir e gerenciar um fluxo de trabalho com base em uma solicitação do usuário. Em seguida, permite que vários agentes colaborem, compartilhando dados e gerenciando o que pode ser pensado de transações longas que funcionam em muitas APIs e terminais de aplicativos diferentes.

Disponível como uma extensão do kernel semântico base, a estrutura do agente é entregue como um conjunto de bibliotecas .NET, que ajudam a gerenciar interações humanas/agentes e fornecem acesso à API Assistente do OpenAI. Destina -se a ser controlado via conversa, embora seja fácil de construir e executar agentes que respondem aos eventos do sistema, em vez de direcionar ações humanas (e adicionar etapas de aprovação humana como parte de um fluxo de trabalho dinâmico). Isso permite que você se concentre no uso de agentes para gerenciar tarefas.

Os recursos do agente semântico do kernel são projetados para estender os conceitos e ferramentas usados ​​para criar fluxos de trabalho de AI movidos a rag. Como sempre, o kernel semântico é como a orquestração geral e os agentes individuais são executados, gerenciando o contexto e o estado, além de lidar com chamadas para os pontos de extremidade da IA ​​via Azure AI Foundry e serviços similares.

A criação de um agente semântico do kernel requer uma classe de agente antes de usar um bate -papo do agente para suportar interações entre o fluxo de trabalho do seu agente e os pontos de extremidade da AI e da API usados ​​para concluir a tarefa atual. Se vários agentes precisarem ser chamados, você poderá usar um bate -papo em grupo de agentes para gerenciar esses prompts internos usando o kernel semântico para interagir e aprovar resultados entre si. Um bate -papo em grupo de agentes pode ser dinâmico, adicionando e removendo os agentes dos participantes, conforme necessário.

Você também é capaz de desenvolver as técnicas de kernel semânticas existentes. Por exemplo, os agentes podem usar plug-ins existentes ou novos, bem como funções de chamada. Trabalhar com aplicativos externos é essencial para a construção de agentes corporativos, pois eles precisam ser capazes de gerar dinamicamente fluxos de trabalho em torno de humanos e software.

Ter agentes de gerenciamento de kernel semântico garante que você possa gerenciar instruções e instruções para o Modelo de Linguagem Grande (LLM) que você está usando, além de controlar o acesso às APIs. Seu código pode gerenciar a autorização conforme necessário e adicionar objetos plug-in. Seus plug-ins gerenciarão chamadas de API, com as consultas do agente construindo analisando as entradas do usuário.

Desenvolvimento de agentes sem código com autogênio

A integração do kernel semântico com a Autogen se baseia em sua estrutura de processo. Isso foi projetado para gerenciar processos de negócios de longa duração e trabalha com estruturas de aplicativos distribuídas, como DAPR e Orleans. Os fluxos de trabalho são orientados a eventos, com etapas construídas em torno das funções semânticas do kernel. Um processo não é um agente, pois é um fluxo de trabalho definido e não há auto-orquestração. No entanto, uma etapa pode conter um agente se tiver entradas e saídas bem definidos. Os processos podem aproveitar os padrões comuns e não há razão para que funções operem sequencialmente – elas podem funcionar de forma assíncrona em paralelo, permitindo que você tenha fluxos que estejam fãs ou que dependem de várias entradas.

As duas plataformas convergem no uso de Orleans, o que garante que eles tenham abordagens semelhantes para trabalhar em ambientes orientados a eventos. Essa é uma base importante, pois a mudança de Orleans de ser um projeto de pesquisa da Microsoft para ser a arquitetura de computação distribuída fundamental para o .NET moderno tem sido essencial para uma absorção mais ampla.

O uso do Autogen como parte de seu ferramenta de agente ajudará a oferecer um melhor suporte para operações multi-agentes no kernel semântico. Como tem sido um projeto de pesquisa, ainda há algum trabalho necessário para reunir as duas plataformas, com o suporte automático.

Certamente, a Autogen simplifica o processo de construção de agentes, com uma GUI sem código e suporte para uma variedade de LLMs diferentes, como o OpenAI (e o Azure Openai). Também há suporte para Ollama, modelos hospedados em fundição do Azure, Gemini e um adaptador semântico de kernel que permite usar os clientes modelo do semático do kernel.

Introdução ao Autogen requer o aplicativo Autogen do núcleo e um cliente de modelo. Depois de instalado, você pode criar um agente simples com um punhado de linhas de código. As coisas ficam interessantes quando você constrói um aplicativo multi-agente ou, como a Autogen o chama, uma equipe. As equipes são reunidas em um bate -papo em grupo, onde os usuários fornecem tarefas dos agentes. Ele vem com agentes pré -construídos que podem ser usados ​​como blocos de construção, como proxy de usuário, surfista da web ou assistente.

Você pode adicionar rapidamente suas próprias extensões para personalizar ações dentro da estrutura em camadas de autogênio. Isso fornece funções específicas para elementos de um agente, começando com a API principal que fornece ferramentas para manuseio e mensagens de eventos, fornecendo um hub assíncrono para operações de agentes. Acima disso, está a API do AgentChat. Isso foi projetado para ajudá -lo a criar rapidamente agentes usando componentes pré -construídos e seu próprio código, além de ferramentas para lidar com instruções e instruções. Finalmente, a API de extensões é onde você pode adicionar suporte para novos LLMs e seu próprio código.

Grande parte da documentação se concentra no Python. Embora exista uma implementação do .NET do Autogen, está faltando documentação para os principais recursos, como o AgentChat. Mesmo assim, o .NET é provavelmente a melhor ferramenta para construir agentes que passam por sistemas distribuídos, usando seu suporte para .NET Aspire e, através disso, estruturas como o DAPR.

Construindo equipes multi-agentes no Autogen Studio

O Autogen Studio é talvez a parte mais interessante e funcionaria bem como parte da extensão do código do Visual Studio semântico. Ele instala como um aplicativo local e fornece um local para construir equipes de agentes e extensões, com o objetivo de construir um aplicativo multi-agente sem precisar escrever nenhum código adicional (embora você possa usá-lo para editar JSON de configuração gerada). Ele se baseia no topo do serviço AgentChat da AutoGen.

Os aplicativos são construídos arrastando componentes para a tela do estúdio e adicionando condições de terminação. Esta última opção é importante: é assim que um agente “sabe” concluiu uma tarefa e precisa fornecer resultados para um usuário ou uma função de chamada. Os agentes podem ser configurados adicionando modelos e extensões, por exemplo, usando uma extensão para fornecer uma consulta de pano contra dados corporativos. O suporte de modelo múltiplo ajuda a escolher um modelo de IA adequado para um agente, talvez um que tenha sido ajustado ou que ofereça ações de vários modelos para que você possa trabalhar com imagens e áudio, bem como solicitações de texto. Os nós em uma equipe podem ser editados para adicionar parâmetros quando necessário.

Sob o capô, o Autogen é um ambiente declarativo de desenvolvimento de agentes, com a descrição do JSON dos vários elementos que fazem um agente. Você pode mudar para uma visão JSON para fazer alterações ou até converter o Autogen AGALCHAT Python em JSON e editá -la no Studio. Para simplificar a construção de novos aplicativos, ele oferece uma galeria onde agentes e outros componentes podem ser compartilhados com outros usuários. Depois de construir um agente, você pode avaliá -lo no playground do Studio antes de construí -lo em um processo maior.

Usar técnicas de programação declarativa para criar equipes de agentes faz sentido; Freqüentemente, o conhecimento necessário para construir elementos de um fluxo de trabalho ou processo de negócios é incorporado no próprio processo à medida que o conhecimento passa de trabalhador para trabalhador. Se quisermos criar agentes baseados em IA para automatizar elementos desses processos, quem é melhor projetar essas tarefas do que as pessoas que sabem exatamente o que precisa ser feito?

Ainda há muito por vir para o kernel semântico em 2025. Agora que estamos saindo da fase experimental da IA ​​corporativa, onde usamos os chatbots para aprender a criar instruções eficazes, é hora de usar essas lições para criar ferramentas de fluxo de trabalho mais adequadas aos processos multielaais e múltiplos que formam o backbone de nossos negócios. O kernel semântico está começando a entrar no mundo da TI da empresa. Será interessante ver como ele e autogênio aproveitam as habilidades e conhecimentos que existem em nossas organizações, além das equipes de desenvolvimento e desenvolvimento.