Embora o SLMS possa ser útil para aplicativos generativos menores ou implantações de IA de borda, há outro campo em que eles têm um grande potencial. A IA Agentic, a mais recente iteração de IA generativa, usa vários agentes treinados para realizar tarefas específicas para produzir resultados. O objetivo aqui é criar e apoiar um processo do começo ao fim com vários agentes especializados. Enquanto os serviços da LLM podem ser úteis para responder genericamente a consultas e interagir com os usuários, a Agentic AI aproveita os SLMs especializados para fornecer respostas mais direcionadas que suportam etapas diferentes em um processo de ponta a ponta.
Com diferentes agentes autônomos envolvidos em diferentes etapas, o SLMS pode desempenhar um papel importante na maneira como você projeta sistemas agênticos. A razão para isso é que aplicativos multi-agentes podem usar muito mais recursos do que os aplicativos independentes de IA para atingir seu resultado final. Um aplicativo de IA generativo usará um certo número de tokens para processar uma resposta, por exemplo, para incorporar solicitações em vetores. Os tokens correspondem ao número de palavras usadas em prompts, com instruções mais longas e mais complexas consumindo mais tokens.
Cada componente em um aplicativo consumirá tokens para responder a uma solicitação. Dependendo do número de agentes e etapas dentro de um processo, o número de tokens será significativamente maior para a IA agêntica, pois cada agente criará uma resposta que consome tokens e depois passará para a próxima etapa (por sua vez, consumindo tokens) para criar a próxima resposta (consumindo tokens novamente), antes da resposta final criada e devolvida ao usuário. A Capgemini estima que, para um serviço que cumpra uma solicitação por minuto em resposta a um evento de sensor, um serviço de agente único custaria cerca de US $ 0,41 por dia, enquanto um sistema multi-agente custaria cerca de US $ 10,54-aproximadamente 26 vezes mais caro.