Mas coloque esse mesmo modelo de IA dentro de um fluxo de trabalho complexo de suporte ao cliente ou peça-lhe que raciocine através de um cenário clínico diferenciado e as falhas começarão a aparecer. O raciocínio em várias etapas falha. O contexto se perde. O desempenho cai de maneiras que podem parecer inconsistentes com os pontos fortes do modelo em outros lugares.
Esses modelos de IA são frequentemente semelhantes. Eles são executados em hardware semelhante e geralmente são treinados de maneira semelhante. Então, por que a incompatibilidade no desempenho entre as tarefas? A explicação mais simples é também a mais esquecida: os dados.
A engenharia de software se beneficia de um registro digital imenso, estruturado e altamente visível. O código é escrito em linguagens padronizadas, beneficia-se de documentação robusta, é revisado em fóruns públicos e discutido em grande escala. Esse ecossistema gerou um conjunto robusto e extremamente útil de material de treinamento.
Outros campos muitas vezes não. Por exemplo, os dados de saúde estão dispersos pelas instituições, envoltos em restrições de privacidade, expressos em múltiplas modalidades e raramente prontos para uso para treinamento em IA. Os fluxos de trabalho empresariais são capturados em sistemas internos que nunca foram projetados para treinar IA. Os dados de fala multilíngue variam amplamente em qualidade e representação.
