Os grandes modelos de linguagem (LLMs) continuam a comandar um holofote brilhante, à medida que a estreia do ChatGPT capturou a imaginação do mundo e tornou a IA generativa a tecnologia mais amplamente discutida na memória recente (desculpas, metaverso). ChatGPT catapultou LLMs públicos para o palco, e suas iterações continuam a aumentar o entusiasmo – e mais do que um pouco de apreensão – sobre as possibilidades de geração de conteúdo, ou código, com pouco mais do que alguns prompts.

Enquanto os indivíduos e as pequenas empresas consideram como se preparar e beneficiar da disrupção omnipresente que a IA generativa e os LLMs prometem, as empresas têm preocupações e uma decisão crucial a tomar por conta própria. As empresas deveriam optar por alavancar um LLM público, como o ChatGPT, ou um LLM privado?

Dados de treinamento públicos versus privados

ChatGPT é um LLM público, treinado em uma vasta coleção de dados online disponíveis publicamente. Ao processar grandes quantidades de dados provenientes de todo o mundo, os LLMs públicos oferecem resultados mais precisos – e frequentemente impressionantes – para praticamente qualquer consulta ou tarefa de criação de conteúdo que um usuário coloque neles. Esses resultados também melhoram constantemente por meio de processos de aprendizado de máquina.

Mesmo assim, extrair dados de origem da Internet selvagem significa que os resultados públicos do LLM podem, às vezes, estar totalmente errados, e perigosamente. O potencial para “alucinações” de IA generativas, em que a tecnologia simplesmente diz coisas que não são verdadeiras, exige que os utilizadores sejam experientes. As empresas, em particular, precisam de reconhecer que a utilização de LLMs públicos pode desviar os funcionários, resultando em graves problemas operacionais ou mesmo em consequências jurídicas.

Como opção contrastante, as empresas podem criar LLMs privados de sua propriedade e treinar com seus próprios dados privados. As aplicações generativas de IA resultantes oferecem menos amplitude, mas maior profundidade e precisão de conhecimento específico, atendendo às áreas específicas de especialização da empresa.

Desafios colocados por LLMs públicos

Para muitas empresas, dados exclusivos são uma moeda inestimável que as diferencia. As empresas estão, portanto, extremamente (e com razão) preocupadas com o risco de que os seus próprios funcionários possam expor dados corporativos ou de clientes confidenciais ao enviar esses dados ao ChatGPT ou outro LLM público.

Essa preocupação é baseada na realidade, já que os hackers agora se concentram em expor as credenciais de login do ChatGPT como um de seus alvos mais populares. Uma conta hackeada pode gerar todo o histórico de conversas de um funcionário com o aplicativo generativo de IA, incluindo quaisquer segredos comerciais ou dados pessoais de clientes usados ​​em consultas. Mesmo na ausência de hacking, as questões colocadas aos LLMs públicos são aproveitadas na sua formação iterativa, resultando potencialmente na futura exposição direta de dados a qualquer pessoa que os pergunte. É por isso que empresas como Google, Amazon e Apple estão agora a restringir o acesso dos funcionários ao ChatGPT e a criar regras de governação rigorosas, num esforço para evitar a ira dos reguladores, bem como dos próprios clientes.

Estrategicamente, os LLMs públicos confrontam as empresas com outro desafio. Como você constrói um IP único e valioso com base na mesma ferramenta pública e condições de concorrência equitativas que todos os outros? A resposta é que é muito difícil. Essa é outra razão pela qual recorrer a LLMs privados e soluções de nível empresarial é um foco estratégico para um número cada vez maior de organizações.

O surgimento de LLMs privados

As empresas devem reconhecer a oportunidade de aproveitar os seus próprios dados num LLM privado adaptado aos casos de utilização e às experiências dos clientes no centro dos seus negócios. Para aqueles que o fazem, está emergindo rapidamente um mercado de ferramentas de suporte de nível empresarial. Por exemplo, o Watson da IBM, um dos primeiros grandes nomes da IA ​​e na imaginação do público desde os dias de sua vitória no Jeopardy, agora evoluiu para a plataforma privada de desenvolvimento LLM watsonx.

Soluções empresariais como o watsonx precisarão traçar a linha entre “conhecimento geral compartilhado de base pública” e “conhecimento específico da empresa-cliente”, e onde estabelecerem essa distinção será importante. Dito isto, algumas capacidades muito poderosas deverão chegar ao mercado com a chegada destas soluções.

A decisão das empresas de tentarem controlar a utilização de LLMs públicos ou de construírem os seus próprios LLMs privados só se tornará cada vez maior à medida que o tempo avança. As empresas prontas para construir LLMs privados — e aproveitar motores de IA especificamente ajustados aos seus próprios dados de referência principais — estarão estabelecendo uma base na qual continuarão a confiar no futuro.

Brian Sathianathan é cofundador e diretor de tecnologia da Iterar.ai, onde lidera as soluções empresariais de IA da empresa. Anteriormente, Sathianathan trabalhou na Apple em vários projetos de tecnologia emergente que incluíam o sistema operacional Mac e o primeiro iPhone.

Generative AI Insights oferece um local para líderes de tecnologia – incluindo fornecedores e outros colaboradores externos – explorarem e discutirem os desafios e oportunidades da inteligência artificial generativa. A seleção é ampla, desde aprofundamentos tecnológicos até estudos de caso e opiniões de especialistas, mas também subjetiva, com base em nosso julgamento de quais tópicos e tratamentos servirão melhor ao público tecnicamente sofisticado do InfoWorld. A InfoWorld não aceita material de marketing para publicação e reserva-se o direito de editar todo o conteúdo contribuído. Contato [email protected].