A adoção do OMI pela Linux Foundation pode abrir caminho para LLMs éticos, dizem analistas

A iniciativa da Linux Foundation de adotar a Open Model Initiative (OMI) pode abrir caminho para modelos de grandes linguagens (LLMs) “mais éticos”, dizem analistas.

“Um dos principais objetivos do OMI e sua indução à Linux Foundation é propagar um uso ético de dados (texto/imagens) para treinar modelos de IA generativos”, disse Abhigyan Malik, diretor de prática de dados, análise e IA no Everest Group.

No entanto, Malik alertou que a prática de treinar modelos com dados éticos se tornará cada vez mais difícil, dada a compreensão mais ampla da proteção de dados e com fontes populares mudando suas políticas de privacidade e uso.

Vários provedores proprietários de LLM, como Open AI e Stability AI, estão atualmente enfrentando processos judiciais que alegam que essas empresas violaram direitos autorais ao treinar seus modelos.

O que é a Open Model Initiative?

A Open Model Initiative (OMI), fundada em junho por três startups — Invoke, Civitai e Comfy Org — tem como objetivo reunir desenvolvedores, pesquisadores e empresas para colaborar no avanço de tecnologias de modelos relacionados à IA abertas e licenciadas permissivamente.

Licenças permissivas, de acordo com a Linux Foundation, tendem a facilitar a participação e o compartilhamento de contribuições por parte dos membros da comunidade sem obrigações posteriores.

“Isso favorece particularmente os segmentos de software que exigem que os produtores de software possam distribuir software proprietário com base na base de código aberto sem revelar suas alterações”, explicou a Fundação em seu guia para software de código aberto.

O principal objetivo do OMI é reunir profunda experiência em treinamento e inferência de modelos para desenvolver modelos de qualidade igual ou superior aos modelos proprietários, como LLMs dos estábulos OpenAI, Google e AWS, mas livres de termos de licenciamento restritivos que limitam o uso desses modelos.

Para atingir esse objetivo, o OMI, que será governado por um comitê diretor liderado pela comunidade, estabelecerá uma estrutura de governança e grupos de trabalho para o desenvolvimento comunitário colaborativo.

A Linux Foundation também realizará uma pesquisa para coletar feedback sobre futuras pesquisas e treinamentos de modelos da comunidade de código aberto, disse a Linux Foundation em um comunicado, acrescentando que criará ainda mais padrões compartilhados para aprimorar a interoperabilidade do modelo e as práticas de metadados.

Além disso, o OMI desenvolverá um conjunto de dados transparente para treinamento e criará um modelo de teste alfa para equipes vermelhas direcionadas.

O objetivo final da iniciativa, de acordo com a Fundação, será lançar uma versão alfa do modelo, com scripts de ajuste fino, para a comunidade até o final do ano.

Por que isso é importante para as empresas?

A importância dessa mudança para as empresas está na indisponibilidade do código-fonte e nas restrições de licença de provedores de LLM, como Meta, Mistral e Anthropic, que colocam ressalvas nas políticas de uso de seus modelos de “código aberto”.

A Meta, por exemplo, de acordo com Suseel Menon, outra líder de prática de IA do Everest Group, fornece os direitos de uso dos modelos Llama sem royalties e sem nenhuma licença, mas não fornece o código-fonte.

“A Meta também adiciona uma cláusula: ‘Se, no Meta Llama 3, os usuários ativos mensais dos produtos ou serviços forem maiores que 700 milhões de usuários ativos mensais, você deve solicitar uma licença da Meta.’ Esta cláusula, combinada com a indisponibilidade do código-fonte, levanta a questão se o termo código-fonte aberto deve ser aplicado à família de modelos da Llama”, explicou Menon.

Em contraste, o objetivo da OMI, de acordo com analistas, é criar modelos que não apresentem ressalvas às empresas e sejam mais livremente acessíveis.

A OMI resistirá ao poder da Meta e dos maiores provedores de LLM?

Os objetivos e a visão da OMI receberam reações mistas dos analistas.

Enquanto o analista chefe da Amalgam Insights, Hyoun Park, acredita que o OMI levará ao desenvolvimento de padrões mais previsíveis e consistentes para modelos de código aberto, para que esses modelos possam potencialmente trabalhar uns com os outros mais facilmente, Malik, do Everest Group, acredita que o OMI pode não ser capaz de resistir ao poder de fornecedores como Meta e Anthropic.

“O desenvolvimento de LLMs exige muita computação e custou bilhões em despesas de capital para grandes gigantes da tecnologia e startups para atingir a escala que eles têm atualmente com seus LLMs de código aberto e proprietários”, disse Malik, acrescentando que isso pode ser um grande desafio para LLMs baseados na comunidade.

O líder da prática de IA também destacou que tentativas anteriores de um LLM baseado na comunidade também não obtiveram muita adoção, já que modelos desenvolvidos por entidades maiores tendem a ter melhor desempenho na maioria das métricas.

“Um excelente exemplo de um LLM aberto é o BLOOM, que criou com sucesso um modelo de comunidade, mas ainda não conseguiu criar adoção devido a ineficiências e certas escolhas de design (ele foi projetado para não ser uma interface de bate-papo)”, explicou Malik.

No entanto, o líder da prática de IA disse que a OMI pode encontrar nichos apropriados dentro do espaço de desenvolvimento de conteúdo (geração de imagens 2D/3D, adaptação, design visual, edição, etc.) à medida que começa a construir seus modelos.

“Esses nichos estão alinhados a vários casos de uso (ex: geração de imagens 3D) ou aplicações em verticais (ex: geração/edição de imagens de catálogo para varejo) onde seus modelos podem executar tarefas de forma eficaz”, disse Malik.

A teoria de Malik pode ser válida, já que a Invoke é uma plataforma de IA generativa para estúdios profissionais e a Civitai é um centro de IA generativa para criadores.

Um dos outros casos de uso para os LLMs comunitários da OMI é vê-los como pequenos modelos de linguagem (SLMs), que podem oferecer funcionalidades específicas com alta eficácia ou funcionalidades restritas a aplicativos ou casos de uso exclusivos, disseram analistas.

Atualmente, a página do OMI no GitHub tem três repositórios, todos sob licença Apache 2.0.