A nova certificação determinará se um sistema de IA generativo é 'razoavelmente treinado'

Enquanto criadores e detentores de propriedade intelectual discutem com empresas de IA generativa sobre o protocolo correto para utilizar dados para treinar sistemas de IA generativos, uma nova empresa sem fins lucrativos, Fairly Trained, está a oferecer certificações a empresas que treinam os seus modelos de IA generativa em dados “consentidos”.

“Acreditamos que os consumidores merecem saber quais empresas consideram o consentimento do criador importante e quais não. Portanto, certificamos empresas de IA que não usam nenhum trabalho protegido por direitos autorais sem licença”, disse a empresa, batizada de Fairly Trained, em sua página inicial.

“A Fairly Trained existe para deixar claro quais empresas adotam uma abordagem de treinamento mais baseada no consentimento e, portanto, estão tratando os criadores de forma mais justa”, acrescentou a empresa, explicando que surgiu após identificar a divisão emergente entre dois tipos de IA generativa. empresas – aquelas que obtêm o consentimento dos fornecedores de dados de formação, e aquelas que não o fazem, alegando que não têm qualquer obrigação legal de o fazer.

Fairly Trained é liderado pelo CEO Ed-Newton Rex, que trabalhou anteriormente na Stability AI e atuou como vice-presidente de áudio. Rex, de acordo com um relatório da Bloomberg, saiu do Stability AI depois de levantar preocupações sobre o uso de dados de direitos autorais para treinar sistemas generativos de IA.

Os consultores da empresa incluem nomes como o cofundador e CTO da Siri Tom Gruber e Maria Pallante, presidente e CEO da Association of American Publishers.

Atualmente, a empresa oferece uma única certificação, que chama de Certificação L ou Certificação de Modelo Licenciado. Esta certificação pode ser obtida por qualquer fornecedor de sistemas de IA generativos que tenha utilizado dados “consentidos” para treinar os seus sistemas.

Requisitos para certificação de modelo licenciado

Para obter a certificação, a empresa inscrita deve garantir que todos os dados de treinamento devem ter determinados pré-requisitos. Primeiro, os dados utilizados devem ser fornecidos ao desenvolvedor do modelo para serem utilizados como dados de treinamento de acordo com um acordo contratual com uma parte que tenha os direitos necessários para celebrar tal acordo.

Em segundo lugar, os dados utilizados para formação devem estar disponíveis sob uma licença aberta para utilização adequada, ser de domínio público a nível mundial ou ser propriedade integral do criador do modelo.

“A obtenção de uma licença de uma organização que licencia criadores (por exemplo, uma gravadora ou uma biblioteca de imagens) é considerada consentimento para fins de certificação”, afirmou a empresa em seu portal.

Quaisquer modelos usados para gerar quaisquer dados sintéticos para treinar sistemas generativos de IA também devem seguir os mesmos protocolos, acrescentou.

Para concluir a inscrição para a certificação, as empresas precisam ter um processo robusto de due diligence de dados e manter registros dos dados de treinamento que foram usados para cada modelo de treinamento.

Processo de certificação, taxas e cancelamento

Qualquer empresa que forneça sistemas generativos de IA ou grandes modelos de linguagem pode iniciar o processo de inscrição preenchendo um pequeno formulário on-line, após o qual a Fairly Trained entra em contato com a empresa para conduzi-la durante o processo de inscrição.

“Ao nos enviar sua submissão por escrito, você paga a taxa de submissão; em seguida, analisamos seu envio, potencialmente solicitando mais informações”, disse a empresa em seu portal.

Se a inscrição for bem-sucedida, espera-se que a empresa pague uma taxa anual de certificação, que varia de US$ 500 a US$ 6.000, dependendo de sua receita, à Fairly Trained antes de emitir o certificado.

A Fairly Trained alertou ainda que caso alguma empresa — que já tenha emitido o certificado — altere suas práticas de dados de treinamento que contrariem suas regras ou categorias, sua certificação será rescindida.

“Reservamo-nos o direito de retirar a certificação sem reembolso se surgirem novas informações sobre suas práticas de IA que possam alterar o resultado de sua certificação”, disse a empresa em seu portal.

Até o momento, oito startups foram certificadas pela Fairy Trained.