Em um avanço para o setor de saúde, os pesquisadores revelaram o Meditron, um conjunto de grandes modelos de linguagem (LLMs) de código aberto, projetado especificamente para auxiliar profissionais médicos.
Desenvolvido conjuntamente por pesquisadores da École Polytechnique Fédérale de Lausanne (EPFL) e da Yale School of Medicine, e apoiado pelo Comitê Internacional da Cruz Vermelha (CICV), o LLM é construído sobre a plataforma Meta Llama2 e treinado em “cuidadosamente selecionados, de alta qualidade”. fontes de dados médicos de alta qualidade”, disse Meta em um blog.
A Meditron também foi fornecida e refinada com “contribuições contínuas de médicos e especialistas em resposta humanitária”, afirmou a postagem do blog. Espera-se que este LLM médico auxilie os profissionais de saúde na “tomada de decisões clínicas e diagnóstico”.
Fechando a lacuna na adoção de IA médica
“Os modelos de fundação tornaram-se ativos intelectuais e culturais modernos”, disse no blog a professora de Yale, Mary-Anne Hartley, que é co-líder do projeto. “Quando aplicados ao domínio médico, têm o potencial de fornecer conselhos e orientações que salvam vidas. No entanto, os locais com menos recursos são os que têm mais a ganhar e continuam a ser os menos representados.”
A Meditron enfrenta esse desafio de frente. Construído com base no Llama 2 da Meta, o Meditron é ajustado em um enorme conjunto de dados de informações médicas selecionadas, incluindo diretrizes clínicas, revistas médicas e dados do mundo real de organizações humanitárias como o CICV.
Este treinamento garante que as informações fornecidas pela Meditron estejam alinhadas com práticas baseadas em evidências e atendam aos padrões profissionais, explicou o blog. “O conjunto Meditron tem o potencial de atender necessidades cruciais em uma variedade de ambientes, incluindo cenários de emergência que exigem resposta médica rápida e precisa e auxiliar os profissionais de saúde no diagnóstico e tratamento de pacientes em áreas carentes.”
“A Meditron representa um salto significativo na democratização do acesso a poderosas ferramentas de IA para a saúde”, disse Pradeepta Mishra, cofundador e arquiteto-chefe da empresa de privacidade de dados Data Safeguard. “O modelo de linguagem treinado em dados de texto gerais pode ser ajustado para tarefas médicas específicas, como resposta a perguntas médicas, documentação clínica ou diagnóstico de pacientes.”
Sucesso inicial e acesso aberto
De acordo com a Meta, o Meditron foi baixado mais de 30.000 vezes desde seu lançamento e está “preenchendo uma lacuna importante na inovação em ambientes médicos com poucos recursos”. Porém, os pesquisadores não pararam de inovar e já foi atualizado com os recursos mais recentes do Llama 3.
“Após o lançamento do Meta Llama 3 na semana passada, a equipe ajustou o novo modelo 8B em 24 horas para entregar o Llama-3(8B)-MeditronV1.0, que supera todos os modelos abertos de última geração dentro de seu parâmetro aula em benchmarks padrão, como MedQA e MedMCQA”, afirmou o blog.
O acesso aberto, talvez, seja o aspecto mais significativo da Meditron, acredita Hartley. Todo o conjunto – dados, pesos de modelos e documentação abrangente – está disponível gratuitamente. Hartley esperava que isto pudesse “capacitar a inovação em ambientes com recursos limitados para garantir melhor a representação e criar acesso equitativo ao conhecimento médico. Os locais com poucos recursos não devem ser forçados a ‘reinventar a roda’ para que as suas populações e necessidades sejam representadas nesta tecnologia crítica.”
Indo além dos benchmarks
Embora a Meditron lidere atualmente o grupo de LLMs de código aberto para medicina em benchmarks padrão, os pesquisadores dessas universidades reconheceram que estes podem não refletir os desafios clínicos do mundo real.
Para resolver este problema, os investigadores lançaram a iniciativa Meditron MOOVE (Massive Online Open Validation and Evaluation), convidando profissionais de saúde de todo o mundo a avaliar o desempenho da Meditron em cenários do mundo real, particularmente em ambientes com poucos recursos, acrescentou o blog.
“O fato de esses profissionais com pouco tempo estarem oferecendo seu tempo em nossa comunidade de código aberto para validar de forma independente o Meditron é um reconhecimento de seu valor”, disse Hartley. “Estamos em uma posição única para receber todo esse feedback e incorporá-lo em um novo modelo. Esperamos que os financiadores reconheçam o valor social e comercial de investir na nossa iniciativa acadêmica de código aberto.”
“Garantir a precisão, confiabilidade e explicabilidade de ferramentas de IA como o Meditron em ambientes clínicos do mundo real apresenta vários desafios técnicos importantes que precisam ser abordados”, alertou Mishra.