Em um teste inicial do mundo real sobre inteligência artificial na pesquisa em saúde, cientistas da Universidade da Califórnia em São Francisco e da Universidade Wayne State descobriram que a IA generativa poderia processar enormes conjuntos de dados médicos muito mais rapidamente do que as equipes de ciência da computação tradicionais – e, em alguns casos, produzir resultados ainda melhores. Especialistas humanos tinham passado meses analisando cuidadosamente as mesmas informações.
Para comparar o desempenho diretamente, os pesquisadores atribuíram tarefas idênticas a diferentes grupos. Algumas equipes confiaram apenas na expertise humana, enquanto outras contaram com cientistas auxiliados por ferramentas de IA. O desafio era prever o nascimento prematuro usando dados de mais de 1.000 mulheres grávidas.
Até uma dupla de pesquisadores iniciantes, formada por um estudante de mestrado da UCSF, Reuben Sarwal, e um estudante do ensino médio, Victor Tarca, conseguiu desenvolver modelos de predição com o suporte da IA. O sistema gerou código de computador funcional em minutos — algo que normalmente levaria programadores experientes várias horas ou até dias.
A vantagem surgiu da capacidade da IA de escrever código analítico com base em instruções curtas, mas altamente específicas. Nem todos os sistemas se saíram bem. Apenas 4 dos 8 chatbots de IA produziram código utilizável. No entanto, aqueles que tiveram sucesso não precisaram de grandes equipes de especialistas para orientá-los.
Devido a essa rapidez, os pesquisadores iniciantes foram capazes de completar seus experimentos, verificar suas descobertas e submeter seus resultados a um periódico em poucos meses.
“Essas ferramentas de IA poderiam aliviar um dos maiores gargalos na ciência de dados: a construção de nossos pipelines de análise”, disse Marina Sirota, PhD, professora de Pediatria e diretora interina do Bakar Computational Health Sciences Institute (BCHSI) da UCSF, além de investigadora principal do March of Dimes Prematurity Research Center na UCSF. “A aceleração não poderia chegar mais cedo para os pacientes que precisam de ajuda agora.”
Sirota é co-autora sênior do estudo, publicado na Cell Reports Medicine em 17 de fevereiro.
A Importância da Pesquisa sobre Nascimento Prematuro
Acelerar a análise de dados pode melhorar as ferramentas de diagnóstico para o nascimento prematuro – a principal causa de morte neonatal e um grande contribuinte para desafios motores e cognitivos a longo prazo nas crianças. Nos Estados Unidos, aproximadamente 1.000 bebês nascem prematuramente a cada dia.
Os pesquisadores ainda não compreendem completamente o que causa o nascimento prematuro. Para investigar possíveis fatores de risco, a equipe de Sirota compilou dados do microbioma de cerca de 1.200 mulheres grávidas cujos desfechos foram acompanhados em nove estudos separados.
“Esse tipo de trabalho só é possível com o compartilhamento aberto de dados, unindo as experiências de muitas mulheres e a expertise de vários pesquisadores”, afirmou Tomiko T. Oskotsky MD, co-diretor do March of Dimes Preterm Birth Data Repository, professor associado no UCSF BCHSI e co-autor do artigo.
No entanto, analisar um conjunto de dados tão vasto e complexo provou ser desafiador. Para enfrentar isso, os pesquisadores recorreram a uma competição global de crowdsourcing chamada DREAM (Dialogue on Reverse Engineering Assessment and Methods).
Sirota co-liderou um dos três desafios de gravidez do DREAM, focando especificamente nos dados do microbioma vaginal. Mais de 100 equipes do mundo inteiro participaram, desenvolvendo modelos de aprendizado de máquina projetados para detectar padrões relacionados ao nascimento prematuro. A maioria dos grupos concluiu seu trabalho dentro do período de três meses da competição. No entanto, levou quase dois anos para consolidar as descobertas e publicá-las.
Testando a IA em Dados de Gravidez e Microbioma
Curiosos para saber se a IA generativa poderia encurtar esse cronograma, o grupo de Sirota se uniu a pesquisadores liderados por Adi L. Tarca, PhD, co-autor sênior e professor no Center for Molecular Medicine and Genetics da Universidade Wayne State em Detroit, MI. Tarca havia liderado os outros dois desafios do DREAM, que se concentraram em melhorar métodos para estimar a fase da gravidez.
Juntos, os pesquisadores instruíram oito sistemas de IA a gerar algoritmos de forma independente, usando os mesmos conjuntos de dados dos três desafios do DREAM, sem codificação humana direta.
Os chatbots de IA receberam instruções em linguagem natural cuidadosamente elaboradas. Assim como o ChatGPT, os sistemas foram guiados por prompts detalhados, projetados para orientá-los a analisar os dados de saúde de maneiras comparáveis aos participantes originais do DREAM.
Seus objetivos refletiram os desafios anteriores. Os sistemas de IA analisaram dados do microbioma vaginal para identificar sinais de nascimento prematuro e examinaram amostras de sangue ou de placenta para estimar a idade gestacional. A datação da gravidez é quase sempre uma estimativa, mas determina o tipo de cuidado que as mulheres recebem à medida que as gestações progridem. Quando as estimativas são imprecisas, a preparação para o parto se torna mais difícil.
Os pesquisadores então executaram o código gerado pela IA usando os conjuntos de dados do DREAM. Apenas 4 dos 8 ferramentas produziram modelos que corresponderam ao desempenho das equipes humanas, embora, em alguns casos, os modelos de IA se saíssem melhor. Todo o esforço de IA generativa – desde a concepção até a submissão de um artigo – levou apenas seis meses.
Cientistas enfatizam que a IA ainda requer supervisão cuidadosa. Esses sistemas podem produzir resultados enganosos, e a expertise humana continua sendo essencial. No entanto, ao classificar rapidamente enormes conjuntos de dados de saúde, a IA generativa pode permitir que os pesquisadores passem menos tempo resolvendo problemas de código e mais tempo interpretando resultados e fazendo perguntas científicas significativas.
“Graças à IA generativa, pesquisadores com um histórico limitado em ciência de dados não precisarão sempre formar amplas colaborações ou passar horas depurando código”, disse Tarca. “Eles podem se concentrar em responder as perguntas biomédicas certas.”
Autores: Os autores da UCSF são Reuben Sarwal; Claire Dubin; Sanchita Bhattacharya, MS; e Atul Butte, MD, PhD. Outros autores incluem Victor Tarca (Huron High School, Ann Arbor, MI); Nikolas Kalavros e Gustavo Stolovitzky, PhD (Universidade de Nova York); Gaurav Bhatti (Universidade Wayne State); e Roberto Romero, MD, D(Med)Sc (Instituto Nacional de Saúde Infantil e Desenvolvimento Humano (NICHD)).
Financiamento: Este trabalho foi financiado pelo March of Dimes Prematurity Research Center na UCSF e pela ImmPort. Os dados usados neste estudo foram gerados parcialmente com o apoio do Pregnancy Research Branch do NICHD.






