Comparando PubMed x Gemini +++++++++++++++++++++++++++++ Como vimos, atualmente (Junho de 2025), pesquisar na PubMed e pesquisar com ferramentas de IA são operações distintas e possivelmente complementares. PubMed baseia-se numa pesquisa com termos controlados (sempre que possível) e lógica booleana, porém pesquisas muito complexas levam a um aumento de FP. Ou seja, uma vez que a pesquisa é baseada em construções de SQL, ela não é semântica e cabe ao usuário inserir os termos corretos e entender que junto a cada termo deve acompanhar de **OR** e um ou diversos sinônimos. Em biologia molecular e celular vários termos evoluíram no tempo e suas denominações eventualmente foram alteradas. P.ex., o canal de sódio SCN1A denominava-se Nav1.1, IL8 é sinônimo de CXCL8, e IL6R denominava-se IL-1Ra ou Gp80. Logo, o usuário tem que ter esta cultura para montar *queries* completos e minimizar FNs. Com relação à pesquisar em IA, especialmente nas plataformas comerciais abertas - como `Google `_, `Chat-GPT `_, `Perplexity `_, entre outras - podemos utilizar *queries* criadas em linguagem natural em qualquer língua, como Inglês, Alemão, Francês, Italiano, Português, etc. Como um LLM é uma máquina semântica, sinônimos e conceitos próximos são automaticamente encontrados no hiperespaço de **embeddings**. Porém, achar e exportar a literatura corrente é uma tarefa para a qual este modelo de IA não foi preparado. Sim, ele pode ser usado e de acordo com que novas versões são disponibilizadas os recursos e acurácia melhoram. Mas, hoje (Junho de 2025), fazer a tarefa que a PubMed faz com base em arguições em linguagem natural, é algo que não se consegue realizar. Devido à uma necessidade técnica em estudos de Bioinformática e Biologia de Sistemas, tivemos que responder às seguintes perguntas: * Será que podemos realizar uma curagem de artigos científicos utilizando aplicativos de IA abertos (não refinados)? * Será que a curagem de artigos científicos por aplicativos de IA abertos é tão boa ou melhor que pesquisas PubMed e curagem realizadas por pesquisadores? **Definição de curagem científica**: comprovação que um conceito a ser pesquisado já está descrito na literatura científica e comprovado por pesquisadores idôneos, tendo sido publicado em revista de bom impacto e com revisores aos pares. Para respondermos a esta pergunta desenvolvemos um estudo que levou certa de um ano para ser realizado. Recentemente submetemos à BMC Bioinformatics (ainda sem retorno) e publicamos no ArXiv, este último, uma plataforma aberta de publicação de artigos científicos sem revisão aos pares. .. image:: ../images/paper_dpc.png :align: center :width: 90% :alt: DPC - Digital Pathway Curation \ A ideia era comprovar se técnicas de pesquisa utilizando IA conseguem superar pesquisas `automáticas` na PubMed e pesquisas realizadas por Pesquisadores Especializados e seus alunos (seres humanos) utilizando quaisquer fontes de dados sem a utilização de IA. E a resposta foi `sim`. Mas como se consegue provar isto? Resumidamente, através dos seguintes conceitos: 1. Adquirindo centenas ou milhares de *queries-responses* para gerar uma estatística consistente. 2. Conseguir que a máquina de IA seja reprodutível. 3. Conseguir que a máquina de IA responda Sim ou Não, ou Sim, Possivelmente, Baixa Evidência ou Não. 4. Comparar com as respostas das mesmas *queries* na PubMed e de Seres Humanos. Para se aquirir centenas ou milhares de *queries-responses* tivemos que utilizar de códigos computacionais escritos em Python e chamando o *web service* da Google. Ou seja, se você tem que fazer uma ou poucas pesquisas, você pode fazer manualmente. Mas, se você tem que fazer milhares de pesquisas, manualmente é impossível! Como conseguir que a máquina de IA seja reprodutível e responda Sim ou Não? Isto já descrevemos anteriormente. Criamos e testamos a seguinte forma de arguir um LLM: **Answer in the first line Yes, Possible, Low evidence or No, and explain: Context: