História: até 2016
+++++++++++++++++++

Introdução
------------

É muito difícil e complexo explicar o que é Inteligência Artificial (IA) nos dias atuais (2025). Mas, vamos tentar explicar relatando a história, exemplos e utilizando algumas metáforas. Uma das dificuldades se deve por ser necessário um bom conhecimento de matemática e aprendizado de máquina (*Machine Learning* or **ML**). Portanto, mostraremos como utilizar a IA focando em recuperação de informações científicas, em especial biomédicas, e comparando com a recuperação de referências oferecida pela PubMed.


Modelos iniciais
--------------------


.. image:: ../images/jamonycajal.png
  :align: left
  :width: 50%
  :alt: jamonycajal


.. image:: ../images/neuron.png
  :align: right
  :width: 45%
  :alt: Neuron

Na década de 1870, o cientista Santiago Jamón y Cajal, espanhol, descreveu os primeiros neurônios e criou o estudo da neurologia. Seus trabalhos foram fundamentais para diversas áreas de Biologia e da Medicina e também serviram de modelo aos primeiros **Neurônios Artificiais**.

ref: https://www.linkedin.com/pulse/art-science-santiago-ram%C3%B3n-y-cajal-tim-vancamp/

https://blogs.scientificamerican.com/illusion-chasers/santiago-ramon-y-cajal-the-young-artist-who-grew-up-to-invent-neuroscience/

\
\

Na década de 1940 von Neuman e Alan Turing *desenharam* e propuseram o primeiro computador. Em 1946 foi construído o ENIAC (Electronic Numerical Integrator and Computer). Naquele momento, possivelmente, alguns cientistas entenderam que o mesmo tinha um severo fator limitante: seus cálculos eram seriais. Em 1943 Warren McCulloch e Walter Pitts propuseram um **neurônio artificial**, sua vantagem: processamento paralelo.

O modelo de McCulloch e Pitts mimetiza um neurônio de Cajal, tendo várias entradas (*inputs*) um corpo celular (Soma) que faz uma operação como adição e uma saída φ que é uma função de transformação ou normalização: saída ou *output* = φ(soma das entradas com pesos), como vemos no desenho abaixo.

.. image:: ../images/neuron_model.png
  :align: center
  :width: 60%
  :alt: Neuron Model

ref: https://en.wikipedia.org/wiki/Artificial_neuron

A seguir em 1949, Turing, precocemente imaginou que a máquina, ainda que primitiva, poderia ser *inteligente*. E propôs o **Teste de Touring** (ver https://en.wikipedia.org/wiki/Turing_test). Feliz ou infelizmente, John McCarthy cunhou o termo **Inteligência Artificial**, mas o correto é a denominação **Aprendizado de Máquina** (*Machine Learning* ou **ML**).

Primeiro Neurônio
--------------------

.. image:: ../images/rosenblat.jpeg
  :align: right
  :width: 30%
  :alt: Rosenblat

Em 1957 na Universidade de Cornell, Frank Rosenblatt, monta o primeiro circuito elétrico que mimetizava o **Neurônio Artificial**, denominado Percepton. Daí para frente o planeta estava pronto para sair da *Era Industrial* e entrar na *Era da Informação*. Porém, a evolução dos computadores com CPUs seriais foi incrivelmente bem sucedida e de forma exponencial, sendo que no início dos anos 80, devido a miniaturização dos circuitos eletrônicos, surge a micro informática e os computadores pessoais. Já a teoria e desenvolvimento do circuitos neurais artificiais passou pela grande crise denominada o **Inverno da IA** (de ~1970-1990).


| CPU - central processor unit
| GPU - graphics processor unit


| referência:
| https://iatracker.com.br/glossario/o-que-e-xor-problem/
| https://en.wikipedia.org/wiki/AI_winter. 


Linha do Tempo
---------------

Abaixo um "rascunho" de linha do tempo para mostrar a evolução da IA até 2018. Mas, foi a partir de 2017 que ocorre a **grande revolução** com o advento das LLMs, como veremos nos próximos capítulos.

.. image:: ../images/ai_timeline.jpg
  :align: center
  :width: 90%
  :alt: AI timeline

\

ref: Bellini V, Cascella M, Cutugno F, Russo M, Lanza R, Compagnone C, Bignami EG. Understanding basic principles of Artificial Intelligence: a practical guide for intensivists. Acta Biomed. 2022 Oct 26;93(5):e2022297. doi: 10.23750/abm.v93i5.13626. PMID: 36300214; PMCID: PMC9686179.


ANN profunda: *Deep Learning*
------------------------------

Do ínicio da década de 1990 até 2012 surge a primeira *era tecnológica* da IA, conhecida como Deep Learning (DL). DL é o encadeamento de neurônios em várias camadas. Ou seja, à esquerda há a **entrada** ou *input*, à direita há a **saída** ou *output* e no meio as camadas de *neurônios escondidas* denominadas *hidden layers*. 


Um esquema de ANN,


.. image:: ../images/ann.jpg
  :align: center
  :width: 90%
  :alt: AI timeline

\

Treinando uma rede neural
-----------------------------


A **grande sacada** foi como *ajustar os pesos* de cada neurônio (valores sobre cada entrada do percepton + um offset) e ir modificando os mesmos de forma que o *output* fosse igual ou próximo a uma **saída** conhecida. Portanto, na etapa de treinameto de uma ANN, neurônios importantes vão ligando com saída se aproximando do sinal 1, e neurônios menos importantes ficam no intervalo de sinais de saída entre 0.1 e 0.9 e aqueles que não colaboram com o resultado final são desligados. A técnica é levar os valores de entrada para cada uma das camadas (*hidden layers*), passando por cada neurônio e calculando a função de ativação φ, num algoritmo denominado "feedforward" (calculando para frente). Os neurônio **finais de saída** (*output*) preditos, são comparados com uma **saída conhecida** (p.ex.: **entrada** = dados os pacientes 1, 3, 5 -> Saída: **dois estados**: paciente São, ou **entrada** = dados os pacientes 2, 4, 6 --> Saída: Paciente Doente). O erro é mensurado por uma função denominada **Custo**, ou seja, o erro é proporcional ao valor conhecido menos o valor calculado. O erro é propagado de volta (*backpropagation*), e este ciclo se repete até a que a função de custo atinja um mínimo. Neste momento a **rede estará treinada** e pronta para se analisar se tem boa acurácia com novos dados (dados de teste). Referente a uma rede treinada, o que se armazena, ao final, é a topologia da rede e os pesos encontrados que minimizaram a função custo de acordo com o treinamento da rede.

.. tip::
   Importante: para cada **problema** proposto temos que desenhar uma ou mais topologias e analisar qual a melhor. Para cada topologia temos que treinar a rede neural (ANN, ou MLP = *multi layer percepton*) e, com dados independentes, testar se a mesma funciona corretamente. Ou seja, se faz boas predições e tem boa acurácia.


Caso a função da ANN seja o de um classificador então a rede se ajusta para acertar o *output* de classificação, como: a) doente ou são, b) rico, médio, pobre, c) 5 níveis de inflamação, etc. Já se a função da ANN é de calcular uma regressão, o *output* torna-se, p.ex., 50 valores discretos de uma função matemática num determinado domínio de valores. Como exemplo: a) ajustar a uma parábola, b) um segmento de curva qualquer, ou c) semi-círculo.

Mas, como se define **Doente** e **São** numa ANN? Isto é simples, denominamos esta técnica como **one-hot encoding**, ou seja, basta numerar os valores categóricos: **encoding**: Doente:0, São:1 e **decoding**: 0:Doente e 1:São. Agora a ANN pode trabalhar, pois transformamos todas classes nominais em números inteiros.


Simulação
-----------

A seguir mostramos uma simulação de uma *Rede Neural Artificial* (ANN) utilizando `tensorflow` (uma das ferramentas para programação de ANNs).

\

.. image:: ../images/playground_tensorflow.png
  :align: center
  :width: 90%
  :alt: AI timeline

\

Vamos Simular? https://playground.tensorflow.org/