Marcelo Viana

Diretor-geral do Instituto de Matemática Pura e Aplicada, ganhador do Prêmio Louis D., do Institut de France.

Salvar artigos

Recurso exclusivo para assinantes

assine ou faça login

Marcelo Viana

A matemática da inteligência artificial

Probabilidade bayesiana usa bases de dados dinâmicas e sempre atualizadas

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Já escrevi sobre probabilidade, mas nunca discuti a questão mais básica: o que é a probabilidade de um evento e como ela pode ser determinada? Em muitos casos, há uma resposta direta. Por exemplo, quando lançamos uma moeda muitas vezes, em cerca da metade dá cara. Então, a probabilidade do evento "cara" é 50%. 

Mas essa abordagem, chamada frequentista, nem sempre é adequada. Qual é a probabilidade de o Brasil ganhar a Copa do Mundo de 2022? Não podemos repetir a competição para contar quantas o Brasil ganhou. Para tais situações, há o ponto de vista bayesiano.

O nome homenageia o reverendo inglês Thomas Bayes (1701-1761), pioneiro no uso de probabilidade na resolução de problemas. Mas a probabilidade bayesiana como a entendemos hoje deve-se sobretudo ao francês Pierre-Simon de Laplace (1749-1827), que redescobriu as ideias de Bayes e as difundiu.

Para os matemáticos bayesianos, a probabilidade de um evento é a expectativa de que ele ocorra, com base na informação disponível. Ela é, então, subjetiva, já que depende da informação acessível a cada pessoa. Isso é muito surpreendente para uma teoria matemática!

Bayes apresentou uma fórmula para melhorar a estimativa da probabilidade a partir de cada nova informação. Vou exemplificar com a seguinte questão: quando um teste de HIV dá positivo, qual é a probabilidade de que a pessoa esteja realmente infectada?

Suponhamos que a chance de erro do teste —dar positivo para pessoa saudável ou negativo para pessoa infectada— é 0,2%. Com chance de erro tão baixa, concluiríamos que a probabilidade de alguém com teste positivo estar infectado deve ser quase 100%. Mas suponhamos que também é sabido que os infectados formam 0,1% da população. Usando esta nova informação, a fórmula de Bayes dá que a probabilidade de alguém com teste positivo estar infectado é de apenas 33%.

Na maioria dos problemas, não temos acesso direto aos dados que nos interessam (nesse caso, a existência ou não de infecção) e precisamos inferi-los de suas consequências (o resultado do teste). A abordagem bayesiana é muito adequada para isso. 

Não é por acaso que a probabilidade bayesiana está na base de muitas das aplicações mais excitantes da matemática e da estatística nos nossos dias, especialmente na inteligência artificial, que usa bases de dados dinâmicas, nas quais a informação é atualizada o tempo todo.

LINK PRESENTE: Gostou deste texto? Assinante pode liberar cinco acessos gratuitos de qualquer link por dia. Basta clicar no F azul abaixo.

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.