Ciência Fundamental

O que pensam os jovens cientistas no Brasil?

Ciência Fundamental - Ciência Fundamental
Ciência Fundamental

Inteligência artificial e a diferença entre fazer e usar

Como um computador é capaz de aprender por meio da matemática

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Edgard Pimentel

Seja uma camiseta que monitora riscos de um ataque cardíaco, seja um espremedor de batatas ou mesmo uma chave de fenda, toda ferramenta tem dois lados: um diz respeito às habilidades para usá-la, o outro, às competências para criá-la. Quando o assunto é inteligência artificial, o mesmo se aplica: existem diversas formas de utilizá-la. Já do lado da criação e aperfeiçoamento, a protagonista é clara: estamos falando da matemática.

Vamos começar com uma questão muito simples para entender como a matemática viabiliza a inteligência artificial: a atribuição de um rótulo a alguns objetos. Na área da saúde, por exemplo, é fundamental distinguir imagens que indicam um paciente saudável daquelas que sugerem alguma anormalidade. Ou seja, trata-se de rotular uma imagem como saudável ou não saudável.

Arte ilustra o matemático francês Laplace em recortes coloridos e envolto por elementos divertidos, como um sundae e um sapato alto
Ilustração: Valentina Fraiz - Instituto Serrapilheira

Outro exemplo tem a ver com o tráfego online de usuários de internet, quando queremos classificar páginas visitadas na web. Por exemplo, anúncios personalizados requerem entender quais produtos interessam a uma determinada pessoa (livros, sapatos, brinquedos, passagens aéreas). Para tal, é útil rotular os sites visitados pelo usuário.

Mas aqui há uma questão fundamental. O volume de dados a serem classificados é gigantesco, e contar com mão de obra humana é tremendamente caro, além de eventualmente inviável. A solução? Basta ensinar a tarefa a um computador. Simples, não? Só que tem um pequeno detalhe: como um computador aprende a rotular? Essa difícil pergunta ocupa espaço importante, seja no panorama científico, seja nas conversas com meu amigo e colaborador José Miguel Urbano, caminhando pelo campus da Universidade de Coimbra.

O aprendizado semi-supervisionado é uma das estratégias. Algumas imagens, com seus respectivos rótulos, são mostradas a um computador. A partir desta fração representativa, cria-se uma regra que a máquina passa a aplicar sozinha àquelas sem rótulo. Mas, de novo: como criar essa regra? Uma resposta está nas equações diferenciais parciais (que chamaremos EDPs).

Vamos pensar o problema em outros termos. Uma imagem, ou website, é um ponto; a regra que estamos procurando é um objeto matemático que para cada ponto faz corresponder um rótulo. E sabemos como essa regra se comporta em um conjunto bem pequeno de pontos. Aliás, em matemática, regras que relacionam dois conjuntos, atribuindo um único elemento de um deles aos elementos do outro, são chamadas funções.

Ou seja, queremos estender a regra (função) dos pontos conhecidos aos desconhecidos. Para isto existem muitos mecanismos. Vamos nos concentrar em um método muito popular em matemática: o caminho mais barato. A ideia é considerar um objeto matemático que calcula o preço de cada regra e escolher aquela que minimiza este custo.

No caso mais simples, o custo a ser minimizado é conhecido como energia de Dirichlet, nomeada em homenagem ao matemático alemão Johann Dirichlet (1805-59). Neste cenário, obtém-se a equação de Laplace, que celebra o cientista francês Pierre-Simon Laplace (1749-1827). Depois de tanta homenagem, é a vez da inteligência artificial: a solução da equação de Laplace que leva em conta os (poucos) rótulos conhecidos é uma regra de aprendizagem procurada. Ou seja: ensinar o computador passa por resolver uma equação diferencial parcial.

Mas esta é apenas uma possível regra. E a experiência mostra que pode não ser a melhor. Quando o custo em questão é a energia de Dirichlet, a função aprendizado que obtemos pode escolher um único rótulo e atribuí-lo a todos os pontos, sem fazer distinção entre eles.

Uma maneira de refinar o método é alterar levemente o custo. Em termos matemáticos, um expoente que aparece na energia é alterado: ao invés de elevar uma coisa ao quadrado, passa-se a elevar a outro expoente. Agora a EDP resultante do processo não é mais a equação de Laplace, mas sim a equação p-Laplace. Parece uma mudança de nada, mas no fundo dá origem a um outro universo. E sua solução oferece outra regra para ensinar computadores a pensar.

É razoável esperar que a regra obtida melhore conforme aumenta este tal expoente — quase como um botão de volume em um aparelho de som. E como o maior expoente possível seria simplesmente infinito, queremos saber se existe uma EDP que trata deste caso. A resposta é positiva (matemática é mesmo bem divertida!) e a equação em questão é chamada infinito-Laplaciana.

Muitas questões importantes sobre estas equações permanecem sem resposta, e a comunidade matemática se debruça sobre cada um destes aspectos. Porque, afinal, fazer inteligência artificial, disponível nos computadores, depende de saber usar a inteligência natural, disponível em toda parte.

*

Edgard Pimentel é pesquisador do Centro de Matemática da Universidade de Coimbra e professor da PUC-Rio.

Inscreva-se na newsletter do Serrapilheira para acompanhar mais novidades do instituto e do blog Ciência Fundamental.

LINK PRESENTE: Gostou deste texto? Assinante pode liberar cinco acessos gratuitos de qualquer link por dia. Basta clicar no F azul abaixo.

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.