Saltar para o conteúdo principal Saltar para o menu
 
 

Lista de textos do jornal de hoje Navegue por editoria

Tec

  • Tamanho da Letra  
  • Comunicar Erros  
  • Imprimir  

Entrevista Jean-Baptiste Michel

Matemática é uma forma de compreender o mundo

Francês criou buscador que mostra como uma palavra foi registrada em 8 milhões de livros no decorrer de séculos

RODOLFO LUCENA DE SÃO PAULO

A aventura de criar uma superlente digital capaz de bisbilhotar a produção intelectual dos últimos dois séculos. Essa é a história contada em "Uncharted: Big Data as a Lens on Human Culture" ("Não Mapeado: Big Data Como uma Lente Sobre a Cultura Humana"), escrito pela dupla de cientistas Erez Aiden e Jean-Baptiste Michel.

Ambos são pesquisadores com interesses em múltiplas áreas. Aiden tem doutorados em matemática e engenharia biomédica, além de mestrado em história. Michel abandonou a academia e comanda sua própria empresa, que constrói aplicações com grandes quantidades de dados --tem mestrado em matemática e doutorado em biologia.

Os dois se conheceram em Harvard e descobriram o interesse comum de trabalhar com "big data". O objeto do estudo foi o Google Books, "uma biblioteca digital cujo objetivo era abranger todos os livros escritos". Resultado: o Ngram Viewer, apresentado em dezembro de 2010, buscador capaz de determinar a incidência de um termo e comparar seus registros em milhões de livros.

Em "Uncharted", lançado em dezembro, Aiden e Michel comentam várias aplicações divertidas da ferramenta (books.google.com/ngrams).

Nesta entrevista, Michel conta mais sobre o trabalho.

-

Folha - Qual foi a maior descoberta ao trabalhar com os dados do Google Books?

Jean-Baptiste Michel* - Percebemos que o Google já tinha tantos livros digitalizados que poderíamos usar essa enorme base de dados para entender a evolução da humanidade. Vimos ser possível fazer estudos significativos da cultura e da sociedade usando ferramentas quantitativas como o Ngram Viewer.

Para que ela serve?

É uma ferramenta poderosa, capaz de processar questões usando uma base gigantesca de textos. O Ngram Viewer é um objeto para a criatividade, para que você possa fazer novas perguntas... Eu não sou capaz de formular um milésimo, um milionésimo das perguntas que podem ser feitas, das pesquisas que podem ser realizadas nela.

Em quantos milhões de livros ele pesquisa?

O Google Books tem cerca de 30 milhões de livros digitalizados. Quando lançamos o sistema e publicamos o primeiro estudo, eram cerca de 5 milhões de livros. Em 2012, o pessoal do Google atualizou a ferramenta, que hoje pesquisa em até 8 milhões.

Por que não é possível pesquisar em português?

Não há uma boa razão. Nós simplesmente usamos os idiomas nos quais tínhamos maior número de livros digitalizados e também os idiomas que nós entendíamos, com inglês, francês e espanhol. Depois, incluímos idiomas históricos, como aramaico e hebreu. Não há planos para incluir o português, mas eu acharia sensacional se pudéssemos fazer isso.

Por que os senhores inventaram a palavra cultoromics', e o que ela significa?

Já há algum tempo existe o que chamamos de linguística cultural, que acompanha as mudanças do uso de palavras, da forma como são escritas. Agora, temos uma quantidade de dados que nos permite fazer um novo tipo de pergunta. Podemos ir além do estudo do uso da linguagem, chegar às ideias que estão por baixo das mudanças, ver as mudanças e como elas acontecem. Para demonstrar isso, seria útil ter uma nova palavra. A que escolhemos é uma combinação de cultura e genômica. Então, não é uma mistura de cultura e economia, como as pessoas costumam pensar.

Como o sr. define "big data"?

Para mim, "big data" é quando você tem uma quantidade de dados que é da mesma ordem de grandeza do total de dados disponível naquele universo. Nós estimamos que hoje existam cerca de 130 milhões de livros publicados. Quando a gente fala de 8 milhões de livros, cerca de 6% do total, é um número grande o suficiente para perceber que está na mesma ordem de grandeza.

Como o "big data" pode mudar as nossas vidas?

É uma forma de medir coisas que não podiam ser mensuradas antes. Nesse sentido, é uma forma de construir muitos instrumentos que falem sobre a experiência humana. Vai nos ajudar a entender a coisa mais fundamental, que é como nós vivemos. O "big data" é uma tecnologia transformadora, poderosa. E, como qualquer outra, pode ser usada para o bem ou para o mal.


Publicidade

Publicidade

Publicidade


Voltar ao topo da página