Descrição de chapéu DeltaFolha

Analisar e categorizar ideologicamente mais de um milhão de perfis do Twitter é algo ambicioso

Editor do Deltafolha escreve sobre processo de criação da ferramenta GPS Ideológico

Fábio Takahashi
São Paulo

Cara, descobri um algoritmo que parece dar para categorizar ideologicamente os usuários do Twitter.

Foi o que me disse há cerca de três meses o analista de dados Daniel Mariani. Era uma ideia ambiciosa. Para começar pelo tamanho da empreitada. São milhões de contas na rede social a serem analisadas. E categorizar ideologicamente? Algo bem ambicioso.

Por outro lado, o assunto é interessante. O presidente Jair Bolsonaro escolheu a plataforma como um de seus principais meios de comunicação.

Como editor do grupo de jornalismo de dados da Folha, me cabia avaliar se valia a empreitada. Avante.

O tal algoritmo (que, simplificando, é um programa de computador) pega uma conta, analisa o padrão entre seus seguidores e verifica o quanto ela está próxima ou distante de outras contas.

Chamada influências no Twitter
Ferramenta GPS Ideológico categoriza ideologicamente usuários do Twitter - Simon Ducroquet

O programa entende, por exemplo, que muitas pessoas que seguem o ex-presidente Lula seguem também o petista Fernando Haddad —mas tendem a não seguir as contas do presidente Bolsonaro e a do escritor Olavo de Carvalho.

O modelo estatístico posiciona então o que chamamos de perfis-influenciadores numa reta. De um lado, ficam contas como de Lula, Haddad e correlatos. Do outro, Bolsonaro, Olavo e correlatos. 

E as demais contas desses influenciadores vão sendo posicionadas na reta, segundo a afinidade entre elas.

Com isso, passa a ser possível categorizar todos que seguem esses influenciadores. 
Os que seguem, por exemplo, o ministro Sergio Moro e deputados do PSL ficam do lado direito. São 1,7 milhão de perfis a serem analisados no total.

Para processar tantos dados, o programa de computador rodou por mais de uma semana, sem parar. 
Com resultados ainda preliminares, começamos a analisar como representar graficamente os resultados, trabalho que ficou a cargo especialmente de Thiago Almeida e Simon Ducroquet, do Núcleo de Imagem da Folha.

É um trabalho árduo. São testados diferentes tamanhos de bolas que representam cada perfil-influenciador nas infografias. Se são muito grandes, ficam espremidas. Se muito pequenas, não dão a leitura necessária.

Cada título e legenda da infografia é feita e refeita. É preciso ser o mais preciso possível, no menor espaço possível. Uma mensagem que precisa estar muito clara: a reta ideológica representa o perfil dos seguidores de cada influenciador, não necessariamente o que o influenciador fala.

As soluções devem funcionar para a versão impressa, desktop (telas maiores) e celular (telas menores). Em outra frente, os resultados do algoritmo vão sendo analisados. Os perfis que ficam nos extremos da reta seguem pouco quem não está nesses grupos, comportamento diferente de quem está no centro, que tende a ser mais permeável.

Ao fim dos três meses, fica pronta a ferramenta GPS Ideológico, que passa agora a analisar permanentemente o comportamento político dos usuários no Twitter. 

A ferramenta marca o lançamento do novo nome da equipe de jornalismo de dados da Folha, agora chamada de DeltaFolha. Ela recebeu tanta atenção nas plataformas digitais que virou até memes (muitos bem engraçados).

Tópicos relacionados

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.