'Big data' pode aprimorar obtenção de estatísticas econômicas

Informações analisadas rapidamente serão úteis para governos e bancos centrais

Financial Times
Imagem de satélite em infravermelho mostra atividade agrícola no Kansas, nos EUA
Imagem de satélite em infravermelho mostra atividade agrícola no Kansas, nos EUA - Getty Images

Quando Alberto Cavallo era criança, no fim dos anos 1980 na Argentina, o país estava sofrendo uma de suas ocasionais crises. A inflação estava fora de controle, o que fazia das compras uma frenética corrida a cada dia.

Cavallo e a mãe iam ao banco todo dia, sacando os pesos necessários para as compras e mantendo o resto das economias da família em dólar. Depois corriam à loja local e compravam o que precisavam o mais rápido que podiam, se apressando para chegar ao caixa antes que os preços aumentassem mais uma vez.

Se não chegássemos em tempo ao caixa, tínhamos de voltar ao banco e começar de novo o processo, relembra.

Mas essa experiência serviu de semente a algo que se tornou uma das mais intrigantes experiências já conduzidas no mundo normalmente tépido das estatísticas econômicas: uma tentativa de aproveitar a explosão do "big data" [grande volume de dados] para ampliar, complementar e substituir os formatos de dados tradicionais que continuam a formar as posições de autoridades econômicas, políticos e acadêmicos, e a orientar trilhões de dólares em investimentos.

Cavallo é professor de economia aplicada no MIT, onde dirige o Billion Prices Project, com Roberto Rigobon, outro professor da instituição. O projeto foi iniciado em 2006, quando o governo argentino de então era acusado de manipular os dados sobre a inflação. Cavallo e Rigobon perceberam que, ao compilar os preços listados on-line pelos varejistas argentinos, seriam capazes de criar um indicador mais preciso e atualizado da inflação real no país.

O lado comercial do projeto, o PriceStats, agora recolhe dados suficientes para oferecer atualizações diárias de inflação em 22 economias.

O projeto é só um exemplo de uma tendência mais ampla que envolve lançar uma rede aos mares cada vez mais amplos do "big data" em busca de indicações sobre como empresas, setores ou economias inteiras estão se saindo.

Alguns dados já oferecem percepções úteis, se bem que imperfeitas. Mas há especialistas que preveem que os traços digitais de nossas vidas on-line poderão ser computados de maneira a criar um mapa de tendências econômicas em tempo real, que fará com que os formatos atuais de apresentação de dados pareçam tão arcaicos quanto números sobre os fretes ferroviários na década de 1920.

"Qualquer coisa que você deseje saber sobre a economia pode ser sabida, agora, se tiver acesso ao conjunto de dados correto", diz Tammer Kamel, presidente da Quandl, provedora de dados alternativos.

A ideia pode parecer ambiciosa, se considerarmos que o "big data" pode gerar resultados eivados de falhas, óbvias ou obscuras, e distorções. Mas alguns cientistas de dados dizem que, à medida que porção cada vez maior de nossas vidas migra para o mundo on-line, podemos estar nos aproximando do momento no qual estatísticas econômicas quase instantâneas se tornarão realidade.

BREXIT

Quando o Reino Unido votou por sair da União Europeia, em 2016, muitos economistas previram calamidade imediata. Uma pesquisa sobre o otimismo do setor de serviços registrou a maior queda em 20 anos, logo após o referendo sobre a saída da União Europeia (brexit), e o Goldman Sachs previu que o Reino Unido entraria em recessão. Mas até agora a economia vem demonstrando grande resistência.

Nem todo o mundo foi apanhado de surpresa pela tendência. Em 2015, o grupo de investimento britânico Schroders criou uma unidade de análise de dados para ajudar a avaliar os grandes volumes de informação digital hoje disponíveis, entre os quais dados sobre o uso de cartões de crédito que revelavam padrões reais de gastos. A despeito do pessimismo onipresente, os dados demonstravam que o impacto da decisão havia sido desprezível.

"Pudemos dizer aos nossos administradores de fundos que as coisas pareciam boas, e meses mais tarde os dados oficiais confirmaram essa análise", disse Mark Ainsworth, da Schroders.

Feeds de mídia social podem ser usados para criar indicadores em tempo real sobre sentimentos. Satélites registram que navio atraca onde, e quando, se os tanques de petróleo estão cheios ou vazios, se uma safra tem boa qualidade e quanto um alto-forno siderúrgico produz. Compras com cartões de crédito e recibos enviados por e-mail revelam os gastos no varejo.

Anúncios de empregos em centenas de milhares de sites de recursos humanos e empresas podem revelar os padrões do mercado de trabalho. E smartphones enviam dados de localização que mostram onde estamos em qualquer dado momento.

Minerar esses novos conjuntos de dados no passado era privilégio de sofisticados fundos de hedge "quantitativos". Agora, alguns bancos centrais e agências oficiais de estatísticas começam a atuar nesse campo, a fim de compreender melhor e mais rápido as marés econômicas um desdobramento que pode ter implicações significativas para as políticas públicas.

 

LEHMAN BROTHERS

A crise financeira expôs imensas lacunas nos dados oficiais. O comitê de datação de ciclos de negócios do Serviço Nacional de Pesquisa Econômica, que serve como árbitro semioficial das contrações econômicas nos EUA, demorou até dezembro de 2008 três meses depois da quebra do banco Lehman Brothers para declarar que a economia americana na verdade havia entrado em recessão um ano antes.

Embora diversos economistas já tivessem chegado a essa conclusão com base na piora dos indicadores mensais e trimestrais, as estatísticas não capturavam adequadamente o ritmo de deterioração da economia, recorda Diana Farrell, ex-diretora-assistente do Conselho Econômico Nacional dos EUA no governo de Barack Obama.

"A economia estava se saindo muito pior do que percebíamos, e nossa resposta em termos de políticas públicas se baseava na ideia de uma recessão muito mais fraca."

Farrell, que agora comanda o JPMorgan Chase Institute organização de pesquisa criada pelo banco homônimo para fazer dos dados do seus clientes uma fonte de percepções políticas e econômicas importantes, diz que o "big data" pode ter impacto imenso sobre as políticas públicas, especialmente em momentos de recessão.

"Há muita coisa a que os dados tradicionais não conseguem responder, em momentos extremos", diz. "Não creio que nada disso suplantará as estatísticas primárias, mas elas serão suplementadas."

No momento, o Serviço de Análise Econômica do Departamento do Comércio americano produz os números trimestrais sobre o PIB, mas até mesmo o indicador "relâmpago" já chega defasado em um mês e continua sujeito a muitas revisões. No futuro, as agências serão capazes de computar dados sobre a economia muito mais rápido, prevê Philippe Jordan, presidente do fundo francês de hedge CFM.

"Publicar dados sobre o PIB trimestralmente parecerá antiquado", diz. Dar estrutura aos dados é imensamente complexo. Mas talvez possamos começar a obter dados mensais sobre a economia, em lugar de trimestrais. Seria um primeiro passo.

CÉTICOS

Continuam a existir céticos quanto a tudo isso. Ewan Kirk, vice-presidente de investimento do fundo de hedge Cantab Capital, diz que muitos conjuntos de dados considerados promissores terminaram se provando inúteis para fins de investimento, quando avaliados por sua equipe, e é duvidoso que se provem muito mais valiosos para adivinhar em que direção uma economia está avançando.

"A economia é uma coisa muito complicada, mais que os mercados financeiros", diz. "Hoje, dá dinheiro ser provedor de dados alternativos, não ser usuário deles."

Cientistas de dados e estatísticos admitem que transformar dados, frequentemente confusos, em algo passível de uso pode ser um desafio significativo. Dados extraídos do uso de smartphones e mídia social muitas vezes não oferecem informações sobre cidadãos mais velhos, e dados sobre cartões de crédito só capturam alguns gastos. Já a obtenção de dados por satélites pode ser comprometida por clima desfavorável.

Críticos argumentam que os maiores obstáculos são logísticos e legais: as informações estão distribuídas pelo setor privado, detidas por bancos, empresas de telecomunicações, plataformas de mídia social ou companhias industriais. Em alguns casos, esses dados podem ser obtidos

por um preço, mas existem restrições legais quanto ao que empresas podem divulgar e limites práticos quanto ao que desejam revelar.

E há preocupações de segurança e privacidade envolvidas na centralização de enormes conjuntos de dados, que incluem informações às vezes delicadas, disse Ainsworth, da Schroders.

"A questão que deveríamos perguntar, como sociedade, é se devemos ter privacidade ou se devemos consolidar todos esses dados em um só lugar", diz. "Porque são dados digitais, e pessoais, e deveriam ser tratados com respeito."

A perspectiva de indicadores em tempo real derivados do "big data", mais granulares e mais precisos, é realidade ou fantasia?

Os céticos dizem que "big data" não significa automaticamente bons dados. A velocidade maior na geração de dados pode vir acompanhada por perda inaceitável de precisão, e esta última deveria continuar a ser prioridade para as agências estatísticas. O professor Cavallo diz ver esses novas fontes digitais de dados como complemento à informação tradicional, e duvida que esta última venha a ser suplantada em breve.

"Só porque podemos medir tudo, não significa que medir tudo seja valioso", ele diz.

Mesmo assim, os estágios iniciais daquilo que promete ser uma revolução nos dados digitais já estão em curso. Os otimistas dizem que já é possível medir tendências econômicas de uma maneira que teria sido impensável uma década atrás. Os conjuntos de dados existentes terão séries temporais mais longas, o que permitirá modelagem mais precisa, e novos dados surgirão. Isso deve permitir que os participantes avancem em termos de precisão e acelerem a criação de estatísticas abrangentes e contemporâneas sobre economias inteiras.

A professora Coyle diz que esse campo de estudos está no "estágio da hipérbole maciça" em seu desenvolvimento. Mas prevê que "as coisas progredirão rapidamente".

Tradução de PAULO MIGLIACCI

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.