São Paulo, segunda-feira, 10 de agosto de 2009

Próximo Texto | Índice

Procurando sentidos no dilúvio digital

Por STEVE LOHR

Suzanne Dechillo/The New York Times


Mountain View, Califórnia
Carrie Grimes se formou em arqueologia na Universidade Harvard e se aventurou em lugares como Honduras, onde mapeou os padrões da ocupação maia com base no local onde artefatos foram achados. Mas acabou sendo atraída por "todo esse troço de informática e matemática" que seu trabalho envolve.
Agora, Grimes se dedica a um tipo diferente de escavação. Ela trabalha no Google, onde usa a análise estatística de pilhas de dados para encontrar formas de melhorar aquele mecanismo de busca.
Grimes é uma estatística da era da internet, uma entre muitos que desafiam a imagem dessa profissão como um reduto de monótonos "nerds" numéricos. Agora, há crescente demanda -e até admiração- por eles.
"Continuo dizendo que o trabalho 'sexy' nos próximos dez anos será o dos estatísticos", disse Hal Varian, economista-chefe do Google. "E não estou brincando." Tal valorização dos estatísticos, que chegam a ganhar US$ 125 mil no seu primeiro ano após o doutoramento, é um subproduto da recente explosão dos dados digitais. A informática vai criando sucessivamente novas áreas de dados para explorar, tão diversas como sinais de sensores, gravações de vigilância, conversas nas redes sociais e arquivos públicos. A empresa de pesquisas IDC estima que a quantidade de dados digitais irá quintuplicar até 2012.
Só que os dados são meramente a matéria-prima do conhecimento. "Estamos entrando em um mundo em que tudo pode ser monitorado e mensurado", disse Erik Brynjolfsson, diretor do Centro para os Negócios Digitais do Instituto de Tecnologia de Massachusetts, EUA.
"Mas o grande problema será a capacidade dos humanos de usar, analisar e dar um sentido aos dados", afirmou Brynjolfsson.
A nova safra de estatísticos lida com esse problema. Eles usam poderosos computadores e sofisticados modelos matemáticos para caçar padrões e revelações em meio a vastos tesouros de dados.
As aplicações são tão diversas quanto melhorar as buscas e a publicidade na internet, coletar informações de sequenciamento genético para pesquisas contra o câncer e analisar dados que otimizem os prazos e as condições do transporte alimentício. Os estatísticos são apenas uma pequena parte do exército de especialistas que usa modernas técnicas estatísticas para analisar dados.
Habilidades informáticas e numéricas são bem mais importantes, segundo especialistas, do que diplomas universitários. Por isso, esses detetives dos dados vêm de áreas como economia, ciências da computação e matemática.
A IBM, buscando uma oportunidade no serviço de caça de dados, criou um grupo de Serviços de Análise e Otimização de Negócios. Essa unidade aproveitará o conhecimento de mais de 200 matemáticos, estatísticos e outros analistas em seus laboratórios -mas esse número não basta. A IBM pretende retreinar ou contratar outros 4.000 analistas em toda a empresa.
Essa maré de dados está transformando uma profissão que tradicionalmente lidava com trabalhos menos destacados e lucrativos, como calcular índices de expectativa de vida para seguradoras ou o volume de safras no setor agrícola.
Grimes, 32, se doutorou em estatística em 2003 na Universidade Stanford (Califórnia) e entrou no Google no final daquele ano. Ela já trabalhou, por exemplo, em um algoritmo estatístico para refinar o software de varredura com o qual o Google atualiza constantemente a sua indexação de buscas. A meta, explicou ela, é obter pequenos ganhos de eficiência no emprego dos computadores e redes.
"Mesmo uma melhora de 1% ou 2% pode ser enorme, quando as coisas são feitas milhões ou bilhões de vezes, como fazemos no Google", disse ela. É o tamanho dos conjuntos de dados presentes na web que abre novos mundos de informação e descoberta. Tradicionalmente, as ciências sociais monitoram o comportamento das pessoas por meio de entrevistas e pesquisas.
"Mas a web fornece este incrível recurso para observar como milhões de pessoas interagem", disse Jon Kleinberg, cientista da computação e pesquisador de redes sociais na Universidade Cornell, no Estado de Nova York.
Mas especialistas alertam para os riscos dessa riqueza de dados na web . O enorme volume de informações pode facilmente sobrecarregar os modelos estatísticos. Os estatísticos também alertam que fortes correlações entre dados não necessariamente comprovam uma ligação de causa-efeito.
Por exemplo, no final da década de 1940, antes de existir a vacina contra a poliomielite, sanitaristas dos Estados Unidos notaram que os casos de pólio cresciam junto com o consumo de sorvetes e refrigerantes. Chegou-se a recomendar a eliminação de tais ameaças como parte de uma dieta antipólio. Mas a real ligação era que os surtos de pólio eram mais comuns nos meses de verão.
Se a explosão de dados amplia antigas questões ligadas à estatística, ela também abre novas fronteiras. "A chave é permitir que os computadores façam aquilo em que são bons, que é recolher esses enormes conjuntos de dados para achar algo que seja matematicamente fora do usual", disse Daniel Gruhl, pesquisador da IBM cujo trabalho inclui garimpar dados médicos em busca de melhores tratamentos contra determinadas doenças. "E isso facilita que os humanos façam aquilo em que eles são bons -explicar essas anomalias."


Próximo Texto: Lente: Nas reuniões de negócios, um toque feminino
Índice



Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.