O astrônomo Simon Newcomb descobriu em 1881 que nos dados astronômicos é muito mais comum que o dígito inicial (o da esquerda) seja pequeno (1, 2,...) do que grande (9, 8, "¦). A chance de o número começar com um dígito d é aproximadamente igual ao logaritmo decimal de (1+1/d): para d=1 isso dá 30,1%, mas para d=9 é apenas 4,6%.
Esse fato surpreendente foi redescoberto em 1937 pelo físico Frank Benford, o qual apontou que o mesmo ocorre nos mais diversos tipos de dados: populações de cidades, números nesta edição da Folha, casos de Covid em diferentes países e estados, tamanhos de vulcões, intervalos de tempo entre batidas cardíacas, pontos em partidas de basquete etc.
Existem exceções, quando os dados são artificiais (números de celular no Rio de Janeiro sempre começam com 9) ou variam numa faixa limitada (alturas de adultos em pés começam quase sempre com 5 ou 6). Mas está amplamente confirmado que a grande maioria dos dados naturais segue a lei Benford, conforme ilustrei na última edição desta coluna. Isso significa que ela pode ser usada para ajudar a distinguir dados reais de dados incorretos ou fraudulentos.
Uma aplicação é na auditoria de declarações de impostos: se a declaração for genuína, os valores devem obedecer à lei de Benford, portanto eventual discrepância é indício para que a declaração caia na malha fina e seja analisada com cuidado. A Receita Federal e suas congêneres em outros países não revelam seus métodos, então ignoramos o quão usada a lei realmente é. Mas é ferramenta gratuita e muito fácil de aplicar.
Eu sei, querido leitor, isto deve estar lhe parecendo muito ingênuo: certamente um bom sonegador é esperto o suficiente para "cozinhar" seus valores de acordo com a lei de Benford, certo? Bem, não é tão simples, porque a lei tem uma propriedade chamada invariância de escala. O que isso significa na prática é que não importa a unidade que seja usada, a lei tem que valer sempre!
Por exemplo, mesmo que os dados da declaração estejam bem "fabricados" em reais, a Receita Federal pode convertê-los para ienes japoneses, francos suíços ou rupias indianas. Os números ficam completamente diferentes, mas devem continuar satisfazendo a lei de Benford: discrepância em qualquer uma dessas moedas é indício suspeito. Agora complicou, não?
E a lei de Benford tem outras propriedades notáveis que tornam ainda mais difícil enganá-la. Fica para a semana que vem.
Comentários
Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.