Fotos dos seus filhos estão alimentando a tecnologia de vigilância

Vulnerabilidade de segurança permite que fotos do Flickr sejam acessadas mesmo depois que se tornem privadas

Edição Impressa

Kashmir Hill Aaron Krolik

The New York Times

Um dia, no verão de 2005, Dominique Allman Papa, de Evanston, Illinois, entrou no site de compartilhamento de fotos Flickr. Ela carregou algumas imagens, muitas delas de seus filhos pequenos, Chloe e Jasper; então ela se afastou da plataforma e praticamente esqueceu que sua conta do Flickr existia.

Recentemente, liguei para Chloe Papa com algumas notícias: os rostos das crianças Papa —sorrindo com os pais; mostrando a língua; fantasiadas para o Halloween— foram sugados para o MegaFace, um banco de dados de reconhecimento facial sem precedentes.

Contendo as semelhanças de quase 700 mil pessoas, ele foi baixado por dezenas de empresas para treinar e testar uma nova geração de algoritmos de identificação facial, usados para rastrear manifestantes, vigiar terroristas, detectar apostadores problemáticos e espionar o público em geral. A idade média das pessoas no banco de dados, segundo seus criadores, é 16.

"É horrível e desconfortável", disse Papa, que agora tem 19 anos e estuda no Oregon. "Eu gostaria que eles tivessem me perguntado primeiro se eu queria fazer parte disso. Acho que a inteligência artificial é bacana e quero que seja mais inteligente, mas geralmente você pede às pessoas para participarem da pesquisa. Aprendi isso na aula de biologia no ensino médio."

Por lei, a maioria dos americanos no banco de dados não precisa ter sua permissão solicitada —mas os Papas deveriam.

Como residentes de Illinois, eles são protegidos por uma das mais rigorosas leis de privacidade do país: a Lei de Privacidade da Informação Biométrica, uma medida de 2008 que impõe sanções financeiras pelo uso das impressões digitais de um cidadão de Illinois ou pela digitalização facial sem consentimento.

As empresas que usaram o banco de dados —como Google, Amazon, Mitsubishi Electric, Tencent e SenseTime— parecem não ter conhecimento da lei e, em consequência, poderão ter uma enorme responsabilidade financeira, de acordo com vários advogados e professores de direito que conhecem bem a legislação.

Como nasceu o MegaFace

Como os Papa e centenas de milhares de outras pessoas acabaram no banco de dados? É uma história que dá voltas.

Na infância da tecnologia de reconhecimento facial, os pesquisadores desenvolveram seus algoritmos com o claro consentimento dos sujeitos: na década de 1990, as universidades tinham voluntários que frequentavam estúdios para ser fotografados por vários ângulos.

Mais tarde, os pesquisadores usaram métodos mais agressivos e furtivos para reunir rostos em escala maior, acessando câmeras de vigilância de cafés, campus universitários e espaços públicos e copiando fotos postadas online.

Segundo Adam Harvey, artista que examina os conjuntos de dados, provavelmente existem mais de 200, contendo dezenas de milhões de fotos de cerca de um milhão de pessoas. (Alguns dos conjuntos são derivados de outros, portanto, os números incluem algumas duplicatas.) Mas esses cachês tinham falhas. As imagens de vigilância geralmente são de baixa qualidade, por exemplo, e a coleta de fotos na internet tende a produzir muitas celebridades.

Em junho de 2014, buscando promover a causa da visão computacional, o Yahoo divulgou o que chamou de "a maior coleção pública de multimídia já lançada", com 100 milhões de fotos e vídeos. O Yahoo obteve as imagens —todas com Creative Commons ou licenças de uso comercial— do Flickr, uma subsidiária.

Os criadores do banco de dados disseram que sua motivação era nivelar o campo do aprendizado mecânico. Os pesquisadores precisam de enormes quantidades de dados para treinar seus algoritmos, e os funcionários de algumas empresas ricas em informações --como Facebook e Google-- tinham grande vantagem sobre todos os demais.

"Queríamos capacitar a comunidade de pesquisa, fornecendo-lhe um banco de dados robusto", disse David Ayman Shamma, diretor de pesquisa do Yahoo até 2016 e que ajudou a criar o projeto Flickr. Os usuários não foram notificados de que suas fotos e vídeos foram incluídos, mas Shamma e sua equipe criaram o que consideravam uma salvaguarda.

Eles não distribuíam fotos dos usuários diretamente, mas sim links para as fotos. Dessa forma, se um usuário excluísse as imagens ou as tornasse privadas, elas não seriam mais acessíveis através do banco de dados.

Mas essa salvaguarda era falha. O The New York Times encontrou uma vulnerabilidade de segurança que permite que as fotos de um usuário do Flickr sejam acessadas mesmo depois que se tornem privadas. (Scott Kinzie, porta-voz da SmugMug, que adquiriu o Flickr do Yahoo em 2018, disse que a falha "afeta potencialmente um número muito pequeno de nossos membros hoje, e estamos trabalhando ativamente para implantar uma atualização o mais rápido possível". Ben MacAskill, diretor de operações da empresa, acrescentou que a coleção do Yahoo foi criada "anos antes de nosso envolvimento com o Flickr".)

Além disso, alguns pesquisadores que acessaram o banco de dados simplesmente baixaram versões das imagens e as redistribuíram, incluindo uma equipe da Universidade de Washington. Em 2015, dois professores de ciência da computação da escola —Ira Kemelmacher-Shlizerman e Steve Seitz— e seus alunos de graduação usaram os dados do Flickr para criar o MegaFace. Contendo mais de quatro milhões de fotos de cerca de 672 mil pessoas, era uma grande promessa para testar e aperfeiçoar algoritmos de reconhecimento facial.

Monitorando uigures e denunciando atores pornô

Um fator importante para os pesquisadores da Universidade de Washington é que o MegaFace incluía crianças como Chloe e Jasper Papa. Os sistemas de reconhecimento facial tendem a ter um mau desempenho com os jovens, mas o Flickr oferecia uma oportunidade de melhorar isso com uma quantidade de rostos de crianças, pela simples razão de que as pessoas adoram postar fotos de seus filhos online.

Em um artigo acadêmico, Kemelmacher-Shlizerman e um estudante de graduação chamado Aaron Nech estimaram a idade média dos sujeitos do MegaFace em 16,1 anos; 41% dos rostos pareciam ser de mulheres e 59% de homens.

Em 2015 e 2016, a Universidade de Washington realizou o "Desafio MegaFace", convidando grupos que trabalhavam com tecnologia de reconhecimento facial a usar o conjunto de dados para testar o desempenho de seus algoritmos.

A escola pediu às pessoas que baixariam os dados que concordassem em usá-los apenas para "pesquisas não comerciais e com fins educacionais". Mais de cem organizações participaram, incluindo Google, Tencent, SenseTime e NtechLab.

No total, de acordo com um comunicado de imprensa da universidade em 2016, "mais de 300 grupos de pesquisa" trabalharam com o banco de dados. Ele foi citado publicamente por pesquisadores da Amazon e, segundo Harvey, Mitsubishi Electric e Philips.

Algumas dessas empresas foram criticadas pela maneira como os clientes implementaram seus algoritmos: a tecnologia do SenseTime foi usada para monitorar a população uigur da China, enquanto o NtechLab serviu para denunciar atores pornográficos e identificar estranhos no metrô na Rússia.

A diretora de marketing do SenseTime, June Jin, disse que os pesquisadores da empresa usavam o banco de dados MegaFace apenas para fins acadêmicos. "Os pesquisadores precisam usar o mesmo conjunto de dados para garantir que seus resultados sejam comparáveis", escreveu Jin em um email. "Como o MegaFace é o banco de dados mais amplamente reconhecido do gênero, tornou-se o treinamento e o teste de reconhecimento facial de fato para a comunidade acadêmica e de pesquisa global."

Um porta-voz da NtechLab, Nikolay Grunin, disse que a empresa excluiu o MegaFace depois de participar do concurso e acrescentou que "a estrutura principal do nosso algoritmo não foi treinada com essas imagens". O Google se recusou a comentar.

Uma porta-voz da Universidade de Washington não quis disponibilizar os principais pesquisadores do MegaFace para entrevistas, dizendo que "passaram para outros projetos e não têm tempo para comentar sobre isso". Os esforços para contatá-los individualmente não tiveram êxito.

A criação do MegaFace foi financiada em parte pela Samsung, pelo Faculty Research Award do Google e pela National Science Foundation/Intel.

Nos últimos anos, Kemelmacher-Shlizerman vendeu uma empresa de troca de imagens de rosto para o Facebook e avançou a tecnologia de fraudes, convertendo clipes de áudio de Barack Obama em um vídeo realista e sintético dele fazendo um discurso. Ela agora está trabalhando em um "projeto espacial" no Google.

"Que diabos? Isso é loucura"

O MegaFace permanece disponível ao público para download. Quando The New York Times solicitou recentemente o acesso, foi concedido em um minuto.

O MegaFace não contém nomes de pessoas, mas seus dados não são anônimos. Um porta-voz da Universidade de Washington disse que os pesquisadores queriam respeitar as licenças Creative Commons das imagens. Por isso, cada foto inclui um identificador numérico vinculado à conta original do fotógrafo no Flickr. Dessa forma, o Times conseguiu conectar muitas fotos do banco de dados às pessoas que as tiraram.

"Que diabos? Isso é loucura", disse Nick Alt, empresário de Los Angeles, ao saber que suas fotos estavam no banco de dados, incluindo algumas que ele tirou de crianças em um evento público em Playa Vista, na Califórnia, uma década atrás.

"A razão pela qual entrei no Flickr originalmente foi que você podia definir a licença como não comercial. Absolutamente, eu não deixaria minhas fotos serem usadas em projetos de aprendizado mecânico. Sinto-me um idiota por ter postado aquela foto. Mas fiz isso 13 anos atrás, antes da privacidade ser uma grande coisa."

Outro sujeito, que pediu para ser identificado como J., é hoje um estudante do ensino médio de 15 anos em Las Vegas. Fotos dele quando criança estão no banco de dados do MegaFace, graças a um tio que as publicou num álbum do Flickr após uma reunião de família há uma década. J. estava incrédulo por não ser ilegal colocá-lo no banco de dados sem sua permissão, e está preocupado com as repercussões.

Desde o ensino médio, ele faz parte de um programa da Associação da Força Aérea chamado CyberPatriot, que tenta direcionar jovens com habilidades de programação para carreiras em inteligência e militares. "Sou muito protetor com minha pegada digital por causa disso", disse ele. "Tento não postar fotos minhas online. E se eu decidir trabalhar para a ANS?"

Para J., Alt e a maioria dos outros americanos nas fotos, há pouco recurso. A lei de privacidade geralmente é tão permissiva nos Estados Unidos que as empresas são livres para usar o rosto de milhões de pessoas sem seu conhecimento para promover a disseminação da tecnologia de reconhecimento facial. Mas há uma exceção.

Em 2008, o Estado de Illinois aprovou uma lei que protege os "identificadores biométricos e informações biométricas" de seus residentes. Dois outros Estados, Texas e Washington, também aprovaram leis de privacidade biométrica, mas não são tão firmes quanto a de Illinois, que proíbe estritamente entidades privadas de coletar, captar, comprar ou obter dados biométricos de uma pessoa --incluindo uma verificação da "geometria facial"-- sem seu consentimento.

"As fotos em si não são cobertas pela Lei de Privacidade da Informação Biométrica, mas a digitalização das fotos deve ser. O mero uso de dados biométricos é uma violação do estatuto", disse Faye Jones, professora de direito na Universidade de Illinois. "Usar isso em um concurso algorítmico sem ter notificado as pessoas é uma violação da lei."

Residentes de Illinois, como os Papa, cujas impressões faciais são usadas sem sua permissão, têm o direito de processar, disse Jones, e têm direito a US$ 1.000 (R$ 4.125,70) por uso, ou US$ 5.000 (R$ 20.628,50) se o uso for "imprudente".

O Times tentou calcular quantas pessoas de Illinois estão no banco de dados do MegaFace; uma abordagem, usando informações de localização automencionadas, sugeriu 6.000 indivíduos, e outra, usando metadados de identificação geográfica, indicou até 13 mil. Sua biometria provavelmente foi processada por dezenas de empresas. De acordo com vários especialistas jurídicos em Illinois, a indenização combinada pode chegar a mais de US$ 1 bilhão (R$ 4,1 bilhões) e formar a base de uma ação coletiva.

"Temos muitos advogados de ação coletiva ambiciosos aqui em Illinois", disse Jeffrey Widman, sócio-gerente da Fox Rothschild em Chicago. "A lei está em vigor em Illinois desde 2008, mas foi basicamente ignorada por uma década. Eu garanto que em 2014 ou 2015 essa responsabilidade potencial não estava no radar de ninguém. Mas a tecnologia agora foi além da lei."

Um processo de US$ 35 bilhões contra o Facebook

É notável que a lei de Illinois exista. De acordo com Matthew Kugler, professor de direito na Universidade Northwestern, que pesquisou a lei de Illinois, ela foi inspirada pela falência em 2007 de uma empresa chamada Pay by Touch, que detinha as impressões digitais de muitos americanos, incluindo de Illinois; havia preocupações de que pudesse vendê-las durante sua liquidação. Ninguém na indústria tecnológica levou em conta a lei, de acordo com registros legislativos e de lobistas.

"Quando a lei foi aprovada, ninguém que hoje se preocupa com ela estava pensando no assunto", disse Kugler. O Vale do Silício está ciente da lei agora. A Bloomberg News informou em abril de 2018 que lobistas do Google e do Facebook estavam tentando enfraquecer suas disposições.

Mais de 200 ações coletivas alegando uso indevido da biometria dos residentes foram iniciadas em Illinois desde 2015, incluindo um caso de US$ 35 bilhões (R$ 144,3 bilhões) contra o Facebook por usar o reconhecimento facial para marcar pessoas em fotos. Esse processo ganhou força em agosto, quando o 9º Tribunal de Apelações do Circuito dos EUA rejeitou os argumentos da empresa de que as pessoas não sofriam "danos concretos".

Nos últimos anos, as empresas de tecnologia têm pisado mais levemente nos Estados com legislação biométrica. Quando o Google lançou um recurso em 2018 que combinava selfies com obras de arte famosas, as pessoas em Illinois e no Texas não puderam usá-lo. E as câmeras de segurança Nest do Google não oferecem um recurso padrão para reconhecer rostos familiares em Illinois.

"É assustador você me encontrar. Eu sempre vivi com a filosofia de que o que eu colocava lá era público, mas não poderia imaginar isso", disse Wendy Piersall, editora e vereadora em Woodstock, Illinois, cujas fotos, junto com as de seus três filhos, estavam no banco de dados MegaFace.

"Nós não podemos usar o divertido aplicativo de arte. Por que vocês estão usando o rosto de nossos filhos para testar seu software?", acrescentou ela. "Minhas fotos lá são identificadas geograficamente em Illinois. Não é difícil descobrir onde essas fotos foram tiradas. Eu não sou uma pessoa que gosta de processar, mas gostaria que alguém fosse atrás disso."

Niilismo da privacidade

Alguns dos processos de Illinois foram resolvidos por acordo ou julgados improcedentes, mas a maioria está ativa, e Kugler, o professor de direito da Northwestern, observou que as questões legais básicas permanecem sem resposta.

Não está claro qual seria a responsabilidade legal de uma empresa que tira fotos postadas em Illinois, mas processa os dados faciais em outro Estado ou até em outro país. "Os réus serão criativos na busca de argumentos, porque ninguém quer ficar preso segurando essa batata quente e cara", disse ele.

Um porta-voz da Amazon Web Services disse que o uso do conjunto de dados é "compatível com a lei de privacidade", mas se nega a explicar como. Mario Fante, porta-voz da Philips, escreveu em um email que a empresa "nunca teve conhecimento de nenhum residente de Illinois incluído no conjunto de dados mencionado acima".

Victor Balta, porta-voz da Universidade de Washington, disse: "Todos os usos das fotos no banco de dados dos pesquisadores são legais. A UW é uma universidade pública de pesquisa, não uma entidade privada, e a lei de Illinois tem como alvo entidades privadas".

Alguns dos moradores de Illinois que encontramos no MegaFace e contatamos eram indiferentes ao uso de seus rostos. "Eu sei que quando você posta informações online elas podem ser usadas de maneiras inesperadas, então acho que não estou surpreso", disse Chris Scheufele, desenvolvedor web em Springfield. "Ao enviar informações para a Internet e disponibilizá-las para consumo público, você deve esperar que sejam usadas."

E os sujeitos de suas fotos?

Scheufele riu. "Não conversei com minha mulher sobre isso", disse.

"Niilismo da privacidade" é um termo cada vez mais familiar para desistir de tentar controlar dados pessoais na era digital. O que aconteceu com Chloe Papa poderia, dependendo da sua perspectiva, ser motivo para uma extrema vigilância ou total resignação: quem poderia prever que um instantâneo de uma criança em 2005 contribuiria, uma década e meia depois, para o desenvolvimento de tecnologia de vigilância de ponta?

"Nós nos acostumamos a trocar conveniência por privacidade, e isso amorteceu nossos sentidos sobre o que acontece com todos os dados coletados sobre nós", disse Jones, a professora de direito. "Mas as pessoas estão começando a acordar."

Tradução de Luiz Roberto Mendes Gonçalves

Instituições, empresas e ONGs recebem doações para RS; veja como ajudar

Últimas notícias

Fotos dos seus filhos estão alimentando a tecnologia de vigilância