Vídeo mostra trabalho de indexação de 2,5 milhões de fotos da Folha

Armazenamento em nuvem do acervo é resultado de parceria do jornal com Google e Assetway

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

São Paulo

A indexação de um acervo de cerca de 2,5 milhões de fotos da Folha, um projeto de dimensões inéditas no Brasil, é apresentado em um vídeo, que acaba de ser lançado.

Ao longo de pouco mais de dois minutos, de forma didática, o vídeo mostra o trabalho realizado por meio de uma parceria do jornal com o Google News Initiative, programa global de apoio a projetos de organizações de notícias e produtores de conteúdo, e com a Assetway, empresa catarinense de gestão de conteúdos digitais.

Essas milhões de imagens tinham sido digitalizadas entre 2013 e 2016 pela equipe do Banco de Dados da Folha, quando o jornal se empenhou para preservar o seu conteúdo. A busca por elas no acervo digital, no entanto, era complicada mesmo para os profissionais dedicados exclusivamente a esse fim, o que tornava parte do material virtualmente inacessível.

"Uma indexação manual levaria em torno de 35 anos. A gente precisava de um sistema digital que conseguisse ler as informações, transformando-as em dados", diz no vídeo Jair dos Santos, coordenador do processo de digitalização do Banco de Dados da Folha.

Iniciado em fevereiro de 2020, o trabalho das três empresas possibilitou o armazenamento em nuvem do acervo, a leitura rápida das informações textuais na frente e no verso de cada uma das imagens e a criação da ferramenta de busca inteligente e organizada.

"A Assetway entrou no processo de indexação de toda essa coleção usando inteligência artificial", afirma Thiago Souza, gerente de produtos da empresa.

Segundo Erica Noda, gerente do time de parcerias no Google Brasil, "a tecnologia facilita e democratiza o acesso ao acervo, além de guardar com mais segurança os dados".

No total, somando palavras, imagens e outras informações lidas pelo algoritmo, foram produzidos 10 terabytes de dados, volume equivalente a cerca de 130 mil horas de música em formato mp3.

A iniciativa abrangeu fotografias que apareceram, desde a década de 1940, na Folha da Manhã, Folha da Tarde e Folha da Noite, os três jornais unificados na Folha de S.Paulo. Também é parte do material o acervo dos diários Última Hora e Notícias Populares, comprados pelo Grupo Folha nos anos 1960.

Ao longo do vídeo, aparecem imagens de peso histórico, cujo acesso se tornou muito mais simples com o sistema. Entre elas, estão um salto de Pelé para cabecear a bola durante uma partida entre Brasil e Escócia, em Glasgow (1966), e a construção do Masp na avenida Paulista (1968).

Além de facilitar o trabalho da Redação, a inovação é útil para pesquisadores. Solicitações para pesquisas devem ser feitas por meio da Folhapress, a agência de notícias do Grupo Folha, pelo email pesquisa@folhapress.com.br

"Ter esse acervo na nuvem é uma forma de preservá-lo. É um legado da Folha para toda a sociedade brasileira", afirma Juliana Laurino, gerente administrativa das Redações e gerente geral da Folhapress e do Banco de Dados.

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.