Descrição de chapéu Folha, 100 google

Parceria com Google resgata imagens 'condenadas ao esquecimento' em acervo da Folha

Processo, que levou um ano e organizou mais de 2,5 milhões de imagens, ajuda a recontar décadas de história do país e do mundo

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

São Paulo

Uma parceria da Folha com o Google e a Assetway, empresa catarinense parceira da gigante de tecnologia, catalogou e organizou um acervo de 2,5 milhões de fotografias do jornal, agora acessíveis por um sistema de buscas mais intuitivo. Antes disso, as imagens só podiam ser acessadas em pastas digitais, o que dificultava a pesquisa e tornava parte do material virtualmente inacessível.

Com o novo sistema, em implantação na Redação desde janeiro, a Folha dá um passo adiante também na preservação e na disponibilização do seu acervo fotográfico. Imagens há muito buscadas pela equipe do Banco de Dados já começaram a voltar à tona.

Eclipse na década de 1950

Carregando imagens...

Foto do acervo em que pessoas assistem a um eclipse solar parcial na década de 1950; frente e verso da imagem traz informações sobre a reportagem, datas, onde foi publicado (a sigla U.H refere-se ao jornal Última Hora), entre outros dados manuscritos - UH/Folhapress

Embora ainda não se possa precisar quantas fotos foram recuperadas pelo trabalho, uma estimativa dá a dimensão do resgate: das 400 fotos selecionadas para os dez livros da Coleção 100 Anos de Fotografia - Pelas Lentes da Folha, cujo primeiro volume chega às bancas no próximo domingo, dia 28, cerca de 20% delas foram encontradas usando o sistema. Não fosse por isso, muitas imagens poderiam acabar fora da coleção – e portanto inacessíveis para o público.

A próxima etapa da parceria, ainda em curso, consistirá em disponibilizar coleções temáticas desse material no site do Google Arts and Culture, iniciativa que dá acesso direto ao público a imagens e acervos de instituições culturais. Desse modo, qualquer leitor poderá navegar por parte do catálogo hoje restrito.

Um exemplo de como o novo sistema facilita o trabalho de jornalistas e resgata imagens dadas como perdidas é uma foto de duas crianças dançando num pequeno palco. A equipe do jornal sabia da existência da foto e procurou, sem sucesso, na pasta chamada "Crianças", entre mais de mil fotos. Quando a busca foi feita pelo novo sistema, a imagem foi rapidamente encontrada. Feita na década de 1960, ela estava numa pasta chamada "Salão de Arte Infantil".

crianças pequenas dançam em um palco diante de um salão lotado de pessoas
Crianças dançam na festa Visconde de Sabugosa, promovida pela Folha em agosto de 1962; o evento fechou o 1º Salão Nacional de Arte Infantil. A imagem integra a Coleção 100 anos de Fotografia: pelas lentes da Folha, no terceiro volume, dedicado à infância - Folhapress

A iniciativa abrangeu fotografias que apareceram, desde a década de 1940, na Folha da Manhã, Folha da Tarde e Folha da Noite, os três jornais unificados na Folha de S.Paulo. Também é parte do material o acervo dos diários Última Hora e Notícias Populares, comprados pelo Grupo Folha nos anos 1960. Muitas das imagens nunca foram publicadas e permanecem inéditas.

Os registros recontam dos movimentos dos astros às histórias mais prosaicas de brasileiros comuns: estão ali personalidades políticas, como Jânio Quadros e Juscelino Kubitschek, gente das artes, como Elis Regina e Nelson Rodrigues, e dos esportes, como Pelé e Garrincha. Fotografias de Copas do Mundo e guerras mundo afora dividem espaço com imagens raras de meados do século 20 de observações de eclipses, praças em São Paulo e das margens do rio São Francisco.

Jânio Quadros visita Fidel

Carregando imagens...

Ainda deputado federal e então candidato à presidência, Jânio Quadros visitou Fidel Casto em Cuba, em 1960; no verso da foto, informações sobre data de publicação e contexto da notícia - UH/Folhapress

No decorrer do processo, foram incluídas também 26 mil charges de cartunistas que publicaram no jornal.

No total, somando palavras, imagens e outras informações lidas pelo algoritmo, foram produzidos 10 terabytes de dados, volume equivalente a cerca de 130 mil horas de música em formato mp3.

Para ter uma ideia da magnitude do projeto, em condições ideais, considerando a equipe que fazia esse trabalho manualmente, eram processadas em média 6.000 imagens por mês. Para finalizar o trabalho em todo o acervo, nesse ritmo, seriam necessários cerca de 35 anos de trabalho. Sem férias.

Em vez disso, o processo todo tomou pouco mais de um ano para ser concluído.

A indexação, nome técnico da operação, colheu informações na frente e no verso das fotografias para catalogá-las de forma automática. A partir disso, elas ficaram disponíveis num novo sistema que funciona como as buscas no Google, ágil e intuitivo, mas de uso interno da Redação.

Antes da indexação automatizada, um tratamento prévio das cerca de 100 mil pastas digitais de material fotográfico foi feito durante 2020 por Jair dos Santos, bibliotecário do Banco de Dados da Folha, responsável pela aplicação técnica do projeto com a Assetway. As 100 mil pastas viraram 80 mil, com exclusão de materiais de baixa qualidade, junção de arquivos e reorganização de categorias.

Entre as informações colhidas pelos robôs do Google e Assetway, estão carimbos com o número do negativo da foto, nomes de fotógrafos, data de realização e de publicação da imagem, assunto, outras informações manuscritas e até trechos de reportagens colados ao verso das imagens. Essas informações foram transformadas em filtros que podem refinar a busca por itens relacionados.

“É um trabalho de preservação e de difusão da memória do país, não só da memória do jornal”, diz Juliana Laurino, gerente administrativa das Redações e gerente geral da Folhapress e do Banco de Dados.

Mesmo no caso de imagens antigas e com registro precário, a tecnologia aplicada reconheceu objetos nas fotos e os transformou em palavras-chave que facilitam a busca e ajudam a contornar problemas de catalogação que podem ocorrer em décadas de uso dos arquivos.

A reorganização facilita muito a vida de repórteres e editores. Antes do novo sistema, para conseguir imagens mais antigas era preciso recorrer ao Banco de Dados, que preserva, organiza e recupera o acervo fotográfico e das páginas de cada edição publicada desde 19 de fevereiro de 1921, quando nasceu o jornal.

Até 2013, a equipe do Banco de Dados procurava pelas fotografias físicas em andares dos prédios da Folha, onde ficava o acervo, e as emprestava às editorias, que faziam a digitalização e depois devolviam o material. “Era um perigo para a preservação, porque uma foto antiga pode ficar comprometida só de passar por tantas mãos”, diz Santos.

O retorno de várias imagens ao mesmo tempo aumentava a chance de erros de reorganização, e muitas delas se perdiam nas dezenas de milhares de pastas, organizadas em grandes grupos, como “personalidades” e “esporte”, e categorizadas de acordo com o tema específico. “Colocadas em lugares errados, aquelas fotos estavam condenadas ao esquecimento”, afirma Santos.

Para evitar essas perdas, que eventualmente impediam reportagens de serem feitas, o jornal digitalizou o arquivo de fotos, processo que começou em 2013 e terminou em 2016. Isso também evitou perdas por acidentes, como em 2016, quando fortes chuvas derrubaram parte da laje de um andar da Folha e, por pouco, não danificaram parte do acervo.

Assim, o problema da preservação foi resolvido, mas restou o da acessibilidade: as muitas pastas físicas se tornaram muitas pastas digitais, e não havia um sistema inteligente de pesquisa, como há agora.

Colocadas em lugares errados, aquelas fotos estavam condenadas ao esquecimento

Jair dos Santos

Bibliotecário do Banco de Dados da Folha

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.