Índice geral Tec
Tec
Texto Anterior | Próximo Texto | Índice | Comunicar Erros

Internet Archive já soma 150 bilhões de sites

Ferramenta que "volta no tempo" e mostra versões de páginas como elas eram é o serviço mais popular do portal

Arquivo digital on-line, criado em 1996, reúne também mais de 6 milhões de documentos de texto, áudio e vídeo

Lianne Milton - 21.fev.2012/"The New York Times"
Brewster Kahle, fundador do Internet Archive, manuseia livro no arquivo físico da instituição
Brewster Kahle, fundador do Internet Archive, manuseia livro no arquivo físico da instituição

DE SÃO PAULO

O projeto mais ambicioso e que atrai mais visitantes ao Internet Archive é o Wayback Machine, espécie de radiografia do passado da web. Por meio de robôs, o site varre grande parte das páginas on-line e guarda cópias -24 horas por dia, desde 1996.

Hoje, é possível acessar pouco mais de 150 bilhões de sites antigos. O intuito, diz o fundador Brewster Kahle, é preservar a memória. "A internet é um registro de nosso tempo." Páginas que impedem a varrição por robôs, como o Facebook, não aparecem na ferramenta.

O Wayback Machine é uma das divisões do Internet Archive, que separa seus sistemas de busca por tipo de arquivo. Há textos, vídeos, música ao vivo e, com o TV News, programas jornalísticos da televisão. No total, são 6 milhões de documentos.

Inspirado na biblioteca visual da Universidade Vanderbilt, em Nashville (EUA), o TV News é pioneiro ao disponibilizar jornalísticos de maneira organizada e on-line.

"A Vanderbilt é a avó dos arquivos de TV nos Estados Unidos", diz Kahle. No entanto, o acervo da universidade, gravado desde 1968, possui apenas um sumário na rede. Para assistir ao material é preciso pagar uma taxa para recebê-lo em DVD, pelo correio.

A experiência foi importante para definir legislação em relação a direitos autorais. Em 1972, a rede de TV CBS processou a Vanderbilt e foi derrotada. "Desde então, podemos disponibilizar os vídeos da TV, desde que o acesso seja público", explica John Lynch, diretor da biblioteca.

ANTIGUIDADES

No caso dos livros, estão à disposição somente obras em domínio público segundo as leis americanas -ou seja, volumes com mais de 70 anos. Por meio de convênios com bibliotecas públicas e particulares, o Internet Archive financia a digitalização em troca de acesso às obras.

Desde 2010, outra iniciativa, a DPLA (Biblioteca Digital Pública da América, em inglês), negocia com donos de direitos autorais uma forma de acesso gratuito e on-line a ao menos parte de todas as obras lançadas nos EUA.

"A ideia final é realizar uma aliança de associações privadas e fazer uma biblioteca disponível para todas as pessoas", explicou o historiador Robert Darnton, diretor da biblioteca de Harvard e principal mentor do projeto, em visita à Folha em maio.

O processo de escaneamento de livros é custoso. Primeiro, é analisado o estado de conservação da obra. Em seguida, deve-se escolher o formato do arquivo para, então, começar a digitalização.

Além da complexidade técnica, o custo é o principal empecilho para o aumento do número de bibliotecas digitais no Brasil. "À medida que surgirem softwares gratuitos [de digitalização], a tendência é que haja mais bibliotecas", diz Fernando Modesto, professor do Departamento de Biblioteconomia e Documentação da USP.

Na própria instituição há um centro de escaneamento de obras antigas. A biblioteca Brasiliana surgiu a partir do acervo pessoal do empresário e bibliófilo José Mindlin, morto em 2010. Por meio do site brasiliana.usp.br, já é possível acessar e baixar parte dos livros.

(ALEXANDRE ARAGÃO)

Texto Anterior | Próximo Texto | Índice | Comunicar Erros


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.