São Paulo, quarta-feira, 10 de setembro de 1997
Texto Anterior | Próximo Texto | Índice

Programas reconhecem textos

FREE-LANCE PARA A FOLHA

O scanner pode ser uma ferramenta muito útil quando se quer converter grandes arquivos de papel em dados digitais fáceis de armazenar e manejar no micro, sem ter de digitar tudo manualmente.
Entretanto, quando o scanner importa uma página de texto, ela é considerada uma imagem. Isso, porque o computador não identifica tipos e letras que a compõem.
A leitura então é feita pelos softwares de reconhecimento óptico de caracteres ou OCR.
Esses programas analisam os dados captados e discriminam seus pixels, comparando-os com um banco de fontes na sua memória, para descobrir cada letra do texto.
Assim que o texto é reconhecido pelo computador, dá para editá-lo, realizando as modificações no editor de textos.
Mas, apesar de a tecnologia OCR ser relativamente precisa, ainda existe uma margem de erro dos programas, que confundem letras, hífens, acentuações e formatações específicas.
A maioria dos scanners do mercado já vem com programas de OCR, geralmente versões com recursos limitados, como o "OmniPage LE", que vem com os equipamentos da Agfa, Hewlett-Packard e Nikon, ou o "TextBridge", da Xerox, que acompanha os da Apple, Epson e Videocompo.
O programa completo da Caere, "OmniPage Pro 7.0" para "Windows 95", incorpora não só reconhecimento de texto sensível ao contexto da língua, mas também tipos e estilos de letra, parágrafos, colunas e gráficos, permitindo escolher que elementos do original serão retidos na versão digital.
Com o "OmniPage Pro", o usuário pode converter documentos digitalizados em arquivos para processadores de textos, planilhas ou mesmo em "HTML", como páginas da Internet.
A Xerox está lançando o pacote "Pagis Pro", que tem várias funções de gerenciamento de scanner integradas no "Windows 95". Permite ver amostras prévias miniaturizadas de arquivos digitalizados, clicar e arrastá-los para os programas aplicativos.
O "Pagis Pro" traz embutido o soft de OCR "TextBridge", que recompõe o conteúdo do documento original com a mesma formatação e aprende com seus erros, aperfeiçoando o reconhecimento dos próximos. Também vem com um editor de páginas para Internet, o "HoTMetaL Light", para transformar páginas de papel em hipertextos na rede.

Texto Anterior: Conheça opções para fotos caseiras
Próximo Texto: GLOSSÁRIO
Índice


Clique aqui para deixar comentários e sugestões para o ombudsman.


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.