São Paulo, quarta-feira, 15 de maio de 1996
Texto Anterior | Próximo Texto | Índice

Correção de textos em scanner

* "Tenho um scanner de mesa e pretendo digitalizar textos passando-os para o 'Word for Windows'. O programa que possuo digitaliza o texto para o computador, mas o mesmo vem com erros. O que faço?"
Antonio Maria Denofrio
(Araras, SP)

Resposta
Os programas de reconhecimento óptico de caracteres, ou programas de OCR, nem sempre conseguem reconhecer todas as letras de um texto.
Além disso, a quantidade de erros varia de um programa para outro.
A qualidade dos programas que acompanham os scanners (máquinas para transportar para o computador textos e imagens) também é um fator influenciador, pois como são dados de brinde, alguns dos seus componentes são retirados ou diminuídos em capacidade para servirem como demonstração e não como solução completa.
Para atuar com desempenho adequado, esses programas necessitam de atualização ou compra do produto completo. A qualidade do registro obtido também afeta os resultados.
A resolução utilizada na captura do texto deve ser suficiente para que o programa reconheça com uma alta taxa de acerto.
Para achar a resolução ideal, comece com a mais alta, anote os resultados e vá diminuindo e comparando, até que a relação entre o tamanho do arquivo, que cresce junto com a resolução, e a taxa de acerto fiquem em um patamar aceitável.
O uso de filtros gráficos, que retiram os ruídos do texto, também aumenta a taxa de acerto. O reconhecimento perfeito, apesar de ser um objetivo dos fabricantes, ainda não foi alcançado. A língua em que o programa de OCR trabalhará é outro ponto importante que trabalha integrado ao corretor ortográfico dentro do próprio programa de OCR.
Existem alguns programas que aceitam novos caracteres como possibilidade para fórmulas ou símbolos específicos. E, finalmente, depois de capturar o texto da melhor forma possível, conte com a ajuda do seu editor de textos preferido para a revisão final.

Miguel Angelo de Souza Aguiar é consultor da Price Waterhouse.

Cartas para a coluna Canal Aberto devem ser enviadas, datilografadas, para a Folha, caderno Informática, al. Barão de Limeira, 425, 4º andar, CEP 01202-900, São Paulo - SP. O número do fax é (011) 223-1644. E-mail: informatica@folha.com.br

Texto Anterior: Problemas com placa tipo PCI
Próximo Texto: Markvision aposta no processador Cyrix
Índice


Clique aqui para deixar comentários e sugestões para o ombudsman.


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.