São Paulo, quarta-feira, 7 de agosto de 1996
Texto Anterior | Próximo Texto | Índice

Programa reconhece caracteres

ESPECIAL PARA A FOLHA

O WorkCenter inclui o programa de reconhecimento óptico de caracteres "TextBridge Professional Edition", da própria Xerox. Esse programa tem por objetivo reconhecer textos em formato de imagem (como os digitalizados).
Programas de OCR tentam percorrer a imagem de documentos reconhecendo caracteres, palavras e figuras e produzindo documentos em formatos aceitos por outros programas, inclusive de edição de texto. Isso fornece uma versão inicial do arquivo lido, que pode ser manipulada e editada normalmente até uma versão satisfatória.
O "TextBridge" pode ler documentos digitalizados de arquivos ou direto do scanner, para vários tipos de scanner, inclusive os compatíveis com o Twain, como o do WorkCenter 250 (com a ressalva do problema de comunicação mencionado no texto acima).
O texto resultante pode ser gravado em vários formatos.
Documentos de vários tipos podem ser reconhecidos, inclusive formatados em múltiplas colunas, de fontes diversas, como máquina de escrever e fotocopiados, e em várias línguas diferentes.
Nos testes, o "TextBridge" desempenhou bem para textos digitalizados em língua portuguesa e inglesa. Testes de reconhecimento apresentaram resultados razoáveis sem treinamento.

Rosane Minghim é PhD em computação pela Universidade de East Anglia (Inglaterra) e é mestre pela Unicamp. É docente do ICMSC-USP e faz pesquisas em computação gráfica, visualização e multimídia.

Texto Anterior: Resolução não é muito alta
Próximo Texto: Máquina inclui fax/telefone
Índice


Clique aqui para deixar comentários e sugestões para o ombudsman.


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.