|
Próximo Texto | Índice
TECNOLOGIA
Sistema de conversão de texto em voz criado na Unicamp pode aperfeiçoar o contato entre homem e máquina
Programa de computador lê em português
SALVADOR NOGUEIRA
DA REPORTAGEM LOCAL
Após mais de 12 anos de trabalho árduo, Aiuruetê finalmente
começou a ganhar fluência na língua portuguesa. Agora, ele já lê
em voz alta com sucesso e está
quase pronto para entrar no mercado de trabalho. Aiuruetê é um
programa de computador.
Desenvolvido a partir da união
de esforços de engenheiros e linguistas da Unicamp (Universidade Estadual de Campinas), trata-se do terceiro protótipo de um
software conversor texto-fala. Ou
seja, ele é capaz de ler um texto
qualquer em voz alta.
Por razões óbvias, cada língua
exige uma base de dados diferente
para que um programa desse tipo
funcione. A pronúncia das palavras muda completamente de um
idioma para outro, exigindo que
cada país desenvolva seus sistemas, voltados para sua língua e
seu vocabulário específicos.
Além disso, mesmo considerando só o português, as letras ganham pronúncias diferentes, dependendo das palavras nas quais
estão inseridas. "O "x" é um dos
casos mais complicados, que pode assumir um som de "sc", "s", "x" e
"z'", diz Fábio Violaro, coordenador do projeto na Faculdade de
Engenharia Elétrica e de Computação da universidade.
Para isso, o programa precisa
trabalhar com unidades fonéticas,
não com as letras do alfabeto. Foi
aí que a participação do pessoal
do Instituto de Estudos da Linguagem foi preciosa. Eles compilaram uma base de 2.500 polifones (as tais unidades de pronúncia), que foi aplicada ao sistema.
Também foi o pessoal da linguística que batizou o programa
de Aiuruetê, que em tupi quer dizer "papagaio verdadeiro". O sistema já é capaz de sintetizar em
som as palavras de praticamente
qualquer texto, mas ainda é deficiente na expressão de emoções. É
nisso que o grupo da Unicamp está concentrado agora, desenvolvendo um módulo de programação capaz de dar entonação mais
natural à voz do computador.
Embora não tenha por objetivo
tornar o programa uma aplicação
comercial, a equipe presta assessoria e forma pessoal para empresas nacionais que possam ter interesse em desenvolver sistemas para o mercado brasileiro.
Segundo Violaro, a pesquisa
não vai só na direção de apurar as
"cordas vocais" da máquina, mas
também seus ouvidos. O grupo
também trabalha no desenvolvimento de sistemas de reconhecimento de voz -ou seja, que permitem que o computador entenda o que o usuário está dizendo.
"Com comandos simples [uma
palavra], a taxa de acerto é de
99%. Com fala contínua, o acerto
gira em torno de 91%, 92%."
As aplicações são variadas. O físico britânico Stephen Hawking,
vítima de esclerose lateral amiotrófica, há anos usa um conversor
de texto em fala sofisticado para
se comunicar. O sistema também
pode ser adaptado para uso em
ensino a distância via computador, pode ajudar deficientes visuais a interagir com a máquina e
realizar diversas tarefas hoje exclusivas de seres humanos. "Infelizmente você pode dispensar um
monte de atendentes por causa
dessas máquinas", diz Violaro.
Próximo Texto: Panorâmica - Espaço: Dano em sonda solar provoca perda de dados Índice
|