Folha de S.Paulo - Tecnologia: Computador reconhece o dono pela voz

São Paulo, sábado, 04 de agosto de 2001

Próximo Texto | Índice

TECNOLOGIA

Sistema criado por pesquisador da USP, com precisão de 90% a 95%, tem redes neurais artificiais como base

Computador reconhece o dono pela voz

SALVADOR NOGUEIRA
FREE-LANCE PARA A FOLHA

Usando um sistema inspirado no funcionamento dos neurônios, um pesquisador da Escola Politécnica da Universidade de São Paulo deu a um computador a capacidade de reconhecer seu dono a partir da voz.
Baseado em um modelo de redes neurais artificiais (programa que faz com que a máquina processe informações simulando o comportamento de milhares de neurônios), o sistema consegue identificar o locutor a partir de qualquer palavra que ele diga.
"A partir de qualquer som é possível que ele reconheça o locutor", diz Roberto Amilton Bernardes Sória, autor da pesquisa, que se tornou sua tese de mestrado.
O grande segredo do sistema, segundo o engenheiro, foi a criação de uma correlação de coeficientes (em bom português, fórmula aplicada ao computador para que ele interprete a informação sonora) que resumiu a voz a um conjunto pequeno de informações. Pequeno, porém mais do que suficiente para distinguir as nuances que tornam a voz de cada pessoa diferente de todas.
"O aparelho fonador é único para cada locutor. É como uma digital", diz. "A fala produz reverberações no aparelho que estão em frequências além das audíveis."
A voz produziria frequências de até 20 kHz (milhares de Hertz), mas somente 4 kHz fariam parte do que o sistema auditivo humano é capaz de detectar facilmente.
"O sistema utiliza justamente as frequências mais altas, que os mímicos não conseguem reproduzir", afirma Sória. Por conta dessa detecção de altas frequências, também não existe dificuldade para que o computador reconheça o locutor, rouco ou gripado.

Acertos e erros
Embora tenha uma taxa de acerto no reconhecimento que vai de 90% a 95%, o sistema ainda não é robusto o suficiente para o mercado, diz seu criador. "Para aplicações comerciais, é preciso de taxas de acerto de 98%."
Além disso, ainda há como burlar o sistema, mesmo não sendo o Tom Cavalcante. "Uma gravação em CD, que possui todas as frequências da voz, seria capaz de enganar o computador."
Um meio de contornar o problema, segundo Sória, seria associar o reconhecimento do locutor ao do conteúdo da fala. Assim, o computador poderia pedir ao usuário que dissesse uma palavra específica, evitando que gravações enganassem o sistema.
De acordo com Sória, o mesmo sistema de reconhecimento que ele usa para identificar o locutor poderia ser adaptado para reconhecer o conteúdo da fala, mas ele diz que o trabalho não está sendo conduzido nesse sentido.
O objetivo é desenvolver parcerias, no âmbito de pesquisa, entre a USP e outras universidades, para aprimorar e tornar pública a tecnologia. "A idéia seria criar um pacote de ferramentas, com código aberto [sem restrições para que qualquer um modifique a programação", para que a tecnologia fosse mais desenvolvida."

"Não faça isso, Dave."
O novo estudo oferece mais um "insight" no desenvolvimento de sistemas tão complexos quanto o HAL-9000, de "2001: Uma Odisséia no Espaço" -que, se permanecem como obra de ficção, tornam-se mais plausíveis a cada dia.
"Os investimentos em redes neurais estão dando muitos resultados", afirma Sória. Ele cita estudos japoneses em que a máquina, a partir de eletrodos, conseguia interpretar até mesmo pensamentos dos usuários. "A pessoa pensava em mover a bolinha na tela do computador para cima, e ela se movia", relata o engenheiro.
Ainda assim, as atuais redes neurais artificiais são capazes de simular apenas alguns milhares de neurônios. Um cérebro humano tem bilhões dessas células.
Por outro lado, reconhecer o astronauta David Bowman por sua voz e pedir para não ser desligado, como HAL foi capaz de fazer, seguramente já é uma realidade.

Próximo Texto: Panorâmica - Energia: Inpe traz especialistas para discutir possibilidades de fusão nuclear controlada
Índice

Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.