|
Próximo Texto | Índice
TECNOLOGIA
Sistema criado por pesquisador da USP, com precisão de 90% a 95%, tem redes neurais artificiais como base
Computador reconhece o dono pela voz
SALVADOR NOGUEIRA
FREE-LANCE PARA A FOLHA
Usando um sistema inspirado
no funcionamento dos neurônios, um pesquisador da Escola
Politécnica da Universidade de
São Paulo deu a um computador
a capacidade de reconhecer seu
dono a partir da voz.
Baseado em um modelo de redes neurais artificiais (programa
que faz com que a máquina processe informações simulando o
comportamento de milhares de
neurônios), o sistema consegue
identificar o locutor a partir de
qualquer palavra que ele diga.
"A partir de qualquer som é
possível que ele reconheça o locutor", diz Roberto Amilton Bernardes Sória, autor da pesquisa, que
se tornou sua tese de mestrado.
O grande segredo do sistema,
segundo o engenheiro, foi a criação de uma correlação de coeficientes (em bom português, fórmula aplicada ao computador para que ele interprete a informação
sonora) que resumiu a voz a um
conjunto pequeno de informações. Pequeno, porém mais do
que suficiente para distinguir as
nuances que tornam a voz de cada
pessoa diferente de todas.
"O aparelho fonador é único para cada locutor. É como uma digital", diz. "A fala produz reverberações no aparelho que estão em
frequências além das audíveis."
A voz produziria frequências de
até 20 kHz (milhares de Hertz),
mas somente 4 kHz fariam parte
do que o sistema auditivo humano é capaz de detectar facilmente.
"O sistema utiliza justamente as
frequências mais altas, que os mímicos não conseguem reproduzir", afirma Sória. Por conta dessa
detecção de altas frequências,
também não existe dificuldade
para que o computador reconheça o locutor, rouco ou gripado.
Acertos e erros
Embora tenha uma taxa de
acerto no reconhecimento que vai
de 90% a 95%, o sistema ainda
não é robusto o suficiente para o
mercado, diz seu criador. "Para
aplicações comerciais, é preciso
de taxas de acerto de 98%."
Além disso, ainda há como burlar o sistema, mesmo não sendo o
Tom Cavalcante. "Uma gravação
em CD, que possui todas as frequências da voz, seria capaz de
enganar o computador."
Um meio de contornar o problema, segundo Sória, seria associar o reconhecimento do locutor
ao do conteúdo da fala. Assim, o
computador poderia pedir ao
usuário que dissesse uma palavra
específica, evitando que gravações enganassem o sistema.
De acordo com Sória, o mesmo
sistema de reconhecimento que
ele usa para identificar o locutor
poderia ser adaptado para reconhecer o conteúdo da fala, mas ele
diz que o trabalho não está sendo
conduzido nesse sentido.
O objetivo é desenvolver parcerias, no âmbito de pesquisa, entre
a USP e outras universidades, para aprimorar e tornar pública a
tecnologia. "A idéia seria criar um
pacote de ferramentas, com código aberto [sem restrições para
que qualquer um modifique a
programação", para que a tecnologia fosse mais desenvolvida."
"Não faça isso, Dave."
O novo estudo oferece mais um
"insight" no desenvolvimento de
sistemas tão complexos quanto o
HAL-9000, de "2001: Uma Odisséia no Espaço" -que, se permanecem como obra de ficção, tornam-se mais plausíveis a cada dia.
"Os investimentos em redes
neurais estão dando muitos resultados", afirma Sória. Ele cita estudos japoneses em que a máquina,
a partir de eletrodos, conseguia
interpretar até mesmo pensamentos dos usuários. "A pessoa
pensava em mover a bolinha na
tela do computador para cima, e
ela se movia", relata o engenheiro.
Ainda assim, as atuais redes
neurais artificiais são capazes de
simular apenas alguns milhares
de neurônios. Um cérebro humano tem bilhões dessas células.
Por outro lado, reconhecer o astronauta David Bowman por sua
voz e pedir para não ser desligado,
como HAL foi capaz de fazer, seguramente já é uma realidade.
Próximo Texto: Panorâmica - Energia: Inpe traz especialistas para discutir possibilidades de fusão nuclear controlada Índice
|