São Paulo, domingo, 26 de outubro de 1997
Texto Anterior | Próximo Texto | Índice

Computador falante

IAN GRAYSON

Máquinas que conversam começam a ser produzidas no Reino Unido

No seriado de televisão "cult" "Red Dwarf", um computador chamado Holly ajuda os tripulantes em suas aventuras espaciais. Holly aparece como uma cabeça falante na tela, de onde se comunica com a tripulação por meio de fala e expressões faciais. Os desavisados poderiam até pensar que Holly era uma mulher de verdade. Para quem se confronta com teclado e mouse diariamente, a idéia de se comunicar com um computador que tem aparência de pessoa, que fala e reage como gente, soa como fantasia muito distante. Mas talvez não pertença a um futuro tão distante assim.
Os laboratórios de pesquisa e desenvolvimento da British Telecom (BT), em Suffolk, no Reino Unido, trabalham com cabeças falantes há cerca de dez anos. Durante esse período, suas criações já passaram da fase de imagens lentas e pouco convincentes, que demandavam enorme poder de computação da máquina, para a fase atual, em que constituem retratos espantosamente realistas de pessoas reais, capazes de operar em qualquer computador pessoal de mesa.
As mais recentes cabeças falantes criadas pela BT conseguem adotar os traços faciais e a voz de qualquer pessoa. Elas sorriem, fazem cara feia, balançam a cabeça num gesto de "sim" e até demonstram raiva.
Para o pesquisador da BT Andy Breen, a idéia de um computador que se comunica com o usuário por meio de uma interface que lembra um ser humano é uma perspectiva sedutora. "O que realmente queremos é apresentar uma personalidade, com rosto e voz, que dê ao usuário a sensação de que há alguém falando com ele", disse. "Estamos tentando gerar uma pessoa sintética".
O interesse da BT por pessoas sintéticas começou no início dos anos 80. Naquela época, o desafio era encontrar uma maneira de transmitir imagens de vídeo de boa qualidade pelas linhas telefônicas comuns. Para reduzir a quantidade de informações a serem transmitidas, os pesquisadores tiveram a idéia de enviar apenas uma imagem, seguida por controles que modificavam elementos tais como os movimentos dos lábios e as expressões faciais. Embora tenha sido um sucesso parcial, o rosto resultante era pouco realista, seus movimentos, muito abruptos e desencontrados.
A atual geração de cabeças falantes já avançou muito. Cada uma delas é baseada numa armação tridimensional de arame, que é modificada para se adequar aos traços do rosto de uma pessoa específica. Sobre a armação é superposta a imagem digital do rosto de uma pessoa, criando a ilusão de uma cabeça tridimensional.
Os pesquisadores descobriram que há 13 músculos no rosto humano que, juntos, produzem a maioria das expressões mais comuns. Os modelos das armações de arame foram desenhados para alterar a imagem facial digital da mesma maneira, de modo a produzir diferentes expressões.
Por meio de um teclado, o usuário registra texto que é convertido em palavras faladas pelo software Laureate, da BT, um sofisticado programa de conversão que converte texto em discurso falado realista, com vários diferentes sotaques possíveis.
A cabeça usa 19 diferentes modelos de boca para simular os formatos produzidos durante a fala normal. Cada modelo incorpora posições de lábios, dentes, maxilar e língua. Para isso, é selecionado um modelo ligeiramente diferente de armação de arame para cada som.
Os estágios intermediários entre eles são gerados e depois mostrados sucessivamente, dando a impressão de movimento fluido. O resultado final é semelhante a um filme sendo projetado a mais ou menos dez quadros por segundo.
"O que fazemos não é simplesmente mostrar um desenho animado", diz Breen. "Não é uma coisa feita previamente e depois passada na tela -é algo que está sendo gerado pelo computador em tempo real".
Há algum tempo, um aplicativo desse tipo teria exigido uma workstation de alta potência para funcionar, mas hoje a cabeça falante pode ser ativada num PC de mesa padrão. Mas, à medida que a potência de processamento aumenta, as metas dos criadores do software vêm ficando mais ambiciosas. Hoje eles estão procurando maneiras de criar mundos virtuais inteiros, nos quais as pessoas possam se encontrar e interagir.
"A imagem da pessoa é captada por uma máquina fotográfica, traduzida em dados para computador e depois regenerada dentro de um mundo virtual", explica Breen. Alguns exemplos iniciais dessa tecnologia já podem ser vistos na World Wide Web. A tecnologia de cabeças falantes da BT vai levar esse conceito ainda mais longe, possivelmente até mesmo permitindo que as pessoas usem seus próprios rostos.
Mas para Breen e sua equipe de pesquisadores, o aspecto mais desafiador da tecnologia é a criação de uma pessoa artificial -uma "Holly" -capaz de melhorar a interação usuário/computador.
"Estou centrando meus esforços na tentativa de dar ao computador uma personalidade, com emoções próprias", diz Breen. "Quando converso com o computador, quero ter a sensação de estar falando com uma pessoa de verdade".
Algumas aplicações futuras da tecnologia podem incluir secretárias pessoais eletrônicas que leiam as mensagens de e-mail que o usuário recebe e atendam a seus pedidos, além de guias virtuais que sairiam à cata de informações e depois as apresentariam ao usuário sob forma oral.
Neste exato momento, Holly pode ainda fazer parte do mundo da ficção científica. Mas, se os cientistas da BT tiverem sucesso em seu trabalho, dentro em breve ela poderá estar num computador pertinho de você.

Tradução de Clara Allain.

Texto Anterior: El Niño deste ano deverá ser o mais estudado de todos
Próximo Texto: Físicos buscam a "teoria do campo unificado"
Índice


Clique aqui para deixar comentários e sugestões para o ombudsman.


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.