São Paulo, quarta-feira, 4 de maio de 1994
Texto Anterior | Índice

Bom senso chega aos computadores

CLIVE DAVIDSON
DA "NEW SCIENTIST"

Consideremos as sentenças, em inglês, "Time flies like an arrow" (O tempo voa como uma flecha), em que a palavra "flies" significa "voa", e "Fruit flies like a banana" (Moscas-das-frutas gostam de banana), em que "flies" significa "moscas". É evidente que a primeira só pode ser compreendida se for vista como metáfora, enquanto a segunda é uma afirmação de um fato. Qualquer pessoa de bom senso é capaz de analisar corretamente essas sentenças.
Nos últimos 30 anos, porém, sentenças bizarras deste tipo têm se mostrado um dos maiores obstáculos à criação de um computador capaz de compreender a linguagem do dia-a-dia. O problema é que os computadores não têm bom senso –ou pelo menos não tinham. Uma equipe de pesquisadores de Austin, Texas, acredita haver encontrado a chave para se prover os computadores de senso comum.
Seu otimismo é alimentado pelos resultados obtidos do Grande Projeto de Base de Conhecimentos de Senso Comum (Cyc), que após dez anos de trabalhos está se aproximando de sua conclusão. O Cyc começou como parte de um projeto de criação de uma enciclopédia computadorizada, inventado por um dos nomes lendários da informática –Alan Kay. Quando Kay trabalhava no centro de pesquisas da Atari, ele pediu a Douglas Senat, professor consultor de ciência da computação na vizinha Universidade de Stanford, que acrescentasse algo original ao projeto. Lenat sugeriu a "automatização dos espaços brancos". Era sua maneira de dizer computadorização dos conhecimentos que possibilitam a vida cotidiana –por exemplo, saber que alguém não pode estar em dois lugares ao mesmo tempo, ou que um objeto cai se não estiver apoiado em alguma coisa.
Vampiros existem?
Mas a Atari teve problemas financeiros no início dos anos 80, Kay deixou a empresa e Lenat foi persuadido a transferir sua idéia para outro lugar. Ele começou a trabalhar na recém-aberta Microeletronics and Computer Technology Corporation (MCC), uma organização cooperativa de pesquisas e desenvolvimento, que procurava um projeto prestigioso no qual investir. A MCC tem sede em Austin e seus acionistas e associados incluem a Apple Computer, American Express, Microsoft e o Departamento de Defesa dos Estados Unidos.
O Cyc foi planejado desde o início para ser várias ordens de magnitude maior do que os sistemas especializados existentes, que tendem a sofrer panes quando contêm mais de 5.000 a 10.000 regras referentes a uma área específica de conhecimento. Como Lenat reconheceu, não seria possível encontrar um caminho mais curto para se dotar uma máquina de "inteligência"; não havia equações de pensamento artificial esperando para serem descobertas. Eles decidiram representar o conhecimento em "quadros", numa abordagem desenvolvida por Marvin Minsky, um dos pioneiros da inteligência artificial. Os quadros são minibancos de dados que reúnem informações relacionadas entre si de modo estruturado. O nível superior de um quadro contém informações fixas que são sempre verdadeiras, enquanto os níveis inferiores, ou "slots", contêm detalhes de exemplos específicos daquela informação fixa. Voltando a nossas sentenças, o quadro "flies" (substantivo, moscas), por exemplo, conteria a informação fixa de que moscas são insetos e que elas têm asas, enquanto o "slot"contendo informações sobre tipos poderia ser preenchido com "frutas", e o slot "gostam de comer" poderia ser preenchido com "bananas".
Mas em pouco tempo os quadros se mostraram limitados demais para exprimir os conhecimentos "comuns" que o Cyc procurava reunir –coisas como o que significa uma "pessoa", o que quer dizer "hoje". Então Lenat começou a procurar alternativas juntamente com R.V. Guha. Eles combinaram os quadros com uma forma de lógica chamada "cálculo dos predicados de primeira ordem".
Os predicados, quando utilizados em conexão com a lógica, são afirmações referentes a indivíduos ou coisas, e são verdadeiros ou falsos quando aplicados a indivíduos ou coisas específicos. Por exemplo, o predicado "é um inseto voador" é verdadeiro quando aplicado a moscas-das-frutas mas falso quando aplicado ao tempo. O cálculo de predicados utiliza variáveis e quantificadores, como "para todos" e "existe", que permitem que se façam afirmações generalizadas sobre classes de objetos. No caso das moscas-das-frutas, por exemplo, uma das afirmações constantes no banco de dados pode ser que "em todas as moscas-das-frutas existe uma parte de sua anatomia utilizada para voar".
Ao ampliar o cálculo de predicados de primeira ordem e combiná-lo com os quadros e outras técnicas, Lenat e Guha criaram uma linguagem capaz de representar o mundo cotidiano de uma maneira que os computadores são capazes de "entender". Essa linguagem, conhecida como CycL, permite que os conhecimentos do senso comum sejam reunidos como uma coleção de afirmações que são verdadeiras pela negação, e não por definição. As afirmativas geralmente são verdadeiras –por exemplo, em lugar de afirmar que "todas as aves voam" o CycL afirma que as aves são criaturas que "normalmente voam".
O raciocínio, no CycL, é conduzido pela argumentação e não pela lógica estrita. Se uma sentença é dada ao Cyc, ele tentará encontrar argumentos pró e contra as afirmativas feitas naquela sentença, e procurará resolver as dúvidas utilizando critérios como, por exemplo, se elas se baseiam em relacionamentos causais ou se existem evidências favoráveis ao argumento. Já os sistemas baseados na lógica procurariam aplicar valores absolutos de verdade ou falsidade.
Para resolver os problemas de se vasculhar um banco de dados imenso e depois raciocinar rapidamente, o Cyc é organizado de modo um pouco semelhante a uma biblioteca, onde o conhecimento existe nos livros e nos bancos de dados, mas pode ser mais rápido pedir alguns tipos de informações diretamente ao bibliotecário.
O uso de um conceito conhecido como "microteorias" ajuda a manter a massa de conhecimentos contidos no Cyc em alguma espécie de ordem. O CycL trata um conjunto específico de afirmações como uma teoria. Assim, a sentença "O departamento de pessoal de uma grande empresa organiza a contratação de funcionários" seria considerada parte de uma microteoria referente a grandes empresas. Lenat diz que a grande vantagem das microteorias é que elas permitem uma coerência local sem exigir coerência global. As afirmações no interior de uma microteoria precisam ser coerentes, mas elas não precisam ser coerentes com aquelas que fazem parte de outra microteoria. Isto torna o Cyc capaz de manejar um diálogo do tipo deste:
"Quem foi Drácula?"
"Um vampiro".
"Os vampiros existem?"
"Não".
Drácula e vampiros existem numa microteoria relativa a Bram Stoker, mas não numa microteoria científica moderna. Mas é possível "importar" afirmações de uma microteoria para outra. Assim, por exemplo, se Drácula deixasse cair um cálice de vinho, o esperado seria que o cálice se quebrasse.
Foi este método de lidar com a coerência que possibilitou ao Cyc expandir-se para além das fronteiras de qualquer sistema anterior. Hoje o Cyc contém o equivalente a dois milhões de regras. Quase todos esses conhecimentos são expressos em termos de afirmativas que são verdadeiras apenas pela negação, em lugar de pela definição. Incluem milhares de microteorias e muitos modelos de abstrações como o tempo e o espaço, cada uma sob algumas circunstâncias mas não sob outras. Assim, por exemplo, o Cyc sabe que se um pedaço de madeira for retalhado, cada pedaço resultante continua sendo "um pedaço de madeira". Ele também sabe que se uma mesa é retalhada, cada pedaço resultante não é mais uma mesa.
O banco de dados está sendo alimentado com informações fornecidas por equipes de "alimentadores de conhecimentos" que trabalham nos escritórios do Cyc, em instituições acadêmicas e nas empresas associadas à MCC.
O final do projeto chegará quando o Cyc começar a ler e aprender por conta própria. O Cyc já está se afastando da fase em que todos seus conhecimentos são inseridos manualmente por seres humanos e começando a absorver textos lineares, também por "scanning", extraindo novos conhecimentos para incorporar a seu banco de dados.

Tradução de Clara Allain

Texto Anterior: Executivos se enchem de engenhocas
Índice


Clique aqui para deixar comentários e sugestões para o ombudsman.


Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.