São Paulo, terça-feira, 20 de abril de 2004

Próximo Texto | Índice

BIOINFORMÁTICA

Geneticistas de 12 países, entre eles o Brasil, lançam banco de dados com "palavras" ocultas no DNA humano

Mutirão mundial acha 5.155 novos genes

MARCELO LEITE
EDITOR DE CIÊNCIA

O genoma humano está pronto e acabado, certo? Não, responde um trabalho publicado hoje na revista científica eletrônica de acesso livre "PLoS Biology" ("Public Library of Science/Biology", www.plosbiology.org).
Sob liderança do Japão, um grupo de 158 cientistas de 40 grupos em 12 países -entre eles o Brasil- encontrou prováveis 5.155 novos genes da espécie, que não constavam da relação apresentada ao mundo, com muita fanfarra, em fevereiro de 2001.
Não que isso mude alguma coisa na estimativa do número total de seqüências de DNA que especificam os instrumentos bioquímicos usados na sinfonia da biologia humana. A conta permanece na casa dos 30 mil a 40 mil genes, uma das grandes surpresas do Projeto Genoma Humano (PGH), pois se acreditava antes que eles fossem até mais de 100 mil.
Ocorre que chutar um número total de genes é fácil; difícil é identificar um a um, apontando sua seqüência de letras, localização e estrutura. Com essas informações, cientistas conseguem reduzir a alguns meses, com sorte, o trabalho de localização de genes associados com doenças -algo que antes consumia anos, décadas. Isso para achar os genes, porque tratamentos e curas podem demorar ainda mais.

Linguagem desconhecida
A tarefa de garimpagem de genes equivale a ler um livro sem espaços separando as palavras escritas numa língua que apenas se começou a aprender. Análises por computador permitem chutar com alguma segurança, mas certeza, mesmo, só se obtém com tediosos testes de laboratório.
Aí entra a capacidade de organização japonesa, aliada a um portentoso financiamento qüinqüenal de US$ 22 milhões. O titular da verba é Takashi Gojobori, professor de bioinformática do Instituto Nacional de Genética e um velho conhecido de Sandro José de Souza, 36, coordenador de biologia computacional da filial paulistana do Instituto Ludwig de Pesquisa sobre o Câncer.
Assim como o japonês, ele fez uma parte de sua formação científica nos Estados Unidos, onde se encontraram pela primeira vez. Foi Gojobori quem convidou Souza, como um dos representantes dos principais grupos do mundo que trabalham com o chamado "transcriptoma".
Como "proteoma" (vocabulário completo de proteínas de um organismo), "transcriptoma" é outra seqüela da epidemia genômica que assolou a biologia. Descreve mais uma meta do que uma realidade: inventariar todos os genes efetivamente usados (transcritos, ou lidos) pelas células do organismo humano.
O Ludwig de São Paulo entrou na história porque tem larga experiência com genes transcritos em células de tumores humanos, adquirida a partir do projeto Genoma Câncer -um dos tentáculos genômicos projetados pela Fapesp (Fundação de Amparo à Pesquisa do Estado de São Paulo).
"Estavam também interessados em nosso conhecimento sobre "splicing" [processamento] alternativo", conta Souza.

Palavras embaralhadas
Essa foi outra surpresa do PGH em fevereiro de 2001, associada ao baixo número de genes: eles são formados por sílabas, ou módulos (batizados "éxons"), que podem ser arranjadas em palavras (proteínas) aparentadas, mas com significados diversos (funções diversas). Ou seja, não vale a regra tradicional de uma proteína para cada gene, pois eles podem ser lidos (processados) de mais de uma maneira pela célula.
Imagine agora o problema que é lidar com todas essas informações sobre cada gene -seqüência, localização no cromossomo, estrutura, variantes- multiplicadas por dezenas de milhares. O pesquisador que estiver investigando genes envolvidos numa certa doença tem de consultar o que já foi produzido por colegas do mundo inteiro em pelo menos três grandes bancos de dados espalhados pelo globo, cada um com critérios diversos de anotação de genes.
Segundo Souza, os japoneses tiveram o cuidado de dar ao seu consórcio a natureza de um "esforço comunitário". Sua meta é construir um banco de dados genômicos que facilite a vida dos estudiosos de doenças e, se possível, fixe um padrão internacional de anotação genômica. Ou seja, uma maneira uniforme de batizar e caracterizar genes.
O nome de batismo da iniciativa é um pouco estranho: Consórcio Internacional H-Invitacional (www.h-invitational.jp), ou seja, por convite (e o "H" vem de "humano", genoma humano). Foi derivado de uma maratona de dez dias de anotação em Tóquio, no ano de 2002, para o qual mais de uma centena de geneticistas e bioinformatas foram convidados.
Eles se debruçaram sobre 41 mil trechos de DNA flagrados em células humanas ativas, de vários tecidos. Pouco mais de 21 mil foram considerados válidos.

Capítulos mapeados
Cada uma dessas seqüências, que podem ter dezenas de milhares de letras, foi então comparada com os 3 bilhões de caracteres enfileirados pelo Projeto Genoma Humano. Uma a uma, foram anotadas e "mapeadas" (localizadas num trecho de cromossomo).
Ao final, sobraram 5.155 seqüências que não constavam dos bancos de dados do PGH, os novos candidatos a genes humanos. Mas ainda há dúvida sobre pelo menos 1.340 deles, que podem ser "artefatos" experimentais -seqüências que têm cara de gene, mas não são reconhecidos como tal pelas células.


Próximo Texto: Brasil terá encontro internacional
Índice



Copyright Empresa Folha da Manhã S/A. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.