|
Próximo Texto | Índice
BIOINFORMÁTICA
Geneticistas de 12 países, entre eles o Brasil, lançam banco de dados com "palavras" ocultas no DNA humano
Mutirão mundial acha 5.155 novos genes
MARCELO LEITE
EDITOR DE CIÊNCIA
O genoma humano está pronto
e acabado, certo? Não, responde
um trabalho publicado hoje na revista científica eletrônica de acesso livre "PLoS Biology" ("Public
Library of Science/Biology",
www.plosbiology.org).
Sob liderança do Japão, um grupo de 158 cientistas de 40 grupos
em 12 países -entre eles o Brasil- encontrou prováveis 5.155
novos genes da espécie, que não
constavam da relação apresentada ao mundo, com muita fanfarra, em fevereiro de 2001.
Não que isso mude alguma coisa na estimativa do número total
de seqüências de DNA que especificam os instrumentos bioquímicos usados na sinfonia da biologia
humana. A conta permanece na
casa dos 30 mil a 40 mil genes,
uma das grandes surpresas do
Projeto Genoma Humano (PGH),
pois se acreditava antes que eles
fossem até mais de 100 mil.
Ocorre que chutar um número
total de genes é fácil; difícil é identificar um a um, apontando sua
seqüência de letras, localização e
estrutura. Com essas informações, cientistas conseguem reduzir a alguns meses, com sorte, o
trabalho de localização de genes
associados com doenças -algo
que antes consumia anos, décadas. Isso para achar os genes, porque tratamentos e curas podem
demorar ainda mais.
Linguagem desconhecida
A tarefa de garimpagem de genes equivale a ler um livro sem espaços separando as palavras escritas numa língua que apenas se
começou a aprender. Análises por
computador permitem chutar
com alguma segurança, mas certeza, mesmo, só se obtém com tediosos testes de laboratório.
Aí entra a capacidade de organização japonesa, aliada a um portentoso financiamento qüinqüenal de US$ 22 milhões. O titular
da verba é Takashi Gojobori, professor de bioinformática do Instituto Nacional de Genética e um
velho conhecido de Sandro José
de Souza, 36, coordenador de biologia computacional da filial paulistana do Instituto Ludwig de
Pesquisa sobre o Câncer.
Assim como o japonês, ele fez
uma parte de sua formação científica nos Estados Unidos, onde se
encontraram pela primeira vez.
Foi Gojobori quem convidou
Souza, como um dos representantes dos principais grupos do
mundo que trabalham com o chamado "transcriptoma".
Como "proteoma" (vocabulário completo de proteínas de um
organismo), "transcriptoma" é
outra seqüela da epidemia genômica que assolou a biologia. Descreve mais uma meta do que uma
realidade: inventariar todos os genes efetivamente usados (transcritos, ou lidos) pelas células do
organismo humano.
O Ludwig de São Paulo entrou
na história porque tem larga experiência com genes transcritos
em células de tumores humanos,
adquirida a partir do projeto Genoma Câncer -um dos tentáculos genômicos projetados pela Fapesp (Fundação de Amparo à
Pesquisa do Estado de São Paulo).
"Estavam também interessados
em nosso conhecimento sobre
"splicing" [processamento] alternativo", conta Souza.
Palavras embaralhadas
Essa foi outra surpresa do PGH
em fevereiro de 2001, associada ao
baixo número de genes: eles são
formados por sílabas, ou módulos
(batizados "éxons"), que podem
ser arranjadas em palavras (proteínas) aparentadas, mas com significados diversos (funções diversas). Ou seja, não vale a regra tradicional de uma proteína para cada gene, pois eles podem ser lidos
(processados) de mais de uma
maneira pela célula.
Imagine agora o problema que é
lidar com todas essas informações
sobre cada gene -seqüência, localização no cromossomo, estrutura, variantes- multiplicadas
por dezenas de milhares. O pesquisador que estiver investigando
genes envolvidos numa certa
doença tem de consultar o que já
foi produzido por colegas do
mundo inteiro em pelo menos
três grandes bancos de dados espalhados pelo globo, cada um
com critérios diversos de anotação de genes.
Segundo Souza, os japoneses tiveram o cuidado de dar ao seu
consórcio a natureza de um "esforço comunitário". Sua meta é
construir um banco de dados genômicos que facilite a vida dos estudiosos de doenças e, se possível,
fixe um padrão internacional de
anotação genômica. Ou seja, uma
maneira uniforme de batizar e caracterizar genes.
O nome de batismo da iniciativa
é um pouco estranho: Consórcio
Internacional H-Invitacional
(www.h-invitational.jp), ou seja,
por convite (e o "H" vem de "humano", genoma humano). Foi
derivado de uma maratona de dez
dias de anotação em Tóquio, no
ano de 2002, para o qual mais de
uma centena de geneticistas e
bioinformatas foram convidados.
Eles se debruçaram sobre 41 mil
trechos de DNA flagrados em células humanas ativas, de vários tecidos. Pouco mais de 21 mil foram
considerados válidos.
Capítulos mapeados
Cada uma dessas seqüências,
que podem ter dezenas de milhares de letras, foi então comparada
com os 3 bilhões de caracteres enfileirados pelo Projeto Genoma
Humano. Uma a uma, foram
anotadas e "mapeadas" (localizadas num trecho de cromossomo).
Ao final, sobraram 5.155 seqüências que não constavam dos
bancos de dados do PGH, os novos candidatos a genes humanos.
Mas ainda há dúvida sobre pelo
menos 1.340 deles, que podem ser
"artefatos" experimentais -seqüências que têm cara de gene,
mas não são reconhecidos como
tal pelas células.
Próximo Texto: Brasil terá encontro internacional Índice
|