Nivel: pelín avanzado

Hace algunas semanas tuve la oportunidad de preparar un seminario sobre este proyecto, y después de leer varios papers sobre el tema, he querido traer a tres14 algunos datos que este mastodóntico consorcio, que ha aglutinado desde 2007 a cientos de investigadores de todo el globo [1] , ha arrojado sobre nuestro genoma. Estoy hablando de ENCODE (ENCyclopedia Of Dna Elements):


Se han mapeado no sólo las regiones del genoma que codifican para proteínas, sino también todas aquellas regiones que se transcriben a RNA no codificantes, sitios de unión de factores de transcripción, o sitios de modificaciones químicas (metilaciones sobre todo) tanto a nivel de DNA como a nivel de las proteínas histonas en las que se encuentra engarzado en los cromosomas. Regiones de cuyo funcionamiento y organización sabíamos poco o nada. ¿El objetivo? Caracterizar todos los elementos funcionales encriptados por nuestro genoma, es decir, todos aquellos elementos que codifican para un producto (RNA o proteínas) o bien que guardan una estructura específica y reproducible (como la heterocromatina).

Haciendo números:
  • 20687 genes codificantes para proteínas
  • ...constituyendo sólo el 3% (2.94%) de nuestro genoma!
  • 11224 pseudogenes: secuencias originadas a partir de un gen activo pero que ya no tienen actividad
  • 80.4% de nuestro genoma cubierto por al menos un "elemento funcional" caracterizado... lo cual significa que a esta enorme proporción del genoma humano, que hasta ahora considerábamos literalmente "basura" (junk DNA) se le ha podido asignar al menos una función bioquímica!


Se ha visto, por ejemplo, que los patrones de modificación química de las histonas varían mucho a lo largo del genoma, algo coherente con cambios en la actividad transcripcional diferente entre unas regiones y otras. De hecho, se han tabulado potenciales funciones asignadas a cada modificación química concreta, pongamos, una acetilación o metilación en una región específica de una histona tipo H3.

Se han descubierto también cientos de interacciones entre regiones muy separadas en el cromosoma, incluso distantes por cientos de pares de bases. Suma y sigue de regiones que, sin codificar para un producto concreto, sí son cruciales en la regulación de la expresión de nuestros genes. De hecho, parece que la regulación es más importante que los propios genes, o al menos tiene más espacio dedicado en el genoma. Esto dibuja una maraña de fibras de DNA interconectadas entre sí en los cromosomas, formando una red, y además específica para unos tipos celulares y otros.

El proyecto, apoyado en otros de menor envergadura, también hace sus pinitos en el estudio de las variantes genómicas asociadas con enfermedades humanas. Se ha descubierto que a menudo las minúsculas variaciones (SNPs, single nucleotide polimorphisms) responsables de estas enfermedades no caen en las regiones codificantes sino precisamente fuera, en esos rincones de nuestro genoma de los que no sabíamos casi nada, y es ahí donde ENCODE entra en el juego. El hito aquí es ser capaces de asignar cada variante posible del genoma a su impacto en la salud humana, dando una nueva dimensión al estudio de las enfermedades con base genética, cáncer, enfermedades raras...


Hace cosa de una década el Proyecto Genoma Humano (HGP, Human Genome Project) escribió la secuencia de un genoma humano 'tipo' en 3000 millones de pares de bases. Varios libros escritos con cuatro letras: G, T, C, A. El pasado otoño, el consorcio ENCODE lanzaba simultáneamente unas 30 publicaciones para dar a conocer las conclusiones de este estudio, que ha conseguido traducir los millones de letras de nuestro genoma en funciones biológicas. Pero hay mucho por descubrir todavía. The best is yet to come!


Referencias:

ResearchBlogging.org
 The ENCODE Project Consortium (2012). An integrated encyclopedia of DNA elements in the human genome Nature, 489 (7414), 57-74 DOI: 10.1038/nature11247

The ENCODE Project Consortium (2011). A User's Guide to the Encyclopedia of DNA Elements (ENCODE) PLoS Biology, 9 (4) DOI: 10.1371/journal.pbio.1001046
 
- - - - - - - - - - - - - - -  
[1] Entre ellos el Centro Nacional de Investigaciones Oncológicas (CNIO) de Madrid, o el Centro de Regulación Genómica (CRG) de Barcelona. Lo digo por aquello de la "marca España"...