ENCODE est l'Encyclopédie des éléments de l'ADN. Encode a été lancée en 2003 pour identifier tous les éléments fonctionnels (bits de travail) du génome humain. Le travail a été effectué par plus de 400 scientifiques dans 32 laboratoires aux États-Unis, au Royaume-Uni, en Espagne, à Singapour et au Japon. Leurs résultats ont été publiés dans 30 articles en libre accès dans trois revues, Nature, Genome Biology et Genome Research. Il s'agit de l'analyse la plus détaillée à ce jour du génome humain.
Voici un compte rendu simplifié de leurs principales conclusions :
- Seulement 1% du génome code pour les protéines. Cela représente environ 21 000 gènes.
- 70 000 séquences codent pour les régions "promotrices". Elles se trouvent en amont des gènes, là où les protéines se lient pour contrôler l'expression des gènes.
- Il existe environ 400 000 régions "enhancer" qui régulent les gènes distants.
- Il existe quatre millions de "commutateurs" de gènes. Ce sont des séquences d'ADN qui contrôlent le moment où les gènes sont activés ou désactivés. Elles sont souvent très éloignées du génome du gène qu'elles contrôlent.
- Environ 80% du génome a une fonction biochimique définie. L'idée que la plus grande partie de l'ADN est de l'"ADN poubelle" est définitivement fausse. "La grande majorité du génome humain ne code pas pour les protéines et, jusqu'à présent, ne semblait pas contenir d'éléments définis de régulation des gènes. La raison pour laquelle l'évolution maintiendrait de grandes quantités d'ADN "inutile" est restée un mystère et semble être un gaspillage. Il s'avère cependant qu'il y a de bonnes raisons de conserver cet ADN. Les résultats du projet ENCODE montrent que la plupart de ces étendues d'ADN abritent des régions qui lient les protéines et les molécules d'ARN, les amenant dans des positions à partir desquelles elles coopèrent les unes avec les autres pour réguler la fonction et le niveau d'expression des gènes codant pour les protéines".
- L'évolution est causée à la fois par des changements dans les gènes qui codent pour les protéines et dans l'ADN qui code pour le contrôle réglementaire.
"L'un des grands défis de la biologie évolutionniste est de comprendre comment les différences de séquence d'ADN entre les espèces déterminent les différences de leurs phénotypes. Le changement évolutif peut se produire à la fois par des modifications des séquences codant pour les protéines et par des modifications de séquences qui modifient la régulation des gènes".
Les méthodes utilisées pour le travail comprenaient :
- Ils ont isolé et séquencé l'ARN transcrit à partir du génome.
- Ils ont identifié les sites de reliure pour environ 120 produits de transcription.
- Ils ont examiné les modèles de modifications chimiques apportées aux histones. Il s'agissait de trouver des régions où l'expression des gènes est stimulée ou supprimée.
- Ils ont fait 1648 expériences sur 147 types de cellules.
Les nouvelles liées à ce travail sont :