L'analyse des séquences

L'analyse des séquences en biologie moléculaire consiste à identifier la séquence des nucléotides dans un acide nucléique, ou des acides aminés dans un peptide ou une protéine. Une fois qu'un échantillon a été obtenu, les séquences d'ADN peuvent être produites automatiquement par une machine et le résultat affiché sur un ordinateur. L'interprétation de ces résultats est toujours une tâche pour l'homme.

Les informations issues de l'analyse des séquences sont utilisées dans de nombreux domaines de la biologie. Elle fournit des informations sur les relations entre les organismes individuels ou entre des groupes d'organismes. Elle montre à quel point ils sont étroitement liés.

Séquence de paires de bases de l'ADN

Une séquence d'ADN est la séquence de nucléotides dans une molécule d'ADN. Elle est écrite comme une succession de lettres représentant la structure primaire d'une molécule ou d'un brin d'ADN. Si elle est fonctionnelle, une telle séquence porte des informations sur la séquence des acides aminés dans une molécule de protéine. Les lettres possibles sont A, C, G et T, qui représentent les quatre bases nucléotidiques d'un brin d'ADN - adénine, cytosine, guanine, thymine. Les séquences sont imprimées l'une à côté de l'autre, sans lacunes, comme dans la séquence AAAGTCTGAC.

L'étude de l'ARN et des protéines est plus complexe. La structure globale de l'ADN est simple et prévisible (double hélice). L'étude de l'ARN et des protéines doit inclure l'étude de leur structure tridimensionnelle, qui est variée et qui influence leur fonctionnement. Dans une certaine mesure, cette étude peut être assistée par ordinateur, mais elle doit être vérifiée dans chaque cas.

Les informations sur les séquences sont conservées dans des bases de données. Depuis le développement de la production rapide de séquences de gènes et de protéines au cours des années 1990, le taux d'ajout de nouvelles séquences dans les bases de données ne cesse d'augmenter.

Score

Une analyse complète du génome a été effectuée sur plus de 800 espèces et souches. Le travail est effectué par une machine, le séquenceur d'ADN, qui analyse les signaux lumineux des fluorochromes fixés aux nucléotides. Ce type de travail devient progressivement moins coûteux.

"Il y a actuellement [2009] plus de 90 espèces de vertébrés dont les séquences du génome entier sont terminées, en cours ou en phase de planification avancée.

Les totaux approximatifs

En décembre 2012, une analyse complète du génome a été réalisée sur environ 800 à 900 espèces et souches d'espèces vivantes. Les chiffres sont approximatifs et évoluent.

  • Animaux : 111 espèces
  • Les plantes : 53 espèces
  • Les champignons : 81 espèces
  • Protistes : 50 espèces
  • Archaea : 139 espèces et souches
  • Bactéries : ~4/500 espèces et souches

Séquence d'ADN humain

Le génome humain est stocké sur 23 paires de chromosomes dans le noyau de la cellule et dans le petit ADN mitochondrial. On en sait aujourd'hui beaucoup sur les séquences d'ADN qui se trouvent sur nos chromosomes. On sait maintenant en partie ce que fait réellement l'ADN. L'application de ces connaissances dans la pratique ne fait que commencer.

Le projet du génome humain (HGP) a produit une séquence de référence qui est utilisée dans le monde entier en biologie et en médecine. Nature a publié le rapport du projet financé par les pouvoirs publics, et Science a publié l'article de Celera. Ces documents décrivent comment le projet de séquence a été produit et donnent une analyse de la séquence. Des projets améliorés ont été annoncés en 2003 et 2005, complétant à ≈92% de la séquence.

Le dernier projet ENCODE étudie la manière dont les gènes sont contrôlés.

Travail de police scientifique

Il n'est pas nécessaire de disposer de séquences entières du génome pour les travaux de police scientifique, comme l'identification d'un criminel à partir de traces d'ADN laissées sur une scène de crime, ou pour les affaires de paternité. À l'heure actuelle, le séquençage du génome entier est encore très coûteux, mais heureusement, des méthodes plus simples et moins coûteuses sont disponibles.

L'idée de base est d'examiner certains loci (lieux) du génome qui sont très variables d'une personne à l'autre. Environ 10 à 15 de ces loci sont nécessaires pour une correspondance, et les détails juridiques diffèrent d'un pays à l'autre. Une correspondance entre un échantillon et un individu suspect rend extrêmement probable que l'individu soit la source de l'échantillon. Cette preuve constituerait alors la base de l'accusation pour un crime. Une analyse similaire montrerait qu'un homme est très probablement le père d'un enfant. C'est vraiment une façon moderne de faire ce qui a été fait avec les groupes sanguins avant que les détails de l'ADN puissent être analysés. Les méthodes ont été développées principalement par le travail d'Alec Jeffreys.

L'ADN de chaque personne contient deux allèles d'un gène particulier ou "marqueur" : un du père et un de la mère. Les "marqueurs" sont des gènes choisis pour avoir un certain nombre d'allèles différents présents fréquemment dans la population. Le tableau suivant est tiré d'une expérience commerciale de test de paternité par ADN. Il montre comment la relation entre les parents et l'enfant est démontrée à l'aide de cinq marqueurs :

Marqueur d'ADN

Mère

Enfant

Père présumé

D21S11

28, 30

28, 31

29, 31

D7S820

9, 10

10, 11

11, 12

TH01

14, 15

14, 16

15, 16

D13S317

7, 8

7, 9

8, 9

D19S433

14, 16.2

14, 15

15, 17

Les résultats montrent que l'ADN de l'enfant et celui du père présumé correspondent à ces cinq marqueurs. Les résultats complets des tests ont montré cette corrélation sur 16 marqueurs entre l'enfant et l'homme testé. Si une affaire est testée au tribunal, un médecin légiste apportera des preuves sur la probabilité d'obtenir ce résultat par hasard.

Les tests ADN aux États-Unis

Il existe des lois sur le profilage de l'ADN dans les 50 États des États-Unis. Des informations détaillées sur les lois relatives aux bases de données dans chaque État sont disponibles sur le site web de la Conférence nationale des législatures d'État.

Un chimiste des douanes et de la protection des frontières américaines lit un profil ADN pour savoir d'où provient une marchandise.
Un chimiste des douanes et de la protection des frontières américaines lit un profil ADN pour savoir d'où provient une marchandise.

L'ADN ancien

De l'ADN ancien a été récupéré de certaines sources. Le record de survie de l'ADN adapté à l'analyse des séquences est de 700 000 ans. Un squelette de cheval enterré dans le permafrost a fourni aux os un peu d'ADN survivant. La séquence n'était complète qu'à 70 %, mais il suffisait aux chercheurs de dire : "Il ne ressemblerait pas à un cheval tel que nous le connaissons... mais nous nous attendrions à ce que ce soit un cheval à un orteil". A titre de comparaison, les chercheurs ont eu accès aux séquences d'ADN de chevaux modernes, d'ânes et du cheval de Przewalski.

Pages connexes

  • George Church
  • Walter Gilbert
  • John Sulston
  • Fred Sanger
  • ENCODE : l'analyse complète du génome humain
  • Génome humain
  • Génomique complète
  • Bioinformatique

AlegsaOnline.com - 2020 / 2021 - License CC3