SUR LES VINGT-TROIS chromosomes du génome humain, il n'en reste désormais plus que sept à analyser. Le consortium international chargé de l'analyse du génome humain vient, en effet, de finir d'annoter la séquence de deux nouveaux chromosomes, les chromosomes 2 et 4.
A elles deux, ces molécules d'ADN représentent 5 % du génome humain. Avec plus de 250 millions de paires de bases, le chromosome 2 est le deuxième chromosome le plus long du génome humain (le plus long étant le numéro 1, avec 263 millions de paires de bases). Il intrigue particulièrement les scientifiques depuis qu'il a été établi qu'il résulte de la fusion de deux chromosomes ancestraux de taille intermédiaire. Le chromosome 4 mesure, quant à lui, un peu plus de 200 millions de paires de bases et renferme de nombreux gènes impliqués dans le développement de maladies héréditaires telles que la maladie de Huntington, le syndrome de Wolf-Hirschhorn, la maladie polykystique rénale ou encore une forme de dystrophie musculaire.
Hillier et coll. ont obtenu 99,6 % de la séquence euchromatique des deux chromosomes. L'analyse des données brutes les a conduit à identifier 1 346 gènes codant pour des protéines et 1 239 pseudogènes sur le chromosome 2 ainsi que 796 gènes codant pour des protéines et 778 pseudogènes sur le chromosome 4.
Sur le chromosome 2, les chercheurs ont notamment localisé le gène qui code pour la plus longue protéine connue du génome humain. Ce gène compte 280 kilopaires de bases. Il permet la synthèse d'une protéine de 33 000 acides aminés exprimée dans le muscle, la titine.
Un autre gène du chromosome 2 a attiré l'attention des chercheurs : il code pour une protéine qu'on ne retrouve que chez l'homme et le chimpanzé. La fonction de cette protéine reste à élucider, mais des résultats préliminaires indiquent qu'elle est exprimée dans le cerveau et les testicules.
Fusion moléculaire.
L'analyse de la séquence du chromosome 2 a également permis d'en apprendre davantage sur l'événement de fusion moléculaire qui a conduit à sa formation. En 2002, une équipe de Seattle avait réussi à localiser le point de fusion des deux molécules ancestrales à l'origine de ce chromosome. Hillier et coll. ont complété ce travail en identifiant les anciens centromères des chromosomes ancestraux. Ces régions sont caractérisées par la présence de duplications nommées « répétitions alpha satellites » et de duplications segmentaires.
Sur le chromosome 4, Hillier et coll. ont découvert des régions d'une longueur exceptionnelle, entièrement dépourvues de gène. Les chercheurs parlent de « désert génétique ». La fonction de ces régions non codantes est inconnue, mais tout porte à penser qu'elles jouent un rôle important dans la biologie des vertébrés. On les retrouve, en effet, dans le génome de nombreux mammifères et d'oiseaux.
Les séquences complètes et annotées des 16 chromosomes dont l'analyse est achevée peuvent être consultées sur les sites Internet de différentes banques de données comme GenBank (www.ncbi.nih.gov/Genbank).
Hillier et coll., « Nature » du 7 avril 2005, pp. 724-731.
Pause exceptionnelle de votre newsletter
En cuisine avec le Dr Dominique Dupagne
[VIDÉO] Recette d'été : la chakchouka
Florie Sullerot, présidente de l’Isnar-IMG : « Il y a encore beaucoup de zones de flou dans cette maquette de médecine générale »
Covid : un autre virus et la génétique pourraient expliquer des différences immunitaires, selon une étude publiée dans Nature