L'expertise du Centre national de séquençage d'Evry vient de conduire à l'obtention de la totalité de la séquence de la portion du chromosome 14 humain s'étendant de la région subcentromérique à la région télomérique du bras long de ce chromosome, soit 87 410 661 paires de bases. L'analyse des données brutes obtenues, réalisée, d'une part, par comparaisons avec les données génomiques et protéomiques déjà disponibles sur l'homme et d'autres organismes, et, d'autre part, par analyse informatique, a conduit Jean Weissenbach et ses collaborateurs à annoter pratiquement toutes la séquence obtenue et, ainsi, à identifier l'ensemble des gènes et des pseudogènes compris dans ce bras chromosomique.
Deux régions majeures pour le système immunitaire
Le chromosome 14 est l'un des cinq chromosomes humains acrocentriques (avec le 13, le 15, le 21 et le 22). Ces chromosomes ont la caractéristique de comporter un bras court hétérochromatique contenant essentiellement des gènes codant pour des ARN ribosomaux et un bras long euchromatique sur lequel on trouve pratiquement tous les gènes (si ce n'est leur totalité) codant pour des protéines.
Le bras long du chromosome 14 comporte deux régions, d'environ 1 mégabase chacune, de très grande importance pour le système immunitaire : la première est localisée à proximité du centromère et code pour les récepteurs alpha et delta des lymphocytes T ; la seconde est adjacente au télomère et code pour la chaîne lourde des immunoglobulines. En outre, le chromosome 14 contient plus de 60 gènes dont le dysfonctionnement est associées à des pathologies humaines variées, en particulier à une forme précoce de la maladie d'Alzheimer et à une forme sévère du syndrome de Usher.
Plus de 1 400 gènes
Le travail d'annotation de la séquence du chromosome 14 a conduit à l'identification de 1 443 gènes qui couvrent 43,6 % de la séquence, soit 38 069 mégabases. La densité moyenne en gènes caractérisant le chromosome 14 est équivalente à celle estimée pour le génome complet, soit environ 10 gènes par mégabase. Les exons ne couvrent que 3,3% de la séquences brute et sont en moyenne au nombre de 7 par gène. La longueur moyenne des gènes du chromosomes 14 est de 47,5 kilobases mais 6 gènes ont une taille qui excède 500 kilobases et le plus long gène, NRXN3, mesure 1 691 847 paires de bases. Quant au plus long ARN messager, qui code la protéine SYNE-2 (6 649 acides aminés), il comprend 21 776 bases et 115 exons.
Les gènes identifiés ont été classés en différentes catégories : 1) 506 gènes connus ; 2) 110 nouveaux gènes dont la séquence codante est clairement identifiée ; 3) 11 nouveaux transcrits (des nouveaux gènes dont une séquence codante unique ne peut être clairement définie) ; 4) 223 gènes putatifs ou prédits ; 5) 296 pseudogènes et, enfin, 6) 593 gènes, fragments de gènes ou pseudogènes appartenant aux régions codant pour les récepteurs des lymphocytes T et la chaîne lourde des immunoglobulines.
En 2001, la publication de la quasi-totalité de la séquence brute du génome humain a permis l'obtention d'un nombre considérable d'informations, en particulier au sujet de gènes impliqués dans des pathologies humaines. Cependant, cette séquence brute comportait un certain nombres d'imprécisions et de « trous » qui devaient être comblés afin de permettre l'identification des points d'initiation et de terminaison de la transcription des gènes, la localisation des exons et les signaux d'épissage, celle des éléments de régulation de l'expression génétique ou encore l'analyse du polymorphisme. Au cours des trois dernières années, cette étape complémentaire d'affinement et d'analyse des données initiales a été réalisé sur les chromosomes 20, 21 et 22. On peut aujourd'hui ajouter à cette liste des chromosomes « finis » le chromosome 14.
Cependant, un important travail de caractérisation fonctionnelle des nouveaux gènes identifiés et de validation des gènes putatifs et prédits reste à effectuer.
R. Heilig et coll., « Nature » du 1er janvier 2003 et http://www.genoscope.cns.fr/chr14/
Pause exceptionnelle de votre newsletter
En cuisine avec le Dr Dominique Dupagne
[VIDÉO] Recette d'été : la chakchouka
Florie Sullerot, présidente de l’Isnar-IMG : « Il y a encore beaucoup de zones de flou dans cette maquette de médecine générale »
Covid : un autre virus et la génétique pourraient expliquer des différences immunitaires, selon une étude publiée dans Nature