Le virus influenza A est connu pour sa constante évolution. Mais à l'intérieur de cette évolution, il faut distinguer deux phénomènes emboîtés : le passage d'un sous-type à un autre, qui se différencient par des variations génotypiques et immunologiques majeures, et un phénomène de dérive génétique à l'intérieur de chaque sous-type, qui n'implique généralement pas avant plusieurs années l'échappement du variant à une immunité acquise. On a en somme l'image d'une évolution par fractures successives, reliées par des paliers en pente douce.
Dans la séquence de l'hémagglutinine et de son gène, on connaît par ailleurs les points chauds de cette évolution : dix-huit codons, dont les mutations significatives sont plus fréquentes que dans le reste de la séquence, comme on l'attend d'une sélection darwinienne, et qui sont déterminants dans la structure des cinq épitopes de la protéine virale. L'étude rétrospective de l'évolution de ces codons a d'ailleurs déjà permis de dégager empiriquement un critère prédictif : parmi les séquences circulantes à un moment donné, celle qui présente le plus de substitutions d'acides aminés sur ces dix-huit sites est statistiquement la plus proche des souches qui émergeront à la saison suivante.
Pour approfondir cette notion, l'équipe américaine s'est intéressée non plus à la classique distance génétique, mais à la « structure » de cette distance : est-elle parcourue « en pente douce », ou s'agit-il, au contraire, d'une fracture ? A partir de quelle accumulation de différences à un palier, passe-t-on au palier suivant ?
Les dix-huit codons ont été analysés dans 560 séquences de virus influenza A, isolés entre 1968 et 2000 aux quatre coins du monde. Pour distinguer les séquences entre elles en fonction de ces codons, il a fallu introduire une métrique : le système utilisé est le plus simple, dit de Hamming, qui consiste à attribuer une valeur de 0 ou 1 à un couple de codons selon qu'ils sont différents ou identiques. La courbe représentant, parmi les séquences analysées, la taille des clusters en fonction de cette distance, est un véritable escalier. Pour une distance 0, chaque séquence est en soi un cluster ; pour une distance 18, toutes les séquences entrent dans un même cluster ; et entre ces extrêmes, on voit apparaître, pour les distances 2, 4 et 6, des paliers à très faible pente, le long desquels la distance augmente sans pratiquement que la taille du cluster augmente. Cette distribution montre que les séquences du virus, en se diversifiant, forment ce que les auteurs comparent à des essaims. Pour une distance 2, par exemple, les 560 séquences se répartissent en 174 essaims.
Des essaims
C'est d'abord la succession de ces essaims dans le temps et l'espace qui a été étudiée. Il apparaît ainsi qu'aucun essaim n'est dominant durant plus de sept ans. Le temps moyen de dominance est de deux à cinq ans. Par ailleurs, l'évolution de chaque essaim n'est pas périodique : il n'y a pas de retour en arrière. Enfin, il est intéressant de constater que, parmi les séquences constituant les clusters dominants, les séquences trouvées en Chine ou à Hong-Kong ont majoritairement été isolées durant la première moitié de la période de dominance.
L'application de ce genre d'analyse à la prédiction du prochain vaccin est évidemment subordonnée à l'existence de corrélations entre évolution génétypique et évolution immunologique des virus. Or, pour le moment, on ne dispose d'aucun modèle pour les décrire. Pour montrer la pertinence de leur analyse, les auteurs ont néanmoins testé un algorithme : en choisissant, lors d'une saison épidémique, la séquence d'apparition la plus récente dans le cluster dominant, on retombe dans 9 cas sur 16 sur le choix effectué par l'OMS d'après des critères immunologiques. Le taux d'erreur ne permet évidemment pas d'utiliser la variabilité des dix-huit codons comme seul critère. On voit néanmoins que ce critère n'est pas dépourvu de signification. Reste à trouver des éléments de corrélation.
En approfondissant la question, les auteurs ont mis en évidence des relations intéressantes entre agrégation des séquences et variation des épitopes. Par exemple, les variations de l'épitope B au sein d'un cluster dominant sont beaucoup plus nombreuses au début qu'à la fin de la période de dominance. Dans le même ordre d'idée, le pic de variation de l'épitope D se situe à mi-chemin de la période de dominance. Plus intéressant encore, chaque saut d'un cluster dominant au suivant est apparemment « dirigé » par un épitope différent. Ainsi, entre les clusters dominants en 1985 et 1987, c'est l'épitope B qui diffère le plus, tandis qu'entre 1987 et 1990 c'est l'épitope A qui prend la relève, comme si l'échappement du virus à l'immunité passait durant quelques saisons par la variation d'un épitope, puis, après « épuisement » des ressources, par un changement d'épitope dominant. On note par ailleurs qu'en deux décennies la variabilité des sites « non épitopiques » a augmenté au sein des clusters dominants successifs, ce qui suggère qu'après avoir testé les différentes configurations avantageuses d'un épitope, puis d'un autre, etc., le virus pourrait se préparer à faire évoluer la position de ses épitopes.
D'une manière générale, la règle est, semble-t-il, que plus la variabilité est importante au sein d'un cluster, plus le saut évolutif subséquent est important. C'est d'ailleurs la tendance de ces dernières années, les écarts entre clusters dominants successifs apparaissant de plus en plus importants - ce qui n'est pas exactement rassurant.
Les principes généraux de l'évolution
Au total, les résultats proposés sont parfaitement compatibles avec les principes généraux de l'évolution : la transformation majeure d'un épitope n'est possible qu'après développement, au sein d'un cluster, d'une dérive suffisamment significative pour que la sélection puisse agir. En revanche, l'utilité de ces résultats pour dégager des critères prédictifs impliquera sans doute, d'une part, un modèle plus fin, reposant sur davantage de données - et, manifestement, appel du pied est fait à l'OMS pour multiplier les séquençages de souches isolées, encore exceptionnels -, d'autre part, des corrélations génotype/immunologie, c'est-à-dire structure/fonction - plus exactement, coévolution structure/fonction. Pour illustrer le degré d'ignorance où l'on est de ces corrélations, les auteurs donnent un exemple : le haut degré de conservation de l'épitope A au sein du cluster dominant en 1985 indique-t-il que la variation de cet épitope était empêchée par la nécessité d'un évitement immunologique ou, au contraire, que cet épitope était alors absolument indifférent d'un point de vue immunologique et n'a subi aucune pression tendant à sa diversification ?
En attendant des applications en termes de prédiction vaccinale, on retiendra surtout l'idée centrale du modèle : l'évolution se produit - et la sélection s'exerce - à l'échelle non seulement des individus, mais aussi des populations relativement homogènes, les « essaims ».
Echelle collective et échelle de l'individu
Les auteurs ont mis en évidence des transitions s'effectuant à l'échelle des populations et corrélées à des caractéristiques concernant elles aussi l'échelle de populations. Cette échelle collective est même qualifiées de « particule élémentaire » de l'évolution. L'échelle de l'individu en est une autre, tout aussi élémentaire : tout dépend du choix de la référence, les lois naturelles étant supposées invariantes d'échelle. L'intégration de l'échelle collective dans les questions d'évolution - autrement dit, l'intégration de l'écologie à la biologie - est en tout cas prometteuse pour mieux comprendre l'évolution, pour consolider des arbres phylogénétiques dont l'instabilité, face à d'infimes variations d'hypothèses, est rarement soulignée, enfin, pour dégager des éléments prédictifs, certainement pas uniquement en matière de vaccination.
J. B. Plotkin et coll. «Proc Natl Acad Sci USA » du 30 avril 2002, vol. 99, 6263-6268.
Pause exceptionnelle de votre newsletter
En cuisine avec le Dr Dominique Dupagne
[VIDÉO] Recette d'été : la chakchouka
Florie Sullerot, présidente de l’Isnar-IMG : « Il y a encore beaucoup de zones de flou dans cette maquette de médecine générale »
Covid : un autre virus et la génétique pourraient expliquer des différences immunitaires, selon une étude publiée dans Nature