DES CHERCHEURS du centre de neurobiologie de l’université de Columbia (New York) viennent de caractériser une partie des mécanismes cellulaires associés à l’apprentissage par renforcement. Ce processus cognitif, au cours duquel un stimulus visuel est peu à peu associé à une valeur positive ou négative, met en jeu deux populations de neurones de l’amygdale. Une première population de neurones est spécifiquement activée par les stimulus visuels de valeur positive (i.e. associés à une récompense) ; la seconde population s’active en réponse aux stimulus de valeur négative (i.e. associés à une punition).
Ces résultats ont été obtenus dans le modèle du singe. Au cours de la première phase de leur étude, Paton et coll. ont présenté une série d’images abstraites aux animaux. Chacune des images était associée soit à une récompense (de l’eau sucrée), soit à une punition (jet d’air dans la figure). Après plusieurs présentations de la série d’images, les singes savaient quelles images étaient associées à la récompense : ils commençaient à aspirer le liquide avant même que la boisson sucrée ne soit distribuée. De même, dès qu’ils voyaient une image associée à la projection d’un jet d’air, les singes fermaient les yeux.
Les chercheurs ont alors soudainement inversé la « valeur » des images : celles qui étaient précédemment associées à une récompense ont été associées à la punition, et inversement. Peu à peu, les singes ont réappris à prévoir ce qui allait se passer en fonction de l’image qu’on leur présentait.
Tout au long de cette étude comportementale, les chercheurs ont enregistré l’activité individuelle de près de 200 neurones de l’amygdale, structure cérébrale connue pour jouer un rôle central dans l’apprentissage.
Lors de la première partie de l’étude, Paton et coll. ont noté que les images de valeur positive n’activent pas les mêmes neurones que celles associées à une valeur négative. Néanmoins, les deux populations de neurones ne sont pas regroupées dans des régions distinctes de l’amygdale.
Lorsque la valeur des images est inversée, l’activité des neurones change progressivement : en réponse à une image qui était au départ associée à une récompense, l’inversion de valeur provoque une diminution progressive de l’activité des neurones qui répondent aux stimulus positifs et une augmentation concomitante de celle des neurones associés aux valeurs négatives.
Le moment où la réponse nerveuse est totalement inversée par comparaison avec celle mesurée au début de l’étude précède très légèrement le moment où les singes montrent, par leur comportement, qu’ils ont appris les nouvelles valeurs des images.
L’ensemble de ces observations suggère que l’apprentissage par renforcement implique deux populations distinctes de neurones.
Paton JJ et coll., « Nature » du 16 février 2006, pp. 865-870.
Pause exceptionnelle de votre newsletter
En cuisine avec le Dr Dominique Dupagne
[VIDÉO] Recette d'été : la chakchouka
Florie Sullerot, présidente de l’Isnar-IMG : « Il y a encore beaucoup de zones de flou dans cette maquette de médecine générale »
Covid : un autre virus et la génétique pourraient expliquer des différences immunitaires, selon une étude publiée dans Nature