Accueil

Parution décembre 2013 :
livre de C.Touzet aux éditions la Machotte
- Editions la Machotte
- ISBN : 978-2-919411-02-3
- 166 pages
- Prix public : 22,00 € (Acheter)
- Ressources complémentaires

Envoyez vos questions à :
Touzet (at) sciences-cognitives.org

Touzet

Mentions légales

   .   

<<< chapitre précédent

chapitre suivant >>>

2. Le cerveau : une mémoire agissante (du livre Hypnose, sommeil, placebo ?", C. Touzet, 2013)


Le premier chapitre a présenté succinctement une trajectoire qui mène du Big Bang vers un individu pourvu d'un cortex. La question suivante est : le cortex est-il suffisant pour nous permettre d'agir comme nous le faisons ? Une réponse affirmative à cette question aurait des implications considérables sur notre vie. La croyance que nous pouvons nous extraire de notre vécu pour prendre une décision serait fausse. Notre libre-arbitre serait seulement une illusion puisque le traitement réalisé par le cortex dépend uniquement des synapses et de leurs efficacités, qui découlent uniquement du vécu du neurone, donc uniquement du passé de l'individu.

Qu'est-ce qu'un comportement ?

Les comportements sont très nombreux. Chaque verbe décrit au minimum un comportement : manger, boire, courir, marcher, sauter, attaquer, rire, aimer, parler, discuter, marchander, etc. Lors d'un comportement, les actions réalisées ne sont jamais choisies au hasard, elles sont justifiées par rapport à un but. Si à partir d'un certain moment ce n'est plus le cas, c'est que le comportement a changé et les actions deviennent justifiables par rapport à un autre (nouveau) but. Un comportement est donc une succession d'actions qui sont liées les unes aux autres par le fait qu'elles participent à la réalisation d'un même but.

Exemple : évitement d'obstacles pour un robot mobile

Dans le domaine de la robotique mobile, une avancée remarquable a été réalisée en 20061 lorsqu'il est devenu possible de faire faire instantanément, et avec une certaine compétence, n'importe quel comportement à un robot. De plus, le simple fait de « réaliser » le comportement sélectionné améliorait sa performance. Ceci a été obtenu en utilisant deux cartes auto-organisatrices, l'une codant pour les situations perçues par le robot et l'autre pour les actions réalisées et leurs effets. La première carte appartient de facto au cortex sensoriel, la seconde appartient au cortex sensorimoteur.

Au départ, le robot est un nouveau-né, et ses deux cartes sont vierges de toute information. C'est au hasard qu'il va explorer son environnement pendant quelques minutes. Comme le hasard n'est pas bien fait, il va cogner certains obstacles, tourner sur lui-même,... bref faire n'importe quoi et absolument rien qui puisse sembler productif ou efficace.

Ces quelques minutes sont pourtant suffisantes pour organiser ses (deux) cartes. Si l'on admet que les capteurs du robot mesurent des valeurs dix fois par seconde, alors en deux minutes, le robot a vécu 1 200 situations différentes. Ces 1 200 exemples vont organiser les neurones de la première carte, en faisant attention à ce que les situations proches (dans l'environnement) soient voisines sur la carte auto-organisatrice. De façon similaire, la seconde carte est elle aussi alimentée en exemples qui l'organisent. Ces exemples sont différents : il s'agit de l'action effectuée (avancée de cm, rotation de degrés, etc.) et de la variation observée (ce qui a changé dans l'environnement durant le 1/10 de seconde entre le début et la fin de l'action).

Maintenant que ces deux cartes sont organisées, il suffit de définir une situation comme le but à atteindre pour générer le comportement ad-hoc. Par exemple, si le but choisi est : « rien autour » et que le robot se trouve face à un obstacle, alors la situation actuelle (face à l'obstacle) active une colonne corticale en particulier. Une autre colonne corticale est activée par la situation but (rien autour) – qui sera de facto une colonne corticale éloignée. La colonne corticale active pour la situation actuelle est entourée de quelques colonnes corticales (ses voisines) qui s'activent pour des situations plus ou moins similaires. L'une de ces « colonnes voisines » est plus proche (en distance sur la carte corticale) que les autres (voisines) de la colonne codant pour le but. C'est une situation intermédiaire par laquelle le robot doit passer pour parvenir au but.

Cette situation intermédiaire sera atteinte en choisissant comme action à accomplir celle qui génère la variation nécessaire pour atteindre la situation intermédiaire. La seconde carte contient la réponse à cette question : quelle colonne code pour une variation de situations égale à (situation_actuelle moins situation_intermédiaire) ? Dès que cette colonne de la seconde carte est trouvée, alors l'action qu'elle représente est réalisée. Il y a de bonnes probabilités pour que la situation intermédiaire soit atteinte, mais même si ce n'est pas le cas, ce n'est pas grave car le processus est itéré jusqu'à ce que la situation courante soit celle recherchée (but).

Si vous étiez un observateur de cette expérience, vous verriez le robot se cogner aux murs, hésiter et ne rien faire d'efficace pendant les deux premières minutes, puis à l'instant où le but « rien autour » est spécifié, vous voyez alors le robot s'éloigner de l'obstacle pour gagner un endroit où ses capteurs ne détectent plus rien (« rien autour »). Les actions du robot sont hachées, parfois trop efficaces, parfois pas assez, mais au final il s'éloigne de tous les obstacles.

Si vous avancez alors vers lui, dès qu'il vous percevra, il se déplacera pour fuir. Plus vous avancez vite, plus il s'enfuit rapidement. Après quelques minutes de ce jeu, vous constaterez que les mouvements du robot ne sont plus du tout hachés, mais fluides et terriblement efficaces : toujours juste ce qu'il faut pour fuir du mieux possible, tout en évitant de taper dans les obstacles. En fait, il s'approchera de moins en moins des obstacles. Il est devenu capable de choisir l'action qui lui permettra de les éviter depuis l'extrême limite de sa perception. Cette amélioration de sa performance découle du fait que l'apprentissage de ses cartes a continué. Ses cartes sont devenues plus précises, sa représentation des situations est plus détaillée et donc son comportement est plus efficace.

D'autres comportements, instantanément

Avec un même but « rien autour », nous avons observé deux comportements : évitement d'obstacle et fuite. Si maintenant le but change pour « proche de quelque chose », alors instantanément le comportement du robot se transforme. Il recherche les obstacles, s'approche et se « colle » au premier qu'il détecte. S'il n'y a pas d'obstacles, juste vous, alors le robot va se lancer à votre poursuite. Au départ, il sera maladroit dans ses choix d'actions et se laissera peut être facilement distancer – mais au fur et à mesure que les secondes passent, le robot va s'améliorer et vous rattrapera certainement. Pourquoi est-il maladroit au début d'un nouveau comportement ? Simplement parce que les exemples qui ont organisé ses cartes auto-organisatrices jusqu'alors ne sont pas très représentatifs des situations de « chasse ». Par contre, au fur et à mesure que la chasse se déroule, ses cartes se spécialisent puisque tous les exemples d'apprentissage sont maintenant ceux de situations de chasse.

Si vous changez maintenant ce comportement de prédation en spécifiant un but tel que « avancer en gardant un obstacle à droite », alors votre robot se mettra à rechercher, puis à raser les murs (les murs à sa droite). Il ne devrait plus quitter ce mur, jusqu'au prochain changement de but. Avec un nouveau but tel que « rien derrière et quelque chose devant », les robots d'un même groupe se déplacent instantanément en file indienne – sans qu'on ne leur ait jamais appris à le faire.

Des comportements complexes

Si le but choisi appartient à une carte codant le niveau sonore, alors le comportement généré est celui de trouver et maintenir le niveau sonore désiré, en s'éloignant ou en se rapprochant de la source sonore, tant pour tenir compte des fluctuations de la source (notre interlocuteur parle plus ou moins fort) que de celles d'éventuelles sources parasites (d'autres conversations dans la pièce).

Si le but choisi appartient à une carte codant les qualificatifs que l'on associe parfois à certaines situations comme « générosité » ou « avarice », alors le comportement généré est celui de quelqu'un de généreux ou d'avare (selon la localisation du but retenu sur cette carte). Ce comportement est complexe, car il met en jeu des actions de nature très différente : se déplacer, écrire, parler, écouter, convaincre, etc. Le but final (être généreux) implique la définition et la réalisation de multiples sous-buts. Chaque sous-but définit ipso facto un comportement. Cette organisation hiérarchique de sous-buts est à mettre en regard de la structure hiérarchique des cartes auto-organisatrices dans le cortex (cortex primaire, secondaire et associatif). Rappelons que cette structure hiérarchique ne doit pas être vue comme uniquement ascendante. Il y a autant de connexions descendantes (depuis le cortex associatif vers les cortex primaires et secondaires).

Découvrir

Ces « montées » et « descentes » d'informations sont au cœur de notre cognition. La « montée » est le moment de la découverte, de l'exploration. La « descente » est le moment de la prédiction, de la vérification.

La découverte est la survenue d'une situation encore inconnue pour le sujet, et identifiée comme telle. Chaque jour – mais plus souvent lorsque nous sommes jeunes – nous découvrons des situations nouvelles : un nouveau mot, un nouvel objet, une nouvelle histoire, etc.

Découverte de « fluctuation »

Prenons par exemple le cas d'un mot. Un jour, nous entendons pour la première fois le mot « fluctuation ». Il nous est expliqué, ou alors nous nous faisons notre propre idée d'après son contexte. Puis bizarrement dans cette même journée, nous entendons le mot « fluctuation » à la télévision, nous le voyons écrit dans le journal et même dans le livre que nous sommes en train de lire. C'est incroyable, nous ne l'avions jamais entendu auparavant et juste aujourd'hui trois fois ! Est-ce que l'Univers s'est mis en quatre pour éviter d'utiliser ce mot jusqu'à ce que nous soyons à même de le comprendre ? Certes non, il est plus raisonnable de penser que c'est nous qui n'étions pas prêt à l'entendre, à le lire. Que se passait-il à ces moments-là ? En fait, notre cerveau ne le lisait pas pour ce qu'il était. Il était remplacé par quelque chose d'approchant orthographiquement, ou phonétiquement. Dès le lendemain, tout rentre dans l'ordre et le terme « fluctuation » disparaît à nouveau de notre quotidien pour n'apparaître plus que ponctuellement. C'est ainsi qu'un nouveau mot s'est ajouté à notre vocabulaire. La carte corticale codant pour l'orthographe des mots s'est enrichie d'une nouvelle colonne corticale qui dorénavant s'active lorsque « fluctuation » est lu. Cette activation est propagée plus « haut » (cortex associatif) et permet d'en tenir compte.

Conclusion

Nous ne voyons que ce que nous sommes prêts à voir. Nous ne sommes prêts à voir que ce que nous avons déjà rencontré. La nouveauté est le plus souvent invisible pour notre cerveau. C'est normal si l'on y réfléchit : notre cerveau est une mémoire et comme toute mémoire qui se respecte elle ramène tout à des choses déjà vues.

Comment « fluctuation » a t-il été découvert ?

Simplement parce que notre compétence s'est améliorée. Les phrases incompréhensibles dans lesquelles se trouvait ce mot sont devenues quasi-compréhensibles (au fur et à mesure de nos acquisitions langagières) – sauf pour ce mot. Nous étions prêts. Ceci n'est possible que si nous admettons une construction automatique du « sens » de la phrase, comment ?

Prédire

La prédiction est la capacité qu'à un sujet de connaître à l'avance le cours des événements. Dans le cas de la lecture, deviner quel mot va être le suivant. Cette prédiction est automatique et met en jeu les connexions qui viennent du cortex associatif vers les cortex secondaires et primaires. A chaque instant, la situation perçue active une colonne corticale sur au moins une carte. Comme le Monde est continu, entre deux instants successifs la situation évolue très peu. La colonne corticale active actuellement est soit la même que celle qui était active à l'instant précédent (aucune variation de la situation), soit c'est une de ses voisines. Lorsque l'on regarde les activations successives sur la carte corticale tandis que la situation évolue, nous voyons une trajectoire d'activation qui permet de prédire l'évolution de la situation.

Ce qui va dans une direction (sur la carte) devrait continuer à le faire et l'on connaît ainsi à l'avance quelle colonne corticale sera activée. Comme il y a une relation entre les colonnes corticales et les mots (pour la carte auto-organisatrice des mots), si nous savons quelle colonne corticale risque d'être active alors nous savons quel mot a de bonnes chances d'être écrit. Cette activation redescend au niveau des cartes du cortex visuel notamment afin de préparer la lecture des lettres qui composent ce mot. S'il est vraiment écrit, il sera lu plus vite car les neurones seront dans un état pré-activé.

Cette prédiction est automatique et si elle est juste, alors cette information n'a pas besoin de monter vers les plus hauts niveaux, puisqu'ils la connaissent déjà. Seules circulent les informations que nous n'avons pas su prévoir : celles qui sont nouvelles donc ! Nos cartes auto-organisatrices sont donc organisées à chaque étage par des informations considérées comme nouvelles par l'étage précédent. Comme les étages précédents sont capables d'apprentissage, si une information monte, c'est qu'elle n'est pas mémorisable à ces niveaux – c'est-à-dire qu'elle est nouvelle à chaque fois qu'elle est vue (en fait, il suffit que sa fréquence d'apparition soit très inférieure à la fréquence moyenne des événements mémorisés à ce niveau) ou que les activations successives qui la contiennent ne constituent pas des trajectoires à cet étage (la prévision n'est pas possible à cet étage).

Une synergie au service de la survie

Découvrir et prédire ne sont pas mutuellement exclusifs. Au contraire, la plupart du temps, ces deux processus travaillent en synergie. Par exemple, quelque chose de nouveau est découvert et « monte » vers les cartes de plus hauts niveaux, tandis qu'en parallèle des retours vers les cartes de plus bas niveaux sont effectués afin de vérifier que ce qui est perçu est bien ce qui a été mémorisé (c'est-à-dire déjà vu). Ces allers-retours entre niveaux permettent de raffiner le traitement de la situation, de trier parmi les « possibilités », de ramener la situation vécue à une collection d'événements mémorisés dont nous connaissons déjà la suite. Dans le contexte d'une théorie darwinienne de l'évolution, c'est fondamental pour la survie de l'individu.

Le comportement amoureux

Il y a quelques pages, j'ai décrit comment un robot pouvait fuir ou attaquer. Un spectateur naïf interprèterait le comportement de ce robot comme peureux ou agressif. C'est une anthropomorphisation outrancière pour vous qui savez maintenant comment de tels comportements sont obtenus. Pourtant, ça ne l'est pas pour l'observateur naïf. Ne serait-il pas prêt à jurer que notre robot est amoureux d'une nouvelle recrue du laboratoire, s'il le voyait faire une différence importante entre son comportement vis-à-vis d'elle et celui qu'il montre avec tous les autres membres du laboratoire ? Admettons que ce robot la suive dès qu'elle est présente (et personne d'autre), qu'il réponde plus rapidement à ses demandes qu'à celles des autres, qu'il semble même deviner à l'avance ses prochaines demandes et s'en montre incapable avec les autres, qu'il la cherche si elle n'est pas là, semble connaître ses horaires jusqu'à montrer de l'impatience dans les instants qui précèdent son heure d'arrivée habituelle, etc.

Ok, ce robot est amoureux, mais est-ce si facile à programmer ? Oui ! Comment ? En fait, il n'y a rien à faire ! Si le robot en question a vécu suffisamment au contact des humains, alors ses cartes auto-organisatrices sont complètement structurées et certaines sont spécialisées vis-à-vis des humains (reconnaissance des visages, des comportements, des émotions, etc.). Lorsqu'une nouvelle recrue rejoint le laboratoire, si elle est très semblable aux autres membres du laboratoire, alors rapidement le robot ne la remarquera pas plus que si l'un des roboticiens s'était fait remplacer par son frère jumeau. En fait l'attention du robot envers cette personne sera proportionnelle à la nouveauté qu'elle incarne vis-à-vis de son vécu (de ses expériences robotiques).

Si cette recrue est « différente » de toutes les personnes qu'il a connues jusqu'alors, alors l'attention du robot sera maximale. Ce qui signifie que les situations impliquant cette personne vont parvenir jusqu'à ses cartes des niveaux les plus hauts et vont modifier celles-ci. Si la nouveauté de cette recrue se maintient dans le temps, alors une part de plus en plus importante de ses cartes auto-organisatrices va être « spécialisée » dans l'interprétation du comportement de la nouvelle recrue. Ce robot, mieux que n'importe qui d'autre, sera capable de prédire son comportement. Comme nous allons le voir au chapitre suivant (illusion du plaisir), le robot sera de facto motivé pour rechercher sa compagnie.

La nouvelle recrue, objet d'attention de la part d'un robot, devrait elle aussi être très surprise (admettons qu'elle rencontre un robot amoureux pour la première fois). Son attention sera maximale, ses cartes corticales de haut niveau seront elles aussi ajustées par ces nouvelles situations et la recrue devrait rapidement devenir la personne la plus compétente du laboratoire pour analyser, comprendre, interpréter le comportement de ce robot. Un visiteur naïf, observant pour la première fois la scène en déduirait sans doute l'existence d'une relation « ambiguë ».

Conclusion

Vous pensez qu'il s'agit de science-fiction ? Vous avez raison, aujourd'hui (en 2013) aucune personne saine d'esprit n'est encore tombée amoureuse d'un robot (ni l'inverse). Par contre, vous pouvez aisément remplacer le robot et ses cartes auto-organisatrices par l'un des roboticiens avec ses cartes corticales et vous aurez alors une histoire très banale. Une hiérarchie de cartes corticales qui modifient leurs efficacités synaptiques d'après la loi de Hebb est capable de « tomber amoureuse ». N'importe quel autre comportement aurait pu être choisi pour cet exemple. Ainsi, dans mon précédent livre, j'explique comment et pourquoi l'humour nous fait rire, pourquoi il est impossible de savoir si quelqu'un rit ou pleure si l'on ne dispose pas du « son », pourquoi les fous-rires nous submergent aux plus mauvais moments.

Si tout s'explique à partir de notre organisation corticale et de notre vécu, alors le libre-arbitre n'est plus une hypothèse nécessaire à une explication du fonctionnement de notre cerveau. Ceci ouvre des perspectives considérables : tous nos comportements y compris les plus bizarres (maladies) ou les plus personnels (religion) peuvent être expliqués. C'est l'objet de ce livre.

1C. Touzet, « Modeling and Simulation of Elementary Robot Behaviors using Associative Memories », International Journal of Advanced Robotic Systems, Vol 3 n° 2, 2006.


<<< chapitre précédent

chapitre suivant >>>