Automates
Intelligents s'enrichit du logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet aussi
d'accéder à la définition du mot dans une
autre langue.
Pierre-Yves
Oudeyer est ancien élève de l'Ecole Normale
Supérieure, aujourd'hui chercheur au laboratoire
CSL de Sony à Paris.
Il vient de soutenir sa thèse de doctorat "L'auto-organisation
de la parole" au LIP 6
Les très bonnes thèses,
dont on peut pronostiquer que leurs auteurs feront une carrière
scientifique exemplaire, se distinguent des autres car au-delà
d'un exercice obligé, elles ouvrent des perspectives en amont
et en aval du domaine exploré, qui peuvent le cas échéant
conduire à faire évoluer sinon réviser les
paradigmes scientifiques en cours.
C’est ce dernier trait, selon
nous, qui caractérise la thèse de Pierre-Yves Oudeyer,
«L’auto-organisation de la parole », soutenue
le 24 novembre 2003 au Lip6. Elle couronne une liste impressionnante
de publications rendant compte de travaux réalisés
par l’auteur de 1999 à 2003. Il s’agissait, globalement,
d’étudier les origines du langage en utilisant les
outils de l’informatique et de l’intelligence artificielle.
Les expérimentations présentées et analysées
dans la thèse poursuivent et approfondissent ces travaux.
Mais ce domaine a déjà
fait l’objet de plus de 30 ans de recherches, utilisant les
technologies du moment. En quoi « L’auto-organisation
de la parole » se distingue-t-elle de ces travaux précédents,
à part le fait que l’auteur a fait appel aux solutions
les plus récentes offertes par les réseaux neuronaux
et les populations d’agents ?
C’est que Pierre-Yves.Oudeyer
se pose, comme il l’indique clairement au début de
l’ouvrage, non pas la question de l’émergence
des langues à partir d’un univers déjà
bien installé de communications symboliques, mais la question
de l’émergence de la communication par le langage sans
qu'existent déjà des systèmes d'interactions
sociale entre les agents de complexité équivalente
à celle du langage, et possiblement sans que les agents aient
l'envie ou le besoin de communiquer sous cette forme élaborée.
En d’autres termes, il nous place au coeur des phénomènes
évolutifs dits de l’émergence de la parole:
l’interaction entre éléments simples fait apparaître
des formes complexes qui n’existaient pas jusqu’alors.
On peut d'ailleurs estimer qu'en
remontant dans le temps, l'apparition chez les animaux des premières
formes de communication symbolique par postures, gestes ou signaux
sonores relève du même type d'explication. Ceci dit,
le problème de l'origine du langage est un
vaste puzzle auquel la thèse ne s'attaque pas en entier.
Elle s'attaque à l'origine d'un élément essentiel
de ce puzzle : la parole, véhicule, support physique et forme
du langage.
L'émergence
L’ensemble
des mécanismes intéressant l’apparition de la
vie, à partir des premières molécules pré-biotiques,
se trouve concerné par le phénomène de l'émergence.
On peut même aller plus loin et considérer que c’est
l’ensemble des mécanismes intéressant l’apparition
des formes physiques complexes à partir des composants élémentaires
de l’énergie et de la matière qui devrait relever
de ce type d’étude. Pourquoi y-a-t-il un univers plutôt
que rien, et pourquoi cet univers est-il peuplé de telles
formes plutôt que de telles autres ? D'où le vaste
champ d'applications potentielles des hypothèses présentées
dans ce travail de thèse.
Nous sommes en fait au coeur des
mécanismes de la morphogenèse. Pierre-Yves.Oudeyer
n’a pas manqué de rappeler que ces mécanismes
présentent de grandes similitudes dans la nature, qu’il
s’agisse de la formation des cristaux de neige, de l’élaboration
de dessins sur les coquillages ou le pelage des animaux. La vie
artificielle, pour l'essentiel, repose aussi sur de tels mécanismes,
comme l’ont illustré récemment les travaux de
Stephen
Wolfram sur les automates cellulaires.
On admet généralement
que c’est une évolution de type darwinien, sur le mode
mutation/sélection, qui permet d’expliquer l’apparition
des formes complexes. D’abord employée par les biologistes,
l'hypothèse dite aussi néo-darwinienne est de plus
en plus utilisée par les physiciens et par les informaticiens
(utilisant par exemple les algorithmes génétiques).
Sans la rejeter ici , PierreYves Oudyer en montre les limites. Il
reprend ce faisant les objections faites depuis longtemps aux biologistes
évolutionnaires darwinien. Compter sur le mécanisme
de mutation au hasard suivie de sélection ne suffit pas pour
qu’en si peu de temps (600 millions ou 3 milliards d’années
selon ce que l’on adopte comme point de départ de l’évolution
biologique) soient apparues des formes aussi complexes que l’organisme
humain ou les sociétés humaines (pour nous en tenir
à l’homme). Un processus d’exploration au hasard
de l’espace des possibilités, sur cette (courte) durée,
n’aurait sans doute abouti qu’à des formes simples
et hétérogènes.
On sait qu’il s’agit
là de l’argument utilisé par les spiritualistes
pour justifier l’hypothèse d’un élan vital,
ou doigt de Dieu, guidant l’évolution vers un but finalisé
à l’avance. Mais Pierre-Yves Oudeyer fait ici la démonstration,
dans le domaine limité mais totalement pertinent qu’est
l’apparition de la parole, du fait que de simples interactions
entre agents évolutionnaires peuvent permettre de comprendre
l’émergence de formes et procédures nouvelles,
en un temps relativement court Dans ce cas, le mécanisme
de l’évolution darwinienne n’est pas supprimé,
mais s'appuie certainement sur un autre mécanisme, l'auto-organisation,
dont le résultat est de contraindre l’évolution
dans des directions bien définies. Pour le montrer, nous
l’avons dit, il utilise un modèle mathématico-informatique
lui-même relativement simple, qui relève de l’Intelligence
Artificielle évolutionnaire, un système multi-agents
adaptatif. Alain Cardon, dans la modélisation qu’il
propose des mécanismes de la conscience, destinée
à produire une conscience artificielle, fait de même.
Revenons sur cette question importante
des relations éventuelles entre un système d'auto-organisation
et la sélection darwinienne. Pierre-Yves Oudeyer étudie
des solutions faisant appel à l'auto-organisation des systèmes
complexes : l'interaction entre éléments simples fait
apparaître des formes complexes qui n'existaient pas jusqu'alors.
Il suggère que les premiers systèmes de vocalisations,
ou premiers codes de la parole, sont le résultat auto-organisés
de l'interaction entre composants comme l'oreille, le conduit vocal,
différents réseaux neuronaux (et à l'intérieur
de ceux-ci des neurones), et des agents qui possèdent ces
composants. L'un des points originaux du système est que
ces composants sont tous génériques et on peut trouver
pour chacun une explication qui n'a rien à voir avec la communication,
ni même avec quelque autre activité sociale. En bref,
l'auteur ne pré-suppose pas de pression sociale, et en particulier
pas de pression évolutionnaire pour développer des
systèmes de communication.Ceci l'amène à formuler
l'hypothèse que la parole pourrait être une exaptation
(adaptation s'étant révélée utile en
dehors du domaine où elle avait pris naissance). Mais le
système artificiel est aussi compatible avec un scénario
Darwinien dans lequel l'environnement favorise les individus qui
sont capables de communiquer de manière élaborée.
Dans ce scénario, son système montre comment le travail
de la sélection naturelle est facilité par les contraintes
apportées par l'auto-organisation.
Une population d'agents
Nous renverrons le lecteur souhaitant
en savoir plus à la partie véritablement technique
de la thèse, qui suppose un minimum de connaissance du formalisme
utilisé. Bornons-nous à constater que l’auteur
montre comment des agents de type robotique, dotés d’un
minimum de senseurs et d’actuateurs non orientés vers
la communication, finissent en évoluant dans un espace virtuel
fermé les obligeant à interagir, par produire «sans
le vouloir»(1)
un système de vocalisations correspondant à un code
de la parole conventionalisé, possédant les propriétés
fondamentales des codes de la parole humains contemporains, et partagés
par tous les locuteurs de la même société. Pour
celui qui n’a pas bien saisi le jeu des algorithmes utilisés,
la production de ce système de vocalisation relève
quasiment du miracle. Un code de la parole complet naît à
partir de quelque chose de tout à fait différent -
on pourrait dire à partir du vide pour faire allusion à
l’énergie du même nom.
Pierre-Yves
Oudeyer n’essaye pas d’utiliser
ces prémisses à la compréhension des systèmes
de vocalisation syllabes, composées de voyelles et de consonnes,
tels qu'ils sont apparus au sein des espèces animales. Il
étudie d'abord l’émergence de ce qui correspondrait
à celle de voyelles si les agents informatiques avec lesquels
il travaille étaient dotés d’appareils auditifs
et d’expressions analogues à ceux de l’homme.
A partir de cela, c’est-à-dire après avoir compris
comment un code de la parole peut s’organiser autour de phonèmes
relativement cohérents, on peut imaginer comment d'autres
éléments essentiels au langage, voire même le
langage lui-même, comme nous le connaissons aujourd'hui, ont
pu émerger. Le préalable, que l’auteur désigne
du problème de la poule et de l'oeuf (est-ce le cerveau qui
a façonné le langage, ou le langage qui a façonné
le cerveau ?) commence à trouver une réponse. Le cerveau
n’a pas précédé le langage ni le langage
précédé le cerveau. Ils ont co-évolué
ensemble, en utilisant des bases qui n’avaient rien à
voir avec la communication langagière. Celle-ci peut alors
apparaître comme une exaptation née du rapprochement
de facteurs ou propriétés d’agents soumis à
une seule contrainte, partager le même espace.
Les linguistes traditionnels diront
que les travaux apportés par la thèse de Pierre-Yves
Oudeyer intéressent des agents informatiques outrageusement
simplifiés par rapport à ce que sont les organismes
vivants. On est donc loin des processus biologiques, linguistiques,
sociologiques du monde vivant, à la base de la communication
animale puis de la communication humaine. Mais pour répondre
à cette objection, l’auteur développe une défense
de la modélisation mathématico-informatique qui a
déjà souvent été présentée
(voir notamment Baquiast-Cardon 2003 et Chauvet 1998) mais qu’il
est bon de rappeler. Le modèle n’est pas le réel.
Il ne prétend pas se substituer à lui. Cependant,
comme il nous donne une représentation relativement fidèle
et entièrement compréhensible des phénomènes
naturels, il suffit, sous réserve de confirmer in vivo les
hypothèses suggérées par le modèle,
à faire comprendre ces phénomènes. Il permet
même d’agir sur eux avec une probabilité de succès
convenable. Nombre de chercheurs vont aujourd'hui plus loin dans
l’importance qu’ils attachent à la modélisation.
Selon eux les modèles, bénéficiant des progrès
continuels des technologies, devraient nous permettre progressivement
de substituer des mécanismes artificiels aux mécanismes
naturels, avec des performances accrues.
Il faut bien reconnaître, en ce qui concerne les origines
de la parole (et du langage), que les travaux
menés au laboratoire de Sony CSL à Paris,
par l’auteur et les collègues l’ayant précédé
dans cette voie, notamment Frédéric
Kaplan (Kaplan, La naissance d’une langue chez
les robots, Hermès Science 2001) justifient pleinement
la confiance faite à la modélisation. Que des robots
(ou de simples agents informatiques) soient capables d’inventer
par leur interaction des formes de langages montre bien que ce type
de morphogenèse est parfaitement éclairant en ce qui
concerne les origines de la communication symbolique d’abord,
langagière ensuite. On a d’ailleurs observé
que des sourds-muets élevés sans éducation
sociale retrouvaient des processus de même nature pour se
doter d’un minimum de langage qui leur soit propre.
Ni nativisme ni empirisme
Les modélisations présentées
par la thèse nous permettent en tous cas d’échapper
aux sempiternelles disputes entre nativistes Chomskiens et empiristes
: l’enfant apprend-il à parler « facilement »
parce que son cerveau a été précâblé
génétiquement par l’évolution, ou bien
découvre-t-il et apprend-il le langage à la naissance,
par interaction avec son milieu culturel ? Nul ne nie plus aujourd’hui
que les cerveaux disposent de pré-représentations
transmises par évolution au sein de chaque espèce,
et permettant aux jeunes de n’avoir pas tout à apprendre
en naissant. Mais pourquoi ces précâblages là
et pas d’autres ? Pierre-Yves Oudeyer et ses collègues
nous répondent que des organismes vivant dans le même
espace et dotés d’un minimum d’organes sensoriels
et moteurs ne pouvaient pas ne pas inventer un code de communication
symbolique, prenant différentes formes selon les espèces
mais présentant les mêmes formes basiques. On retrouve
là la réponse de la morphogenèse. Si la compétition
darwinienne a joué un rôle, d’autres lois plus
profondes ont contribué à l’émergence
de telles formes ou comportements et non d’autres.
A gauche : pavage régulier
hexagonal des murs construits par les abeilles dans leurs
ruches
A droite : forme prise par des gouttes d'eau quand elles
sont entassées.
L'explication néo-darwiniste pour expliquer la forme
alvéolaire du pavage des ruches dirait que les abeilles
auraient essayé toute une palette de formes possibles,
en partant de formes aléatoires, en sélectionnant
celles dont la construction leur font dépenser le
moins d'énergie, en les faisant varier petit à
petit, en resélectionnant, et ainsi de suite, jusqu'à
un jour tomber sur la forme hexagonale. En fait, cela revient
à chercher une aiguille dans une botte de foin, si
l'exploration des formes n'est pas contraintes. Heureusement
pour les abeilles, leur exploration est aidée par
un phénomène d'auto-organisation providentiel.
D'Arcy Thompson a remarqué que si l'on considère
des cellules de tailles approximativement égales,
de formes elles aussi approximatives et simplement pas trop
tordues, et que la température générée
par les abeilles permette de rendre les murs de cire assez
souples, alors les cellules entassées les unes sur
les autres se comportent à peu près comme
des gouttes d'eau dans la même situation entourées
d'un fluide visqueux. Or, les lois de la physique font qu'un
tel entassement de gouttes d'eau fait prendre spontanément
à chacune une forme hexagonale. Il suffit donc aux
abeilles non pas de trouver comment dessiner un pavage régulier
hexagonal, mais beaucoup plus simplement de trouver comment
faire des cellules à peu près de la même
taille et pas trop tordues, empilées les unes sur
les autres. La physique faisant le reste. Ainsi, le rôle
de l'auto-organisation de la structure physique est largement
aussi important que l'avantage métabolique que procure
cette structure aux abeilles.
Quelles sont ces lois ? La thèse
y fait allusion, en étudiant avec une grande précision
les modalités d’apparition des voyelles et des consonnes
dans les différentes langues. Même si toutes ces langues
ne présentent pas des solutions rigoureusement identiques,
les solutions se regroupent en bassins d’attraction communs.
L’auteur nous rappelle que le choix de ces bassins n’a
pas été fait par un concepteur extérieur recherchant
ex-ante une optimisation de type mécanique. Elle n’a
pas non plus résulté du seul jeu de la sélection
darwinienne, pour les raisons rappelées ci-dessus. Les formes
qui apparaissent découlent de la dynamique intrinsèque,
complexe et auto-organisée, des systèmes en jeu. Ces
systèmes sont caractérisés par un certain nombre
d'attracteurs, chacun correspondant à des formes émergentes
(2).
Compte tenu des caractéristiques,
acquises par ailleurs et préalablement, de l’appareil
bucco-pharyngé humain, ce sont les lois simples de la physique
macroscopique et plus particulièrement de la thermodynamique,
étudiées depuis au moins deux siècles, qui
génèrent l'apparition des structures et des formes
du langage et de ses éléments. Dans ces cas, on aboutit
à une optimisation ex-post permettant de diminuer les dépenses
d'énergie et de matière et lutter ainsi au mieux contre
l'entropie. Ce type d'optimisation est en œuvre, on le sait,
dès le niveau de la chimie, où les liens atomiques
durables sont ceux qui sont les moins gourmands en énergie.
On la retrouve à tous les niveaux, y compris bien entendu
dans les institutions sociales humaines. Le même raisonnement
s’applique aux formes de communication ayant émergé
dans les différentes espèces animales, compte tenu
de leurs caractères anatomiques et physiologiques propres.
C’est ce que cherche à montrer la théorie dite
«constructale», proposé par Adrian Bejan (voir
notre article).
La théorie constructale?
Arrivé
à ce stade, on peut s’étonner précisément
que Pierre-Yves Oudeyer. ne fasse pas allusion à cette théorie
et aux applications qui en sont données dans différentes
disciplines, allant de la recherche fondamentale à l’ingénierie
quotidienne. Il nous semble que ses propres hypothèses et
celles d'Adrian Bejan se complètent fort bien. Si cela était
le cas, on mesure le nombre considérable d’applications
qui pourraient être faites de la méthode de modélisation
proposée par le chercheur. C’est un peu, si l’on
peut dire, l’émergence de tout ce qui existe qui pourrait
alors être simulé, sur le modèle de l’auto-organisation
de la parole proposée par la thèse. Mais on ne peut
pas reprocher à l’auteur de n’avoir pas étendu
son travail à la presque totalité des connaissances,
comme on pourrait rêver de le faire après l’avoir
lu.
Avant de conclure, nous voudrions
revenir sur la question de savoir pourquoi le langage social de
type humain, comme d’ailleurs avant lui l’outil, ne
sont apparus que chez les hominiens ? Pourquoi pas chez des animaux
proches anatomiquement et par le mode de vie, tels que les primates
contemporains? Pierre-Yves Oudeyer évoque la question mais
nous semble-t-il, n’y répond pas complètement.
Il nous dit que le langage pourrait être apparu chez l’homme
comme une exaptation découlant des caractères anatomiques
et physiologiques des préhominiens, acquis pour d’autres
raisons. Mais quelles sont ces raisons ? Les lignés humaines
ont-t-elles évoluées comme elles l’ont fait
en application des lois simples de la morphogenèse visant
à économiser les dépenses énergétiques
au sein d’une espèce donnée confrontée
fortuitement à un nouveau milieu. Ces lois se seraient appliquées
différemment chez les autres primates, confrontés
à des milieux différents. Elles auraient donc produit
des résultats anatomiques et physiologiques différents,
ne permettant pas d’exaptation de type langagier. Peut-être.
Mais alors, pour compléter
l'explication, il faut réintroduire la sélection darwinienne
obligeant les espèces isolées à s’adapter
de façon différente à des milieux différents.
On retrouve dans ce cas la thèse devenue classique chez les
paléo-anthropologues, pour qui c’est l’accident
ayant chassé les pré-hominiens de la forêt humide
qui a fait leur succès. Isolés dans un milieu différent
(les failles rocheuses du rift plutôt que la savane, selon
des hypothèses récentes) les lois de la morphogenèse
les ont obligés à développer des formes originales,
à partir desquelles le langage a pu survenir.
Si on admet cela, qui conjugue comme
le suggère l’auteur l’explication darwinienne
et celle de l’auto-organisation, on peut dessiner une ligne
d’évolution soumise de bout en bout à la sélection
darwinienne sous contrainte des lois simples de la morphogenèse.
Une espèce transplantée dans un milieu nouveau survit
parce que, par mutation/sélection elle réussit à
optimiser ses caractéristiques anatomiques et physiologiques
afin de survivre dans ce milieu. La nécessité d’y
vivre en groupe et en isolat fait émerger par interaction
entre les individus de cette nouvelle espèce des formes de
communication langagière répondant aux contraintes
de développement modélisées par les expériences
de Pierre-Yves Oudeyer, adaptées aux spécificités
anatomiques initiales caractérisant les membres de la dite
espèce. On peut ensuite imaginer que les cerveaux, les appareils
audio-phonateurs et les contenus de langage aient co-évolué
ensemble, par sélection darwinienne, dans le sens de la diversification
et de la complexification, mais dans un espace continuellement contraint
par l’application des lois simples de la morphogenèse.
Le même mécanisme se serait appliqué ultérieurement
à l’évolution de l’ensemble des caractères
présentés par l’espèce humaine y compris
dans ses formes les plus récentes et les plus complexes.