Automates
Intelligents utilise le logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet aussi
d'accéder à la définition du mot dans une
autre langue.
De l'Animal
à l'Animat: Sixième Conférence Internationale sur la Simulation
des Comportements Adaptatifs (SAB2000)
Cinq conférences internationales ont déjà
été organisées par l'International Society
for Adaptative Behaviour (ISAB http://www.adaptive-behavior.org/
sur le sujet de la simulation des comportements adaptatifs.
La sixième conférence s'est tenue à Paris en
septembre 2000
Les objectifs de la conférence sont résumés
dans un excellent document, très pédagogique, dont
nous extrayons les lignes suivantes:
La conférence SAB2000
se situe à l'interface entre l'informatique, la robotique
et la biologie. Elle est centrée sur les " animats ", c'est-à-dire
sur des systèmes artificiels - animaux simulés ou
robots réels - qui sont largement inspirés des animaux
et qui s'avèrent capables de s'adapter, de survivre et de
poursuivre leur mission dans des environnements plus ou moins imprévisibles
et menaçants.
Postulant que la nature et
les sciences de l'ingénieur peuvent exploiter les mêmes
principes, la conférence SAB2000 a une double vocation :
comprendre et copier certains mécanismes inventés
par la nature afin de mettre au point des robots réels ou
logiciels capables de s'adapter à aussi large variété
de circonstances que possible; rechercher en quoi l'usage de concepts
et techniques dérivés de la robotique et de l'intelligence
artificielle peut aider à mieux comprendre le vivant.
Ainsi, la robotique et l'intelligence
artificielle (approches synthétiques), d'un côté,
les neurosciences, l'éthologie, l'écologie comportementale,
la psychologie comparative (approches naturalistes), de l'autre
côté, sont intéressées par le développement
d'une base conceptuelle appliquée à des phénomènes
tels que adaptation, autonomie, planification, anticipation, etc.
Cette conférence ...en particulier, elle met l'accent
sur des modèles bien spécifiés - c'est-à-dire
simulables sur ordinateur ou implémentables sur robots -
qui permettent de classer et comparer ces mécanismes, principes
et architectures.
Thèmes scientifiques
- L'approche Animat
Elle s'inscrit dans une approche
qui se veut complémentaire de celle de l'Intelligence Artificielle
traditionnelle. En effet, cette dernière a plutôt cherché
à ce jour à simuler les facultés les plus élaborées
du cerveau humain - résolution de problèmes, compréhension
du langage naturel, raisonnement logique - et à mettre en
uvre pour ce faire une approche computationnelle de la cognition.
Cette orientation a conduit l'Intelligence Artificielle traditionnelle
à oublier que les êtres vivants sont toujours situés
dans un environnement avec lequel ils interagissent en permanence
par l'intermédiaire de leurs senseurs et de leurs effecteurs.
Elle a ainsi négligé les processus de perception,
de catégorisation et d'adaptation qui sont primordiaux dans
une approche située et il s'en est suivi divers problèmes
théoriques ou pratiques, ainsi qu'une relative stagnation
de la discipline.
SAB2000 relève de ce
qu'on appelle maintenant la Nouvelle AI, la Robotique Comportementale,
l'Intelligence Artificielle Située ou encore l'Approche Animat.
Cette approche s'intéresse à des agents autonomes,
capables d'interagir avec leur environnement, et dans lequel ils
peuvent poursuivre plusieurs buts parfois contradictoires - comme
se nourrir, se reproduire, échapper à leurs prédateurs,
etc. Pour survivre, ces agents doivent utiliser les informations
que leur fournissent leurs senseurs, informations qu'ils doivent
parfois activement rechercher grâce à leurs effecteurs
et qu'ils doivent toujours interpréter en fonction de l'environnement
rencontré et du but poursuivi. Ainsi, leurs structures de
contrôle mettent à l'épreuve les conceptions
de James, selon lesquelles "le cerveau n'est pas construit pour
penser de façon abstraite, il est construit pour assurer
notre survie dans le monde". Ces structures de contrôle doivent
en priorité assurer des aptitudes minimales à explorer
et à catégoriser l'environnement ; à représenter
l'espace et les lois physiques du monde environnant ; à gérer
des buts, des motivations et des émotions ; à apprendre
et à évoluer.
- L'élaboration
de cartes cognitives et de modèles du monde en vue de détecter
et de s'adapter à la nouveauté
L'aptitude à naviguer
- c'est-à-dire l'aptitude à rejoindre un but donné
dans l'environnement de façon aussi directe que possible,
tout en évitant éventuellement certains endroits -
est certainement l'une des plus essentielles à la survie
d'un animat. En son absence, l'animat ne saurait pas comment rejoindre
ses sources d'énergie, comment éviter les obstacles
ou comment échapper à des rencontres dangereuses.
Or, si les ingénieurs ont conçu de nombreux systèmes
de navigation, ces systèmes mettent généralement
en uvre des représentations géométriques
internes de l'environnement et posent alors divers problèmes
d'implémentation, du fait de contraintes de mémoire
ou de temps de calcul, ou du fait des erreurs commises par les senseurs
ou les actionneurs utilisés par ces systèmes.
Dans ces conditions, dans
la mesure où les animaux savent naviguer de façon
efficace et robuste, il n'est pas surprenant que de nombreux chercheurs
aient essayé d'incorporer dans les animats les données
neurologiques et les stratégies comportementales acquises
ou précisées par les biologistes. Ces travaux reposent
sur des représentations internes de l'espace environnant
- souvent appelées des " cartes cognitives " - qui doivent
être apprises en-ligne, c'est-à-dire sitôt que
l'animat est confronté à un environnement nouveau
et qu'il commence à l'explorer.
Lorsque ces cartes atteignent
un degré de précision suffisant, l'animat peut les
exploiter pour se localiser, puis pour naviguer vers un but. Pour
ce faire, il peut utiliser les amers saillants de l'environnement
pour distinguer et reconnaître les différents lieux
qu'il traverse. Cette faculté implique qu'il ait mémorisé
quels amers sont perceptibles à partir de quel lieu, ce qui
lui permet éventuellement de s'apercevoir que des changements
sont survenus en un endroit donné. Selon que ces changements
sont réels ou qu'ils résultent d'une erreur de ses
senseurs, l'animat doit ou non mettre à jour sa carte cognitive
et doit donc re-explorer l'endroit en question, soit à distance
s'il est capable de perception active - c'est-à-dire s'il
peut contrôler l'orientation de ses senseurs - soit en retournant
à l'endroit considéré.
- Les modèles de
sélection de l'action mettant en uvre des systèmes
motivationnels et, éventuellement, émotionnels
Le problème de la
sélection de l'action est celui que rencontre tout agent,
animat, robot qui doit décider quoi faire à tout moment.
Doit-il continuer l'action courante ou, au contraire, s'engager
dans une autre action et, dans ce cas, laquelle ? Ce problème
est lié aux notions de but et de motivation et peut être
abordé de façon plus ou moins intelligente et adaptative.
Il se trouve aussi que ce problème est considérablement
plus aisé à résoudre lorsque le choix d'une
action appropriée doit être effectué au service
d'un but qui ne change pas : ainsi les robots autonomes actuels
ne sont guère utilisés que dans le cadre de tâches
d'exploration, de surveillance ou de collecte d'objets et, dans
le cadre de l'une ou l'autre de ces tâches, ils savent à
peu près bien décider quand il faut cesser d'avancer
tout droit et amorcer un virage, lorsqu'ils ont détecté
un obstacle par exemple.
Les actions ainsi sélectionnées
le sont au bénéfice d'un but unique imposé
par l'utilisateur. En revanche, la mise au point d'un véritable
système motivationnel, capable en premier lieu de décider
quel but ou sous-but couramment poursuivre, puis capable de sélectionner
la bonne action à accomplir au service du but ou sous-but
courant, est une tâche notoirement difficile. De nos jours,
la plupart des systèmes motivationnels sélectionnent
l'action à accomplir à partir des seules informations
fournies par les senseurs internes ou externes de l'animat et les
décisions qu'ils prennent sont alors de simples réflexes.
D'autres systèmes,
plus rares, utilisent aussi leur mémoire et implémentent
donc des solutions plus cognitives. Ces systèmes décident
quoi faire, non seulement en fonctions de ce qu'ils perçoivent,
mais aussi en fonction du souvenir qu'ils ont de l'utilité
passée de telle ou telle action dans les mêmes circonstances.
D'autres approches, plus
rares encore, tiennent compte non seulement des senseurs et de la
mémoire des animats, mais aussi de leur capacité à
prévoir et à anticiper. Les animats correspondants
décident quoi faire en fonction des conséquences attendues
de leurs actes ou de ceux d'autrui. Ils utilisent donc à
la fois des réflexes, une mémoire et des capacités
de planification.
- L'apprentissage, le développement
et l'évolution des comportements adaptatifs
L'apprentissage, le développement
et l'évolution sont les trois principaux moteurs de l'adaptation
des systèmes naturels. Aussi sont-ils très souvent
mis en uvre dans l'élaboration de systèmes adaptatifs
artificiels. L'approche animat repose essentiellement sur deux variétés
d'apprentissage, l'apprentissage non supervisé et l'apprentissage
par renforcement. La première variété concerne
toutes les situations où ce que l'animat apprend ne dépend
pas des actions qu'il effectue. C'est le cas lorsqu'il apprend à
catégoriser les informations sensorielles qu'il reçoit
et qu'il associe, par exemple, la perception de certains amers à
un certain lieu dans sa carte cognitive. C'est également
le cas lorsqu' il associe les occurrences de deux événements
externes, comme dans les situations de conditionnement classique.
La seconde variété d'apprentissage concerne les situations
où ce que l'animat apprend dépend des conséquences,
agréables ou désagréables, de ses actions.
Ce sont, par exemple, les situations de conditionnement opérant
ou les situations dans lesquelles un animat apprend un modèle
du monde, c'est-à-dire un modèle décrivant
comment l'environnement change, et avec quelles conséquences,
lorsque telle action est exercée dans telle situation.
Plutôt que d'être
conçue par un humain et améliorée par apprentissage,
l'architecture de contrôle d'un animat peut être déterminée
par un processus évolutif simulant les effets de la sélection
naturelle, indépendamment de toute intervention humaine.
Dans ce cas, cette architecture de contrôle peut être
codée dans un génotype et améliorée
de génération en génération, à
condition qu'un critère d'évaluation approprié
permette de distinguer les animats performants - qui sont autorisés
à se reproduire et à transmettre leurs génotypes
aux générations futures - de ceux qui ne le sont pas
- et qui sont exclus de ce processus. De nombreuses recherches portent
sur le type de codage et sur la nature de l'architecture de contrôle
les plus appropriés à la résolution de chaque
problème. En particulier, des résultats prometteurs
ont été obtenus au moyen de codages indirects, qui
décrivent des programmes de développement à
partir desquels sont générés des contrôleurs
neuronaux. D'autres recherches portent sur la définition
des critères d'évaluation permettant de décider
qu'un animat réalise bien la fonction qu'on lui destine.
D'autres recherches, enfin, visent à faire co-évoluer
des animats aux comportements et aux fonctionnalités différents,
ou à faire co-évoluer à la fois l'architecture
de contrôle et la morphologie d'un animat donné.
Enfin, une autre direction
de recherche dont il est clair qu'elle sera de plus en plus exploitée
à l'avenir - parce qu'elle assure plusieurs niveaux d'adaptation
à des échelles de temps différentes - est celle
qui vise à combiner les processus d'apprentissage, de développement
et d'évolution. On peut, en particulier, prévoir que
de nombreux travaux viseront à faire évoluer des programmes
de développement de réseaux de neurones chargés
de contrôler des animats, réseaux au sein desquels
des processus d'apprentissage pourront intervenir.
La découverte de tels
programmes par évolution assurera, en effet, un premier niveau
d'adaptation, vis à vis de changements environnementaux lents
susceptibles d'affecter des générations successives.
L'exécution de ces programmes - qui engagera le développement
dans telle ou telle voie, selon la nature des interactions que l'animat
aura avec son environnement - générera des réseaux
de neurones dont la morphologie finale dépendra de l'historique
de ces interactions, assurant ainsi un deuxième niveau d'adaptation,
sur des horizons temporels courts. Enfin, un troisième niveau
d'adaptation sera assuré par des mécanismes d'apprentissage
au niveau des synapses incluses dans ces réseaux de neurones.
Intervenant à l'échelle de la durée de vie
de l'animat, il adaptera l'animat à des événements
caractérisés par des constantes de temps moyennes.
- Les comportements collectifs
et sociaux, notamment la coopération et la communication.
Toutes les directions de
recherche qui viennent d'être évoquées trouvent
une généralisation naturelle dans le passage de l'animat
isolé à l'animat en groupe. S'intéresser à
ce passage conduit, par exemple, à rechercher si le développement
de l'intelligence n'est pas davantage conditionné par la
nécessité de survivre en société que
par celle de survivre dans un monde purement physique. Ainsi, pour
les tenants de ce qu'il est convenu d'appeler l'" hypothèse
machiavélique ", l'intelligence d'un animat se développe
parce qu'il apprend à percevoir et interpréter les
émotions et les intentions d'autrui, parce qu'il apprend
à le manipuler et à le tromper tout en évitant
d'être manipulé et trompé soi-même. De
même, il est intéressant de rechercher en quoi les
possibilités de communication qu'offre la situation de groupe
retentissent sur les facultés individuelles d'élaboration
d'une carte cognitive ou sur l'apprentissage d'un système
motivationnel. Ainsi, l'exploration d'un environnement inconnu peut
être utilement partagée par les membres du groupe,
tandis que la décision d'aller recharger ses batteries peut
être retardée si un autre animat occupe la station
de recharge. Plus généralement, des stratégies
collectives efficaces peuvent découler des interactions individuelles
et il reste beaucoup à faire pour comprendre et exploiter
la façon dont ces stratégies peuvent évoluer
et émerger.
Résultats attendus
Au plan fondamental, on peut espérer
que SAB2000 permettra :
l'identification des principes
organisationnels, des lois de fonctionnement et des propriétés
minimales qui permettent à un système naturel ou artificiel
de s'adapter à un environnement imprévisible;
une meilleure compréhension
de la façon dont de tels systèmes peuvent découvrir
eux-mêmes ces principes, ces lois et ces propriétés,
grâce à des mécanismes d'apprentissage, de développement
et d'évolution
la détermination des
conditions dans lesquelles le savoir théorique ainsi acquis
peut être utilisé pour construire des robots autonomes
et d'autres variétés d'agents autonomes synthétiques
; * l'amélioration de nos connaissances théoriques
et pratiques sur les systèmes adaptatifs en général,
aussi bien naturels qu'artificiels.
Au plan appliqué,
SAB2000 a vocation à mettre en scène des agents artificiels
qui exhibent certaines propriétés et comportements
caractéristiques des êtres vivants, dans des environnements
aussi bien réels que virtuels. A ce titre, elle devrait intéresser
les industriels concernés par les techniques adaptatives
correspondantes, les spécialistes des jeux vidéo et
de l'animation par ordinateur, les concepteurs de matériels
ludo-pédagogiques, les constructeurs ou utilisateurs de robots
autonomes.
Nous avons traduit ci-dessous les résumés
d'exposés présentés par 5 orateurs invités.
Ceux-ci permettent de se faire une idée des travaux actuels
. Les textes sont de chacun des auteurs intervenants.
- Eléments de la théorie de la viabilité
pour la construction des Animats
Jean-Pierre Aubin Centre de Recherche Viabilité, Jeux, Contrôle
Université Paris-Dauphine
Le principal objectif de la
théorie de la viabilité est d'expliquer l'évolution
de l'état d'un système de contrôle, gouverné
par des dynamiques non-déterministes et sujet à des
contraintes de viabilité, afin de révéler les
feedbacks cachés qui permettent la régulation du système
et fournissent des mécanismes de sélection pour les
implémenter. Il présuppose implicitement l'existence
d'un comportement "opportuniste" et "conservateur" chez le système:
un comportement qui rend celui-ci capable de conserver des solutions
viables aussi longtemps que son potentiel exploratoire (ou son manque
de déterminismes) - décrit par le caractère
viable de plusieurs évolutions - rend possible sa régulation.
- Mécanismes cérébraux pour la
navigation et la mémoire spatiale
Alain Berthoz Laboratoire de Physiologie de la Perception et de
l'Action College de France
Durant la navigation, le cerveau
codifie l'espace en utilisant plusieurs mécanismes qui ont
été explorés à la fois chez l'animal
et chez l'homme. Ces mécanismes incluent des codages spécifiques
de l'emplacement, de la direction et du mouvement (rotation et trranslation).
Les cadres de référence utilisés par le cerveau
ne sont pas encore clairs, les théories et les données
suggèrent que des cadres à la fois égocentriques
et allocentriques sont utilisés. Je donnerai plusieurs exemples
d'expériences utilisant un robot mobile et la réalité
virtuelle, où nous avons étudié la perception
de mouvement en 2 Dimensions. En complément, je mentionnerai
les preuves obtenues par la neurophysiologie et l'imagerie cérébrale
concernant les fonctions de différentes aires cérébrales
dans la codification de l'espace durant la navigation et dans la
mémoire spatiale. J'essairéi aussi de démontrer
les grandes possibilités d efertilisation croisée
entre la robotique et les neurosciences dans ce domaine de recherche.
- Mécanismes cérébraux pour un
comportement adaptatif autonome (Autonomous Adaptive Behavior)
Stephen Grossberg Department of Cognitive and Neural Systems Boston
University
Ces dernières années,
il est devenu possible de développer des modèles quantitatifs
concernant la façon dont le cerveau contrôle le comportement,
notamment des modèles neuronaux qui simulent quantitativement
les schémas d'activité dans le temps de cellules nerveuses
appartenant à des réseaux identifiés. Parallèlement
est survenu une nouvelle compréhension fonctionnelle des
problèmes que le cerveau doit résoudre dans chaque
cas. Les modèles incorporent de nombreux aperçus nouveaux
concernant les types d'architecture qui sont utilisés par
les cerveaux de mammifères pour générer des
comportements intelligents. Des exemples récents comportent
la modélisation de la façon dont l'aire corticale
TMS (MST) contrôle la navigation chez l'homme et les mouvements
oculaires lents de poursuite; comment plusieurs parties du cerveau
(incluant l'amygdale et le cortex prefrontal) interagissent avec
les ganglions de la base pour apprendre à répondre
sélectivement à des évènements inattendus
gratifiants, comment le cervelet apprend à adapter ses temps
de réponse aux distribution d'intervalles de temps durant
les expériences de conditionnement, comment les aires V1
et V2 du cortex visuel regroupent l'information sous
l'effet de contraintes descendantes et développent un apprentissage
stable en réponse à un environnement changeant; comment
des mouvements de bras de vitesse et de force différentes
sont prévus et exécutés en présence
d'obstacles par des circuits moteurs et pariétaux interagisssant
avec des ganglions de la base et de la moelle (....) .
D'autres modèles plus
qualitatifs sont développés relativement à
la façon dont les humains et d'autres animaux réalisent
la vision en 3 D, distinguent les figures du fond et apprennent
les catégories d'identification; comment les enfants acquièrent
l'écriture et d'autres mouvements complexes en séquence,
et comment les humains et les animaux peuvent les uns et les autres
estimer les quantités dénombrables. Parce que ces
travaux contribuent à une meilleure compréhension
des comportements adaptatifs autonomes, ils trouveront rapidement
des applications dans des applications technologiques. L'exposé
présentera une gamme de ces découvertes récentes.
- Interfacer les circuits électroniques
avec des êtres vivants
Raphael Holzer Swiss Federal Institute of Technology, Institute
of Microsystems, Bio-interface group
Les comportements de l'homme
et de l'animal sont contrôlés par un grand nombre de
neurones. L'information est représentée dans un neurone
par le changement de son potentiel de membrane et peut être
transmise à d'autres neurones par des processus électriques
et chimiques. Si l'on sait beaucoup de chose relativement au fonctionnement
du neurone isolé, il est encore difficile de comprendre les
interactions entre une grande population de neurones. Des chercheurs
dans différents domaines ont essayé ces dernières
années d'utiliser des interfaces électroniques avec
des êtres vivants. Des japonais ont observé les réponses
comportementales d'insectes à une stimulation électrique.
Une équipe allemande a utilisé les antennes d'un certain
insecte pour construire un biocapteur hybride. Le projet DARPA du
DOD américain étudie l'utilisation d'organismes biologiques
dans une initiative intitulée Systèmes à Contrôle
Biologique. Des micro-dispositifs, appelés Réseaux-multi-électrode,
permettent l'étude de cellules neuronales et de coupes de
tissu cérébral in vitro en enregistrant ou stimulant
des échanges entre groupes de neurones. Ceci permet d'examiner
la propagation du signal, les interactions entre neurones, l'apprentissage
et l'adaptation au sein de grands groupes de neurones. Sur une plus
grande échelle, des implants réalisés sur des
patients humains tentent de restorer des fonctions corporelles détruites
en stimulant artificiellement les muscles ou en cour-circuitant
les cellules sensorielles réceptrices endommagées,
afin de transmettre l'information au cerveau. Des implants cochléaires
fournissent un premier exemple réussi de telle transmission.
Des progrès récents dans le traitement du signal digital
(DSP) et la platicité du cerveau humain permettent dorénavant
à une personne affligée d'une surdité complète
de tenir une conversation téléphonique normale. Plusieurs
équipes aux USA et en Allemagne étudient maintenant
un implant rétinien destiné à remplacé
une couche de la rétine défectueuse en stimiulant
directement la couche nerveuse sous-jacente. Au fur et à
mesure que l'on obtiendra des interfaces électroniques de
plue en plus plus efficaces avec le système nerveux,
l'on comprendra mieux les complexités du tissu cérébral.
- La vision des insectes, leur navigation et les applications
aux robots
Mandyam V. Srinivasan, Centre for Visual Science, Research School
of Biological Sciences, Australian National University
En dépit de leurs petits
cerveaux et de leur système nerveux relativement simple,
les insectes sont remarquablement aptes à percevoir leur
environnenemnt et à y naviguer. Notre laboratoire et d'autres
ont cherché à comprendre les principes visuels grâce
auxquels ces créatures évitent les collisions avec
des objets, évaleunt leurs distances, négocient des
passages étroits régulent leur vitesse de vol, réalisent
des attérissages en douceur, et retrouvent leur nid sans
effort. Le présent exposé mettra en lumière
certains de ces principes, ainsi que la façon de les implémenter
dans des robots capables de navigation autonome.