Automates
Intelligents s'enrichit du logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet aussi
d'accéder à la définition du mot dans une
autre langue.
Les superordinateurs évoluent à grande vitesse et
les records de puissance et de vitesse de calcul ne cessent de pleuvoir.
Ces machines sont désormais indispensables à l'avancée
de nombreux domaines de la recherche scientifique, qu'il s'agisse
des biotechnologies et de la protéomique, des neurosciences,
de la cosmologie, de la modélisation et de l'analyse de l'évolution
de l'environnement, de la simulation des essais nucléaires,
etc. Occupant aujourd'hui des pièces entières, ces
supermachines finiront-elle par atteindre dès 2010 la taille
d'une simple puce, comme le prédit la firme IBM avec l'avènement
du processeur Trips(1)
capable d'exécuter mille milliards d'opérations à
la seconde ? Et au-delà, pour cause de limites infranchissables
de miniaturisation des processeurs, verrons-nous alors l'apparition
des ordinateurs quantiques [notre
article du 29/01/2004] comme certains le prévoient
pour les années 2020 ?
Un
peu d'histoire
Architecture
vectorielle
De
quand date la première apparition du mot "supercalculateur"
(on dit plutôt maintenant "superordinateur") ? Pour
le dictionnaire "Petit Robert", son utilisation daterait
de 1985, avec la définition suivante : "Ordinateur
d'une très grande puissance de calcul, possédant des
temps de cycles d'instruction très courts, des ressources
importantes et la possibilité d'effectuer des opérations
en parallèle". Cela dit, il peut y avoir décalage
de temps entre l'apparition réelle d'un mot et son acceptation
dans le langage usuel (surtout lorsqu'on sait que la validation
de ce terme par l'office de la langue française, date, elle
de... 1998). On
pourrait aussi bien dater l'apparition du terme "supercalculateur"
à l'année 1976(2),
avec l'apparition du CRAY 1, machine dite à "architecture
vectorielle"(3),
conçue par l'américain Seymour Cray, considéré
comme le père des ordinateurs scientifiques. Refroidi au
fréon, doté de 8 Mo de mémoire vive et capable
d'effectuer quelque 166 millions d'opérations à virgule
flottante(4)
à la seconde (166 mégaflops), ce supercalculateur
pesant près de 5 tonnes coûtait environ 700000 dollars
à l'époque. Le premier exemplaire (photo) fut livré
au "Los Alamos National Laboratory". Seize exemplaires
ont été construits. En
1985, arrive la commercialisation du Cray2, premier ordinateur à
dépasser la puissance de 1 Gflop (1 milliard de calculs en
virgule flottante par seconde). Tournant sous Unix, la machine peut
être équipée jusqu'à 4 processeurs d'excécution
(le modèle de base en comportant 2) tournant à 250
MHz et peut adresser directement jusqu'à 4 Go de mémoire
vive. Chaque processeur a une puissance de 488 Mflops. Un programme
de multiplication de matrices utilisant les 4 processeurs dispose
d'une puissance de 1.7 Gflops. Le Centre de Calcul Vectoriel pour
la Recherche (CCVR) Ecole polytechnique ou le Centre interuniversitaire
de calcul d'Orsay ont notamment pu bénéficier de telles
machines.
Architecture
massivement parallèle
Si
on voit arriver le Cray3 à la fin des années 80 (5
gigaflops), une nouvelle architecture, dite "massivement parallèle"(5)
va aussi commencer à s'imposer dès 1986, avec la commercialisation
par la société
Thinking Machines de la Connection Machine CM-1, superordinateur
d'un nouveau type pouvant comporter jusqu'à 65536 processeurs.
La machine est un peu conçue comme le fonctionnement du cerveau
humain car chaque processeur (qui n'a pas besoin d'être puissant)
effectue un travail très réduit mais ce qui compte,
c'est la façon dont sont reliés les processeurs entre
eux. La machine reconfigure les connexions internes entre les processeurs
pour résoudre un problème donné. Les performances
dépendent toutefois largement du type d'application à
traiter, nécessitant de la part de l'utilisateur une très
bonne connaissance de l'architecture de la machine pour l'écriture
de programmes efficaces. La machine se prête plutôt
aux applications qui comportent une grande quantité de données
auxquelles sont attachés des paramètres identiques(6).
Elle est particulièrement adaptées aux disciplines
qui utilisent la simulation (le Centre National de Calcul Parallèle
en Sciences de la Terre de Jussieu (Paris) a par exemple été
l'un des premiers à bénéficier d'une telle
machine [CM-5], notamment pour ses calculs en géophysique).
L'architecture massivement parallèle qui, répétons-le
consiste à distribuer la charge sur un grand nombre de processeurs
au lieu de faire travailler un nombre réduit de processeurs
puissants (cas des machines vectorielles), présente évidemment
un avantage en termes de coût du fait que les processeurs
utilisés sont à peu près
les mêmes que ceux employés dans les micro-ordinateurs
de bureau...
C'est ainsi qu'on dépassera le téraflop en 1997 (mille
milliards d'opérations en virgule flottante à la seconde)
avec ASCI Red (Accelerated Strategic Computing Initiative), développé
aux Etats-Unis par INTEL Corporation et Sandia National Laboratories.
Ordinateur massivement parallèle MIMD (Multiple Instruction,
Multiple Data).
Architecture
de grappes d'ordinateurs (clusters)
Course
à la performance oblige (et surtout à la diminition
du coût) voici aujourd'hui les clusters, ordinateurs classiques
mis en réseau pour fonctionner ensemble, comme une seule
machine. Si le problème actuel est la vitesse des interfaces
réseaux gérant la comunication entre les différents
ordinateurs, il n'en reste pas moins que les clusters les plus puissants
n'ont pas grand choses à envier à d'autres machines.
Qu'on en juge notamment avec Apple qui vient de présenter
le 6 janvier dernier à San Fransisco sa technologie de grappes
Xgrids(7)
permettant de faire calculer ensemble jusqu'à 84 processeurs
G5, fournissant une puissance de calcul d'1,5 téraflop (système
apple déjà testé aux états-Unis par
la Nasa, Genentech, Simon Fraser University, Reed College and Virginia
Tech). Notons que la 3ème machine la plus puissante au monde
(le Terascale, voir tableau ci-dessous) est un cluster de 1100 G5,
affichant 10 téraflops (coût : 5,2 millions de dollars).
La machine arrivant première, indétrônée
depuis son apparition en 2002, est japonaise : il s'agit de l'Earth
Simulator(8),
synthèse entre l'ordinateur à architecture vectorielle
et architecture massivement parallèle, qui atteint les 35
téraflops. Son coût : 350 millions de dollars.
A
quand le pétaflop ?
Un
pétaflop représente un million de milliards d'opérations
en virgule flottante par seconde, chiffre symbolique désormais
à atteindre pour des raisons stratégiques mais aussi
pour le prestige que cela confère. On peut alors ici parler
d'une véritable compétition. La Darpa a d'aileurs
lancé en juillet 2003 un appel d'offres pour qu'on lui soumette
des projets innovants.
Sont déjà annoncés un futur CRAY, le "Red
Storm" qui devrait atteindre les 40 téraflops (Sandia
laboratories) et l'ASCI Purple d'IBM (fabriqué pour le laboratoire
national de Laurence Livermore), qui doit atteindre les 100 téraflops
et être livré pour la fin de cette année. Toujours
chez IBM, on s'active sur Blue Gene/L, qui doit être livré
l'année prochaine aux chercheurs du laboratoire national
de Laurence Livermore. Dix fois plus compacts que les plus performants
des superordinateur actuel et consommant 15 fois moins, il atteindra
les 360 téraflops ! Ambition affichée par IBM : enfoncer
les japonais et asseoir sa domination sur le secteur, ayant déjà
annoncé passer à mille milliards d'opérations
à la seconde en 2010 sur... une simple puce. Cray, pour sa
part, nourrit l'ambition de founir à cette même date
une machine développant une puissance de calcul d'un pétaflop.
Les cinq machines les plus puissantes au monde
source : http://www.top500.orgnovembre 2003
1
- Earth simulator
performance de pointe : 35,86 téraflops
[35860 milliards d'opérations à
la seconde - capacité
totale de stockage : plus de
700 téeraoctets]
Conçu
par l'entreprise japonaise NEC, l'Earth Simulator (machine
hybride vectoriel- massivement parallèle) occupe
une superficie d'un peu plus de la moitié d'un terrain
de footbal. Basé à Yokoama, ce superordinateur
est affecté à des simulations à l'échelle
de la Terre entière (systèmes terrestres complexes,
climatologiques, géophysique, calcul des courants
marins, etc.)
Indétrônée
depuis son apparition en 2002, et d'un coût estimé
de 350 millions de dollars, la machine est dotée
de quelque 5120 processeurs cadencés à 500
Mhz. L'installation occupe pas moins de quatre étages
(dont un pour l'équipement électrique, un
autre occupé par des centaines de kilomètre
de câbles...).
2
- Asci Q
performance de pointe : 13,86 téraflops
(devant atteindre à terme à 30 téraflops)
[13860
milliards d'opérations à la seconde - capacité
totale de
stockage (à terme) : plus de 654 téraoctets]
Situé
au laboratoire national de Los Alamos(LANL) et dédié
à la simulation des essais nucléaires, Asqi
Q (Advanced Simulation and Computing) est aujourd'hui le
plus puissant des ordinateurs américains. Il comprend
pour l'instant plus de 2000 ordinateurs Alphaserver Hewlett
Packard, chacun d'eux étant munis de 4 processeurs
cadencés à 1,25 GHz.
A
terme, ce système à architectecture massivement
parallèle comprendra 3072 AlphaServer (soit plus
de 12000 processeurs), pour une puissance de 30 téraflops.
3
- Terascale
performance de pointe : 10,28 téraflops [10280
milliards d'opérations à la seconde - capacité
totale de
stockage :176 téraoctets]
Le
Terascale est le plus puissant des ordinateurs réalisé
selon l'architecture "cluster", c'est-à-dire
à partir de machines de bureau mises en réseau.
Conçu par les scientifiques de l'Institut polytechnique
de Virginie (avec l'aide de partenaires industriels) pour
faire -comme ils aiment à dire - de la "Big
Science", le superordinateur se compose de l'association
de 1100 ordinateurs G5 (Apple) chacun doté de deux
processeurs Power PC 64 bits
970 d'IBM.
C'est également l'un des moins chers des supercalculateurs
dans une telle catégorie, avec son coût estimé
à 5 millions de dollars (contre par exemple 350 millions
de dollars pour le Earth Simulator).
4
- Tungsten
performance de pointe : 9,819 téraflops (devant
atteindre à terme à 17.7 téraflops) [9819
milliards d'opérations à la seconde - capacité
totale de
stockage :122 téraoctets]
Basé
au National Center for Supercomuting Applications (NCSA)
- Université de l'illinois, le cluster Tungsten vise
aux études concernant la cosmologie (étude
de la structure de l'univers, des étoiles, mais aussi
des propriétés de la matière).
Composé aujourd'hui de 1450 serveurs Dell Power Edge
1750, dotés chacun de deux processeurs Intel Xeon,
c'est le plus puissant des supercalculateurs actuels sous
Linux (tournant sur la distribution Red Hat 7°
5
- MPP2
performance de pointe : 8,633 téraflops [8633
milliards d'opérations à la seconde - capacité
totale de
stockage :195 téraoctets]
Basé
au Pacific Northwest National Laboratory (Richland - USA),
ce superordinateur est notamment dédié à
la biologie et à la modélisation de l'environnement.
Il se compose de 980 ordinateurs Hewlett Packard, chacun étant
doté de 2 processeurs Itanium 2 Intel, cadencés
à 1,5 GHz.
En savoir plus : http://mscf.emsl.pnl.gov/?/capabs/mscf/hardware/intro... [NB : Signalons que cette liste Top 500 dressée
en 2003 est déjà obsolète. Aujourd'hui
MPP2 est passé en 6ème place derrière
un supercalculateur IBM d'une puissance de 8,9 téraflops,
basé en Allemagne au center de recherche de Julich
(voir ci-dessous).]
La liste des 500 ordinateurs les
plus puissants du monde montre la prédominance
des Etats-Unis en la matière : près
des deux-tiers des machines répertoriées
sont situées dans les universités
et laboratoires américains.
Si certains contestent la validité de cette
liste, arguant qu'elle ne s'appuie pas sur la puissance
effective des ordinateurs mais sur leurs performances
de pointe(1),
en tenir compte ne bouleverse finalement pas grand
chose.
En tous cas, si on considère ce Top 500 (novembre
2003) - seule liste d'ailleurs à faire référence
-, la première machine basée en Europe
apparaissant dans le classement est située...
en France(2)
et arrive à la 15 ème place : il s'agit
de l'AlphaServer SC45 (Hewlett Packard) du CEA,
doté d'une puissance 3,98 téraflop
et réservé aux applications militaires.
Notons que le premier gros calculateur français
uniquement dédié à la recherche
publique arrive en... 167 ème position avec
0,822 téraflops (Institut national de physique
nucléaire et de physique des particules -
IN2P3/CNRS).
La Chine (Académie des sciences) arrive en
14ème position (4,163 téraflops) du
Top 500, le Royaume-Uni (Institut de physique) en
16ème place (3,4 téraflops).
Un projet européen de
mise en commun des moyens de calcul Avec le projet Deisa(3)
figurant au 6ème PCRDT(4)
(projet coordonné par l'IDRIS(5)),
et un peu sur le modèle du TeraGrid américain,
six pays vont mettre en commun leurs moyens de calcul
: Allemagne, Finlande, France, Italie, Royaume-Uni
et Suisse. L'objectif est de déployer un
supercalculateur réparti européen
résultant de l’intégration de
plusieurs supercalculateurs nationaux. Dans une
première phase planifiée pour début
2005, cette future infrastructure communautaire
doit disposer d’une puissance intégrée
de 30 Téraflops. Si chaque pays ne disposera
pas de la puissance totale, il pourra être
attribué une part importante à un
programme scientifique donné et réduire
aussi l'attente. Un calcul pourra être effectué
en partie dans n'importe quel ordinateur des 6 pays,
sans même que l'utilisateur ne s'en rende
compte.
Un supercalculateur d'une puissance
de 40 téraflops pour l'Espagne ! La liste du Top 500 va être rapidement
à revoir : Juan Costa, ministre de la science
et de la technologie a
annoncé le 27 février 2004
l'installation pour cette année en Catalogne
d'un supercalculateur d'une puissance de 40 Téraflops.
Devant constituer le coeur d'un nouveau centre de
recherche qui hébergera à terme quelque
4000 chercheurs de toutes nationalités, la
supermachine sera notamment dédiée
à la modélisation avancée en
médecine, à l'étude du climat,
à l'amélioration de la conception
de produits industriels, qu'il s'agisse d'ingénierie
mécanique ou aéronautique, conception
de nouveaux matériaux, etc. Construite en
collaboration avec IBM, pesant quelque 60 tonnes,
elle comprendra 45000 processeurs sous Linux et
sera dotée d'une mémoire centrale
de 9 Teraoctets. Coût prévu : 70 millions
d'euros sur quatre ans.
Mais aussi... un supercalculateur
d'une puissance de 8,9 Téraflops déjà
en service en Allemagne et un autre de 40 Téraflops
prévu pour 2005
Début mars 2004, le centre de recherche allemand
de Julich (qui participe au projet Deisa - voir
ci-dessus) vient de mettre en service, début
mars 2004, un super-calculateur d'une capacité
de 8,9 Teraflops. Développé par IBM,
pour un coût de 66 millions d'euros, il se
compose d'un réseau de 41calculateurs comprenant
un total de 1312 processeurs, l'ensemble étant
relié à un système central,
via réseau rapide.
La moitié de la capacité de calcul
doit être utilisée par divers centres
de recherches ainsi que par des industriels. Une
seconde moitié sera utilisée par l'institut
d'informatique John von Neumann (NIC), fondé
par le centre de recherche de Julich en 1998.
Cela dit, ce centre ne devrait pas conserver très
longtemps sa première place européenne
: le centre de recherche universitaire de Stuttgart
a annoncé la création d'un super-calculateur
d'une puissance de 15 Teraflops à l'horizon
2005. Et pour cette même date, le centre de
recherche Leibniz de Munich a également planifié
la réalisationd'un super-calculateur atteignant
les 40 Teraflops.
(1)
Certains calculateurs très performants ne
dispensent que 40% de leur capacité maximale.
(2)
Qui devrait être rejointe rapidement par l'Allemagne,
pour laquelle le High Performance Computing Center
Stuttgart (HLRS) vient d'annoncer l'installation
en 2004/2005 d'un supercalculateur NEC d'une vitesse
pouvant atteindre 4 téraflops. Celui-ci
sera mis à disposition des universités
et des organismes de recherche non universitaires
de toute l'Allemagne. (3)
Distribued European Infrastructure for Supercompution
Applications [voir http://www.deisa.org].
(4)
Programme-cadre de recherche et de développement
technologique. (5)
Institut du Développement et des Ressources
en Informatique Scientifique, situé en France,
à Orsay. Le CNRS vient d’équiper
l’IDRIS d’une architecture IBM eServer
pseries de nouvelle génération, quintuplant
la puissance de calcul disponible (voir communiqué
de presse du CNRS daté du 19 février
2004).
Notes (1) Tero-op Reliable
Intelligently-adaptive Processing System - Voir http://www.silicon.fr/click.asp?id=2201 (2) On aurait
tout aussi bien pu choisir 1955, année du lancement de l'IBM
704, première machine commerciale disposant d'un coprocesseur
mathématique, avec une puissance 5 kFLOPS (milliers d'opérations
en virgule flottante par seconde). Elle utilisait une mémoire
à tores de ferrite de 32768 mots de 36 bits, tores de ferrite,
assurant une fiabilité à toute épreuve pour
l'époque, car ne tombait en panne qu'une fois par semaine.
C'est sur cette machine que sera développé le langage
FORTRAN. (3) Machine scientifique
très puissante, conçue pour travailler efficacement
sur les vecteurs. Elle possède des unités fonctionnelles
permettant d'effectuer une même opération (par exemple
une additionà sur un grand nombre de données (les
deux composantes des deux vecteurs à additionner). Il suffit
donc de préciser l'opération à effectuer et
sur quelles données opérer pour que l'unité
fonctionnelle exécute seule l'opération sur toutes
les composantes des vecteurs à traiter. Si les unités
fonctionnelles amélioraient alors grandement la puissance
de traitement, les performances de la machine dépendaient
beaucoup de la façon de la programmer (appelée vectorisation). (4) Méthode
de codage et de stockage des nombres réels dans les ordinateurs,
pour qu'ils puissent les manipuler assez rapidement. (5) Dite aussi
MPP (Massively Parallel Computing.Le fonctionement de ces
machines repose sur le principe que l'on peut décomposer
un programme en un ensemble de tâches indépenantes,
qui sont exécutées simultanéments sur des processeurs
différents. Selon la manière dont les processus coopèrent
au cours du traitement, on distingue les systèmes "fortements
couplés" des systèmes "faiblement couplés".
(6) Si ce type
de machine possède de très nombreux processeurs, la
capacité mémoire de chacun d'entre eux est forcément
inférieure à celle d'un processeur d'une machine vectorielle
(qui lui, est très puissant). (7) Voir http://www.apple.com/pr/library/2004/jan/06xgrid.html (8) Voir
notre éditorial du 7 janvier 2003