Plan du site Aide Abonnement Nous Contacter


Actualité
Editorial
Interviews
Démocratie
Visites virtuelles
Art. Imaginaire
Du côté des labos
Le feuilleton
Manifestations
Biblionet
CD Rom
Echanges
Liens Utiles

 

Accueil > Du côté des labos
Automates Intelligents s'enrichit du logiciel Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront alors définitions, synonymes et expressions constituées de ce mot. Une fenêtre déroulante permet aussi d'accéder à la définition du mot dans une autre langue.
 
Archives
2010-2011
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
En guise d'introduction

2 mars 2004

L'Earth Simulator, basé au Japon  © NECLes superordinateurs
et la course au pétaflop


par Christophe Jacquemin


Les superordinateurs évoluent à grande vitesse et les records de puissance et de vitesse de calcul ne cessent de pleuvoir. Ces machines sont désormais indispensables à l'avancée de nombreux domaines de la recherche scientifique, qu'il s'agisse des biotechnologies et de la protéomique, des neurosciences, de la cosmologie, de la modélisation et de l'analyse de l'évolution de l'environnement, de la simulation des essais nucléaires, etc. Occupant aujourd'hui des pièces entières, ces supermachines finiront-elle par atteindre dès 2010 la taille d'une simple puce, comme le prédit la firme IBM avec l'avènement du processeur Trips(1) capable d'exécuter mille milliards d'opérations à la seconde ? Et au-delà, pour cause de limites infranchissables de miniaturisation des processeurs, verrons-nous alors l'apparition des ordinateurs quantiques [notre article du 29/01/2004] comme certains le prévoient pour les années 2020 ?

Un peu d'histoire

Architecture vectorielle

De quand date la première apparition du mot "supercalculateur" (on dit plutôt maintenant "superordinateur") ? Pour le dictionnaire "Petit Robert", son utilisation daterait de 1985, avec la définition suivante : "Ordinateur d'une très grande puissance de calcul, possédant des temps de cycles d'instruction très courts, des ressources importantes et la possibilité d'effectuer des opérations en parallèle". Cela dit, il peut y avoir décalage de temps entre l'apparition réelle d'un mot et son acceptation dans le langage usuel (surtout lorsqu'on sait que la validation de ce terme par l'office de la langue française, date, elle de... 1998).
Le premier Cray1, livré au Los Alamos National Laboratory On pourrait aussi bien dater l'apparition du terme "supercalculateur" à l'année 1976(2), avec l'apparition du CRAY 1, machine dite à "architecture vectorielle"(3), conçue par l'américain Seymour Cray, considéré comme le père des ordinateurs scientifiques. Refroidi au fréon, doté de 8 Mo de mémoire vive et capable d'effectuer quelque 166 millions d'opérations à virgule flottante(4) à la seconde (166 mégaflops), ce supercalculateur pesant près de 5 tonnes coûtait environ 700000 dollars à l'époque. Le premier exemplaire (photo) fut livré au "Los Alamos National Laboratory". Seize exemplaires ont été construits.

Cray 2 : l'unité centrale (sur la droite) est entièrement immergée dans un liquide conducteur de chaleur et isolant électrique (fluorinert) pour assurer son refroidissement. Les colonnes transparentes visibles à gauche servent à évacuer les bulles se formant dans le liquide entrant partiellement à ébullition au contact des circuits de l'unité centrale. En 1985, arrive la commercialisation du Cray2, premier ordinateur à dépasser la puissance de 1 Gflop (1 milliard de calculs en virgule flottante par seconde). Tournant sous Unix, la machine peut être équipée jusqu'à 4 processeurs d'excécution (le modèle de base en comportant 2) tournant à 250 MHz et peut adresser directement jusqu'à 4 Go de mémoire vive. Chaque processeur a une puissance de 488 Mflops. Un programme de multiplication de matrices utilisant les 4 processeurs dispose d'une puissance de 1.7 Gflops. Le Centre de Calcul Vectoriel pour la Recherche (CCVR) Ecole polytechnique ou le Centre interuniversitaire de calcul d'Orsay ont notamment pu bénéficier de telles machines.

Architecture massivement parallèle

Si on voit arriver le Cray3 à la fin des années 80 (5 gigaflops), une nouvelle architecture, dite "massivement parallèle"(5) va aussi commencer à s'imposer dès 1986, avec la commercialisation par la Connection Machine CM1société Thinking Machines de la Connection Machine CM-1, superordinateur d'un nouveau type pouvant comporter jusqu'à 65536 processeurs. La machine est un peu conçue comme le fonctionnement du cerveau humain car chaque processeur (qui n'a pas besoin d'être puissant) effectue un travail très réduit mais ce qui compte, c'est la façon dont sont reliés les processeurs entre eux. La machine reconfigure les connexions internes entre les processeurs pour résoudre un problème donné. Les performances dépendent toutefois largement du type d'application à traiter, nécessitant de la part de l'utilisateur une très bonne connaissance de l'architecture de la machine pour l'écriture de programmes efficaces. La machine se prête plutôt aux applications qui comportent une grande quantité de données auxquelles sont attachés des paramètres identiques(6). Elle est particulièrement adaptées aux disciplines qui utilisent la simulation (le Centre National de Calcul Parallèle en Sciences de la Terre de Jussieu (Paris) a par exemple été l'un des premiers à bénéficier d'une telle machine [CM-5], notamment pour ses calculs en géophysique). L'architecture massivement parallèle qui, répétons-le consiste à distribuer la charge sur un grand nombre de processeurs au lieu de faire travailler un nombre réduit de processeurs puissants (cas des machines vectorielles), présente évidemment un avantage en termes de coût du fait que les processeurs utilisés sont à peu prèASCI Red, juin 1997s les mêmes que ceux employés dans les micro-ordinateurs de bureau...
C'est ainsi qu'on dépassera le téraflop en 1997 (mille milliards d'opérations en virgule flottante à la seconde) avec ASCI Red (Accelerated Strategic Computing Initiative), développé aux Etats-Unis par INTEL Corporation et Sandia National Laboratories. Ordinateur massivement parallèle MIMD (Multiple Instruction, Multiple Data).

Architecture de grappes d'ordinateurs (clusters)

rack de clustersCourse à la performance oblige (et surtout à la diminition du coût) voici aujourd'hui les clusters, ordinateurs classiques mis en réseau pour fonctionner ensemble, comme une seule machine. Si le problème actuel est la vitesse des interfaces réseaux gérant la comunication entre les différents ordinateurs, il n'en reste pas moins que les clusters les plus puissants n'ont pas grand choses à envier à d'autres machines. Qu'on en juge notamment avec Apple qui vient de présenter le 6 janvier dernier à San Fransisco sa technologie de grappes Xgrids(7) permettant de faire calculer ensemble jusqu'à 84 processeurs G5, fournissant une puissance de calcul d'1,5 téraflop (système apple déjà testé aux états-Unis par la Nasa, Genentech, Simon Fraser University, Reed College and Virginia Tech). Notons que la 3ème machine la plus puissante au monde (le Terascale, voir tableau ci-dessous) est un cluster de 1100 G5, affichant 10 téraflops (coût : 5,2 millions de dollars). La machine arrivant première, indétrônée depuis son apparition en 2002, est japonaise : il s'agit de l'Earth Simulator(8), synthèse entre l'ordinateur à architecture vectorielle et architecture massivement parallèle, qui atteint les 35 téraflops. Son coût : 350 millions de dollars.

A quand le pétaflop ?

Un pétaflop représente un million de milliards d'opérations en virgule flottante par seconde, chiffre symbolique désormais à atteindre pour des raisons stratégiques mais aussi pour le prestige que cela confère. On peut alors ici parler d'une véritable compétition. La Darpa a d'aileurs lancé en juillet 2003 un appel d'offres pour qu'on lui soumette des projets innovants.
Sont déjà annoncés un futur CRAY, le "Red Storm" qui devrait atteindre les 40 téraflops (Sandia laboratories) et l'ASCI Purple d'IBM (fabriqué pour le laboratoire national de Laurence Livermore), qui doit atteindre les 100 téraflops et être livré pour la fin de cette année. Toujours chez IBM, on s'active sur Blue Gene/L, qui doit être livré l'année prochaine aux chercheurs du laboratoire national de Laurence Livermore. Dix fois plus compacts que les plus performants des superordinateur actuel et consommant 15 fois moins, il atteindra les 360 téraflops ! Ambition affichée par IBM : enfoncer les japonais et asseoir sa domination sur le secteur, ayant déjà annoncé passer à mille milliards d'opérations à la seconde en 2010 sur... une simple puce. Cray, pour sa part, nourrit l'ambition de founir à cette même date une machine développant une puissance de calcul d'un pétaflop.


Les cinq machines les plus puissantes au monde

source : http://www.top500.org
novembre 2003

1 - Earth simulator
performance de pointe : 35,86 téraflops

[35860 milliards d'opérations à la seconde - capacité totale de stockage : plus de 700 téeraoctets]

Earth SimulatorConçu par l'entreprise japonaise NEC, l'Earth Simulator (machine hybride vectoriel- massivement parallèle) occupe une superficie d'un peu plus de la moitié d'un terrain de footbal. Basé à Yokoama, ce superordinateur est affecté à des simulations à l'échelle de la Terre entière (systèmes terrestres complexes, climatologiques, géophysique, calcul des courants marins, etc.)

Earth SimulatorIndétrônée depuis son apparition en 2002, et d'un coût estimé de 350 millions de dollars, la machine est dotée de quelque 5120 processeurs cadencés à 500 Mhz. L'installation occupe pas moins de quatre étages (dont un pour l'équipement électrique, un autre occupé par des centaines de kilomètre de câbles...).

En savoir plus :
http://www.es.jamstec.go.jp/


2 - Asci Q
performance de pointe : 13,86 téraflops
(devant atteindre à terme à 30 téraflops)
[13860 milliards d'opérations à la seconde - capacité totale de stockage (à terme) : plus de 654 téraoctets]

Asci Q  doit encore s'enrichir de plus d'un millier d'ordinateurs pour atteindre les 30 Tflops Situé au laboratoire national de Los Alamos(LANL) et dédié à la simulation des essais nucléaires, Asqi Q (Advanced Simulation and Computing) est aujourd'hui le plus puissant des ordinateurs américains. Il comprend pour l'instant plus de 2000 ordinateurs Alphaserver Hewlett Packard, chacun d'eux étant munis de 4 processeurs cadencés à 1,25 GHz.

Asci Q - Photo : Presley SalazA terme, ce système à architectecture massivement parallèle comprendra 3072 AlphaServer (soit plus de 12000 processeurs), pour une puissance de 30 téraflops.

En savoir plus :
http://doc.quadrics.com/...


3 - Terascale
performance de pointe : 10,28 téraflops
[10280 milliards d'opérations à la seconde - capacité totale de stockage :176 téraoctets]

Cluster TerascaleLe Terascale est le plus puissant des ordinateurs réalisé selon l'architecture "cluster", c'est-à-dire à partir de machines de bureau mises en réseau. Conçu par les scientifiques de l'Institut polytechnique de Virginie (avec l'aide de partenaires industriels) pour faire -comme ils aiment à dire - de la "Big Science", le superordinateur se compose de l'association de 1100 ordinateurs G5 (Apple) chacun doté de deux processeurs Power PC 64 bitTerascales 970 d'IBM.

C'est également l'un des moins chers des supercalculateurs dans une telle catégorie, avec son coût estimé à 5 millions de dollars (contre par exemple 350 millions de dollars pour le Earth Simulator).

En savoir plus :
http://computing.vt.edu/research_computing/terascale/



4 - Tungsten
performance de pointe : 9,819 téraflops
(devant atteindre à terme à 17.7 téraflops)
[9819 milliards d'opérations à la seconde - capacité totale de stockage :122 téraoctets]

Cluster TungtsenBasé au National Center for Supercomuting Applications (NCSA) - Université de l'illinois, le cluster Tungsten vise aux études concernant la cosmologie (étude de la structure de l'univers, des étoiles, mais aussi des propriétés de la matière).
Composé aujourd'hui de 1450 serveurs Dell Power Edge 1750, dotés chacun de deux processeurs Intel Xeon, c'est le plus puissant des supercalculateurs actuels sous Linux (tournant sur la distribution Red Hat 7°

En savoir plus :
http://www.ncsa.uiuc.edu/Divisions/PublicAffairs/LinuxCluster/...


5 - MPP2
performance de pointe : 8,633 téraflops
[8633 milliards d'opérations à la seconde - capacité totale de stockage :195 téraoctets]

MPP2Basé au Pacific Northwest National Laboratory (Richland - USA), ce superordinateur est notamment dédié à la biologie et à la modélisation de l'environnement. Il se compose de 980 ordinateurs Hewlett Packard, chacun étant doté de 2 processeurs Itanium 2 Intel, cadencés à 1,5 GHz.

En savoir plus :
http://mscf.emsl.pnl.gov/?/capabs/mscf/hardware/intro...

[NB : Signalons que cette liste Top 500 dressée en 2003 est déjà obsolète. Aujourd'hui MPP2 est passé en 6ème place derrière un supercalculateur IBM d'une puissance de 8,9 téraflops, basé en Allemagne au center de recherche de Julich (voir ci-dessous).]



La liste des 500 ordinateurs les plus puissants du monde montre la prédominance des Etats-Unis en la matière : près des deux-tiers des machines répertoriées sont situées dans les universités et laboratoires américains.
Si certains contestent la validité de cette liste, arguant qu'elle ne s'appuie pas sur la puissance effective des ordinateurs mais sur leurs performances de pointe(1), en tenir compte ne bouleverse finalement pas grand chose.

En tous cas, si on considère ce Top 500 (novembre 2003) - seule liste d'ailleurs à faire référence -, la première machine basée en Europe apparaissant dans le classement est située... en France(2) et arrive à la 15 ème place : il s'agit de l'AlphaServer SC45 (Hewlett Packard) du CEA, doté d'une puissance 3,98 téraflop et réservé aux applications militaires. Notons que le premier gros calculateur français uniquement dédié à la recherche publique arrive en... 167 ème position avec 0,822 téraflops (Institut national de physique nucléaire et de physique des particules - IN2P3/CNRS).

La Chine (Académie des sciences) arrive en 14ème position (4,163 téraflops) du Top 500, le Royaume-Uni (Institut de physique) en 16ème place (3,4 téraflops).

Un projet européen de mise en commun des moyens de calcul
Avec le projet Deisa(3) figurant au 6ème PCRDT(4) (projet coordonné par l'IDRIS(5)), et un peu sur le modèle du TeraGrid américain, six pays vont mettre en commun leurs moyens de calcul : Allemagne, Finlande, France, Italie, Royaume-Uni et Suisse. L'objectif est de déployer un supercalculateur réparti européen résultant de l’intégration de plusieurs supercalculateurs nationaux. Dans une première phase planifiée pour début 2005, cette future infrastructure communautaire doit disposer d’une puissance intégrée de 30 Téraflops. Si chaque pays ne disposera pas de la puissance totale, il pourra être attribué une part importante à un programme scientifique donné et réduire aussi l'attente. Un calcul pourra être effectué en partie dans n'importe quel ordinateur des 6 pays, sans même que l'utilisateur ne s'en rende compte.

Un supercalculateur d'une puissance de 40 téraflops pour l'Espagne !
La liste du Top 500 va être rapidement à revoir : Juan Costa, ministre de la science et de la technologie a annoncé le 27 février 2004 l'installation pour cette année en Catalogne d'un supercalculateur d'une puissance de 40 Téraflops. Devant constituer le coeur d'un nouveau centre de recherche qui hébergera à terme quelque 4000 chercheurs de toutes nationalités, la supermachine sera notamment dédiée à la modélisation avancée en médecine, à l'étude du climat, à l'amélioration de la conception de produits industriels, qu'il s'agisse d'ingénierie mécanique ou aéronautique, conception de nouveaux matériaux, etc. Construite en collaboration avec IBM, pesant quelque 60 tonnes, elle comprendra 45000 processeurs sous Linux et sera dotée d'une mémoire centrale de 9 Teraoctets. Coût prévu : 70 millions d'euros sur quatre ans.

Mais aussi... un supercalculateur d'une puissance de 8,9 Téraflops déjà en service en Allemagne et un autre de 40 Téraflops prévu pour 2005
Début mars 2004, le centre de recherche allemand de Julich (qui participe au projet Deisa - voir ci-dessus) vient de mettre en service, début mars 2004, un super-calculateur d'une capacité de 8,9 Teraflops. Développé par IBM, pour un coût de 66 millions d'euros, il se compose d'un réseau de 41calculateurs comprenant un total de 1312 processeurs, l'ensemble étant relié à un système central, via réseau rapide.
La moitié de la capacité de calcul doit être utilisée par divers centres de recherches ainsi que par des industriels. Une seconde moitié sera utilisée par l'institut d'informatique John von Neumann (NIC), fondé par le centre de recherche de Julich en 1998.
Cela dit, ce centre ne devrait pas conserver très longtemps sa première place européenne : le centre de recherche universitaire de Stuttgart a annoncé la création d'un super-calculateur d'une puissance de 15 Teraflops à l'horizon 2005. Et pour cette même date, le centre de recherche Leibniz de Munich a également planifié la réalisationd'un super-calculateur atteignant les 40 Teraflops.

(1) Certains calculateurs très performants ne dispensent que 40% de leur capacité maximale.
(2) Qui devrait être rejointe rapidement par l'Allemagne, pour laquelle le High Performance Computing Center Stuttgart (HLRS) vient d'annoncer l'installation en 2004/2005 d'un supercalculateur NEC d'une vitesse pouvant atteindre 4 téraflops.
Celui-ci sera mis à disposition des universités et des organismes de recherche non universitaires de toute l'Allemagne.
(3) Distribued European Infrastructure for Supercompution Applications [voir http://www.deisa.org].
(4) Programme-cadre de recherche et de développement technologique.
(5) Institut du Développement et des Ressources en Informatique Scientifique, situé en France, à Orsay. Le CNRS vient d’équiper l’IDRIS d’une architecture IBM eServer pseries de nouvelle génération, quintuplant la puissance de calcul disponible (voir communiqué de presse du CNRS daté du 19 février 2004).

Liste complète du Top 500 (novembre 2003)
http://www.top500.org/list/2003/11/

Notes
(1) Tero-op Reliable Intelligently-adaptive Processing System - Voir http://www.silicon.fr/click.asp?id=2201

(2) On aurait tout aussi bien pu choisir 1955, année du lancement de l'IBM 704, première machine commerciale disposant d'un coprocesseur mathématique, avec une puissance 5 kFLOPS (milliers d'opérations en virgule flottante par seconde). Elle utilisait une mémoire à tores de ferrite de 32768 mots de 36 bits, tores de ferrite, assurant une fiabilité à toute épreuve pour l'époque, car ne tombait en panne qu'une fois par semaine. C'est sur cette machine que sera développé le langage FORTRAN.

(3) Machine scientifique très puissante, conçue pour travailler efficacement sur les vecteurs. Elle possède des unités fonctionnelles permettant d'effectuer une même opération (par exemple une additionà sur un grand nombre de données (les deux composantes des deux vecteurs à additionner). Il suffit donc de préciser l'opération à effectuer et sur quelles données opérer pour que l'unité fonctionnelle exécute seule l'opération sur toutes les composantes des vecteurs à traiter. Si les unités fonctionnelles amélioraient alors grandement la puissance de traitement, les performances de la machine dépendaient beaucoup de la façon de la programmer (appelée vectorisation).
(4) Méthode de codage et de stockage des nombres réels dans les ordinateurs, pour qu'ils puissent les manipuler assez rapidement.
(5) Dite aussi MPP (Massively Parallel Computing. Le fonctionement de ces machines repose sur le principe que l'on peut décomposer un programme en un ensemble de tâches indépenantes, qui sont exécutées simultanéments sur des processeurs différents. Selon la manière dont les processus coopèrent au cours du traitement, on distingue les systèmes "fortements couplés" des systèmes "faiblement couplés".
(6) Si ce type de machine possède de très nombreux processeurs, la capacité mémoire de chacun d'entre eux est forcément inférieure à celle d'un processeur d'une machine vectorielle (qui lui, est très puissant).
(7) Voir http://www.apple.com/pr/library/2004/jan/06xgrid.html
(8) Voir notre éditorial du 7 janvier 2003

Pour en savoir plus :
Tebaldo : http://ww.tebaldo.com/observatoire.htm
JETRO : http://www.jetro.go.jp/top/index.html
Ville d'Osaka : Bureau de représentation à Paris http://www.osaka.fr/index_f.html



© Automates Intelligents 2004

 

   Sur le site
Sur le web   





 

 

 

Qui sommes nous ? Partenaires Abonnement Nous Contacter

© Association Automates Intelligents
Mention légale CNIL : 1134148