Informatique répartie

Informatique répartie: Calcul distribué

Le calcul distribué ou réparti, consiste à répartir un calcul ou un système sur plusieurs ordinateurs distincts. Le calcul distribué est une forme de calcul parallèle, par contre il diffère des grappes de serveurs (computing clusters), en ce que les ordinateurs qui réalisent le calcul ne sont pas typiquement dédiés au calcul distribué et ne possèdent pas toujours les mêmes matériels et systèmes de fichiers, alors que les grappes (clusters) comprennent la plupart du temps du matériel spécifique et dédié à une tâche précise.

Sommaire

1 Système distribué

2 Exigences des systèmes distribués

3 Projets

4 Notes et références de l'article

5 Voir aussi

5.1 Quelques projets de calcul partagé

6 Ressources externes

Système distribué

Modèle d'un système distribué

Un système informatique distribué est une collection de postes ou calculateurs autonomes qui sont connectés à l'aide d'un réseau de communication. Chaque poste exécute des composantes, par exemple des séquences de calculs, issues du découpage d'un projet de calcul global, et utilise un intergiciel, qui s'occupe d'activer les composantes et de coordonner leurs activités de telle sorte qu'un utilisateur perçoive le système comme un unique système intégré.^[1]

Une propriété importante des systèmes distribués est que la distribution est généralement cachée pour l’utilisateur et les programmeurs de l’application. Il préfère voir l'ensemble comme un seul et unique système et ainsi cacher la complexité de la distribution le plus possible et augmenter la transparence du système distribué. Cela permet de développer le plus possible les applications de la même façon que les systèmes centralisés.

Un système distribué est généralement séparable en plusieurs composantes entièrement autonomes. Il n’existe pas de composante maître qui gère les autres et chacune est donc responsable de son propre fonctionnement. Cela permet, entre autres, d’avoir une hétérogénéité dans la technologie utilisée pour chaque composante, ils peuvent être écrits dans différents langages de programmation (Java, Cobol, C++, etc.) et s'exécuter sur différents systèmes d'exploitation (Mac OS X, Linux, Windows, etc.). L’autonomie des composantes fait que les systèmes sont exécutés simultanément (programmation concurrente). De plus, contrairement au système centralisé, les systèmes distribués possèdent plusieurs points de défaillances (problème de composantes, réseau, trafics, etc.).

Exigences des systèmes distribués

Le besoin d'utiliser un système distribué est souvent dérivé d'exigences non fonctionnelles soit :

Extensibilité ("scalability") - les systèmes distribués permettent facilement une expansion si nécessaire.

Ouverture - les composantes des systèmes distribués possèdent des interfaces bien définies ce qui leur permet d'être facilement extensibles et modifiables. Les services web sont un exemple de système distribué qui possède une grande ouverture.

Hétérogénéité – les composantes peuvent être écrites en différents langages sur différentes machines. Par exemple, les éléments d’un serveur peuvent être programmés en C++ et s'exécuter sous Unix, alors que le client peut être en Java et s'exécuter sous Windows.

Accès aux ressources et partage - les systèmes distribués fournissent un moyen de partager les ressources, c'est-à-dire à la fois le matériel, le logiciel et les données.

Tolérance aux pannes - Les systèmes distribués peuvent être plus tolérant aux pannes que les systèmes centralisés, car ils permettent de répliquer facilement les composantes.

Projets

Totalisation de la puissance de calcul des 500 meilleurs supercalculateurs mondiaux de 1993 à 2008. Source : TOP500.

Puissance de calcul des 500 meilleurs supercalculateurs mondiaux en novembre 2008 par pays ainsi que la puissance du calcul partagé.

Le projet « pionnier », dans l'emploi du calcul distribué est le SETI@Home, développé par l'Université de Berkeley, en Californie (États-Unis). Ce projet, développé en collaboration avec le programme SETI (Search for Extraterrestrial Intelligence), vise la détection d'une possible trace d'activité extraterrestre dans l'espace.

Cependant, le besoin croissant de puissance de calcul informatique dans la recherche médicale et autres domaines est surtout ce qui a suscité l'emploi de plus en plus important de cette technologie. Le coût des supercalculateurs étant trop élevé, il est ainsi envisagé d'utiliser la puissance de calcul « disponible » d'ordinateurs au repos (ou sous-utilisés). Le procédé consiste souvent en l'installation d'un logiciel qui télécharge des données brutes à partir d'un serveur, les retravaille (les « traite ») de façon transparente pour l'utilisateur (en n'utilisant que la puissance de calcul non utilisée par les autres applications), puis renvoie les résultats aux serveurs.

Certains systèmes de calcul distribué sont ouverts au public via internet (cf. Quelques projets de calcul partagé) et attirent facilement les utilisateurs. On peut voir l'évolution du projet depuis ses débuts, le classement des utilisateurs, le temps de calcul réalisé par les possesseurs d'une architecture donnée, ou par tel ou tel système d'exploitation (Linux, Windows, Macintosh...). Plusieurs de ces projets utilisent la plate-forme libre BOINC (Berkeley Open Infrastructure for Network Computing), une évolution du SETI@Home original.

Le calcul distribué est aussi un thème actif de recherche, avec une abondante littérature. Les plus connues des conférences sur le calcul distribué sont « The International Conference on Dependable Systems and Networks ^[2] » et « ACM Symposium on Principles of Distributed Computing ^[3] ». Il existe également la revue « Journal of Parallel and Distributed Computing ^[4] » .

Une part importante du génome humain a ainsi pu être décryptée par les internautes du programme « Decrypthon » de l'AFM ^[5] en collaboration avec le CNRS et IBM^[6]. Des projets sont également en cours, centralisés par le World Community Grid visant à l'analyse des protéines et à l'élaboration de solutions contre le sida.

La grande majorité des projets de ce type sont fait par des universités et/ou des professeurs très sérieux diffusants leurs résultats, le Décrypthon a par exemple contribué au décodage du génome humain qui est maintenant disponible sur internet sans brevet déposé ^[7].

Notes et références de l'article

↑ W. Emmerich (2000). Engineering distributed objets. John Wiley & Sons. Ltd.

↑ The International Conference on Dependable Systems and Networks. Consulté le 22 janvier 2008

↑ ACM Symposium on Principles of Distributed Computing. Consulté le 22 janvier 2008

↑ Journal of Parallel and Distributed Computing. Consulté le 22 janvier 2008

↑ AFM France. Consulté le 22 janvier 2008

↑ Les trois partenaires fondateurs du Décrypthon. Consulté le 22 janvier 2008

↑ National Center of Biotechnology Iinformation. Consulté le 22 janvier 2008

Voir aussi

Réseaux P2P

Intelligence distribuée

BOINC ainsi que Liste des projets BOINC

Ferme de rendu

Quelques projets de calcul partagé

Distributed.net : héberge de nombreux projets, dont l'un est la recherche des règles de Golomb optimales ;

SETI@home : recherche des signes d'une intelligence extra-terrestre ;

GIMPS : rechercher les nombres premiers de Mersenne ;

en:Genome@home : séquençage de protéines dans le génome humain, ce projet est achevé puisque la fin du séquençage du génome humain a été annoncée le 14 avril 2003. L'université de Stanford l'a remplacé par Folding@Home ;

Folding@Home : simulations de la manière dont les protéines se replient et se déplient sur elles-mêmes ;

Seventeen or Bust : Projet pour résoudre le problème de Sierpinski ;

Africa@Home : Projet de lutte contre le Paludisme ;

LHC@Home : Simuler la trajectoire de particules élémentaires dans l'accélérateur de particules du CERN près de Genève

Ressources externes

(en) Très large panel de projets utilisant le calcul distribué

(fr) Le calcul distribué sur Internet

(fr) Cours sur les systèmes répartis

Portail de l’informatique

Ce document provient de « Calcul distribu%C3%A9 ».

Catégories : Calcul distribué | Calcul parallèle | Programmation concurrente | Informatique distribuée

Contenu soumis à la licence CC-BY-SA. Source : Article Informatique répartie de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

RAID (Informatique) — Pour les articles homonymes, voir Raid. En informatique, le mot RAID désigne une technologie permettant de stocker des données sur de multiples disques durs afin d améliorer, en fonction du type de RAID choisi, la tolérance aux pannes et/ou les… … Wikipédia en Français
Raid (Informatique) — Pour les articles homonymes, voir Raid. En informatique, le mot RAID désigne une technologie permettant de stocker des données sur de multiples disques durs afin d améliorer, en fonction du type de RAID choisi, la tolérance aux pannes et/ou les… … Wikipédia en Français
Raid (informatique) — Pour les articles homonymes, voir Raid. En informatique, le mot RAID désigne une technologie permettant de stocker des données sur de multiples disques durs afin d améliorer, en fonction du type de RAID choisi, la tolérance aux pannes et/ou les… … Wikipédia en Français
RAID (informatique) — Pour les articles homonymes, voir Raid. Schéma de principe d une grappe de disques en RAID 5 En informatique, le mot RAID désigne les techniques permettant de répartir des données sur … Wikipédia en Français
FRAUDE INFORMATIQUE — En informatique, alors que les accidents sont mieux maîtrisés et les erreurs mieux contrôlées, la fraude et la malveillance constituent désormais, à l’aube du XXIe siècle, une des menaces les plus graves auxquelles est confrontée notre société.… … Encyclopédie Universelle
Mémoire répartie — Mémoire distribuée En informatique, et dans le cadre de systèmes multiprocesseurs, chaque processeur à sa propre mémoire. Lorsque la mémoire est répartie ou distribuée les processeurs ou les applications de chaque nœuds peuvent utiliser un réseau … Wikipédia en Français
Algorithmique répartie — Un algorithme réparti est généralement un algorithme parallèle (mais pas toujours, exemple, une communication téléphonique) réparti sur plusieurs sites. Chaque site calcule (i.e. produit de nouveaux résultats) et communique (i.e. échange des… … Wikipédia en Français
École supérieure de technologie et d'informatique — Nom original المدرسة العليا للتكنولوجيا والإعلامية Informations Fondation 9 juillet 2002 … Wikipédia en Français
École nationale supérieure d'informatique — École nationale supérieure d’informatique[1] Nom original المدرسة الوطنية العليا للإعلام الألي Informations … Wikipédia en Français
Ecole superieure de technologie et d'informatique — École supérieure de technologie et d informatique École supérieure de technologie et d informatique Informations Fondation 2002 Type Université publique Localisation Charguia II ( … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Informatique répartie

Calcul distribué

Sommaire

Système distribué

Exigences des systèmes distribués

Projets

Notes et références de l'article

Voir aussi

Quelques projets de calcul partagé

Ressources externes

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Informatique répartie

Calcul distribué

Sommaire

Système distribué

Exigences des systèmes distribués

Projets

Notes et références de l'article

Voir aussi

Quelques projets de calcul partagé

Ressources externes

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link