- SETI@home
-
SETI@home ("SETI at home", pouvant se traduire par « SETI à la maison ») est un projet de calcul distribué utilisant des ordinateurs branchés sur l'Internet. Il est hébergé par le Space Sciences Laboratory de l'Université de Californie, Berkeley. SETI est un acronyme pour Search for Extra-Terrestrial Intelligence (que l'on pourrait traduire par « Recherche d'une intelligence extraterrestre »). SETI@home est accessible au public depuis le 17 mai 1999[1],[2],[3].
Sommaire
Recherche scientifique
Il y avait deux buts originaux à SETI@home. Le premier était de prouver la fonctionnalité et la viabilité du calcul distribué. Le deuxième était de faire du travail scientifique en supportant une analyse observationnelle cherchant à détecter de la vie intelligente non terrestre.
Le premier but est généralement considéré comme complètement atteint. La plate-forme BOINC, un développement du SETI@home original, supporte plusieurs projets de calcul distribué dans un vaste éventail de disciplines.
Le deuxième but est, jusqu'ici, un échec. Aucune preuve de signal radio extraterrestre n'a été trouvée par SETI@home. Cependant, une absence de preuve n'étant pas une preuve d'absence, le projet se poursuit.
SETI@home effectue la recherche de transmission radio extraterrestre à partir des observations faites par le radiotélescope d'Arecibo, Puerto Rico. Les données sont prises "passivement" pendant que le télescope est utilisé pour d'autres projets scientifiques. Elles sont numérisées, emmagasinées et expédiées aux installations de SETI@home en Californie. Par la suite, elles sont divisées en petites unités de fréquence et temps qui sont analysées à l'aide d'un logiciel afin d'y déceler un signal, c'est-à-dire une variation qui se distingue du bruit cosmique et qui contient de l'information.
Le point crucial de SETI@home est que les millions d'unités produites sont envoyées à des ordinateurs personnels qui utilisent le logiciel et qui, une fois l'analyse terminée, retournent les résultats à la source. Ainsi, une analyse de données nécessitant un temps de calcul faramineux pour un seul ordinateur devient faisable par la "distribution" de la tâche à une grande communauté d'internautes.
Le logiciel recherche quatre types de signaux[réf. nécessaire] qui pourraient se distinguer du bruit cosmique :
- Des pics dans la densité spectrale de puissance,
- Des montées et descentes de forme gaussienne dans la puissance de transmission, qui pourraient représenter le passage du lobe principal du radiotélescope sur une source radio,
- Des triplets (trois pics de puissance dans un rang),
- Des modulations du signal qui pourraient représenter une transmission à bande étroite.
Un signal radio extraterrestre peut être affecté de bien des manières par le milieu interstellaire et par le mouvement de la source par rapport à la Terre. Le signal potentiel est donc traité de plusieurs façons (bien que toutes les méthodes de détection ne soient pas exploitées) afin d'avoir les meilleures chances possibles de le distinguer du bruit cosmique ambiant. Un signal radio extraterrestre intelligent provenant d'une autre planète ayant une vitesse et une accélération différente de la Terre subira une variation de fréquence en fonction du temps. Le logiciel SETI@home recherche également ces variations.
Le logiciel fonctionne un peu comme lorsque l'on tourne le bouton de fréquence d'un poste de radio pour capter différents canaux. Si le signal augmente, cela attire l'attention. De manière plus technique, le logiciel implique quantité d'analyses digitales, principalement via des transformées de Fourier discrètes avec des chirps de périodes et durées différentes.
Résultats
Bien que le projet n'ait détecté aucun signal d'une intelligence extraterrestre, il a identifié plusieurs candidats à certains endroits dans le ciel où des pics d'intensité sont difficilement attribuables à du bruit cosmique[4]. Ces positions ont été notées pour analyses ultérieures. À ce jour, le principal candidat a été annoncé le 1er septembre 2004, il se nomme Radio source SHGb02+14a.
L'astronome Seth Shostak a affirmé[5], en se basant sur l'équation de Drake, qu'il s'attend à obtenir un signal concluant entre 2020 et 2025. Ceci signifierait que, malgré l'insuccès du projet durant près de dix ans, un effort prolongé pourrait être fructueux.
Bien que le projet n'ait pas atteint le but de trouver une intelligence extraterrestre, il a prouvé à la communauté scientifique que les projets de calcul distribué, utilisant des ordinateurs personnels connectés à l'Internet, sont des outils d'analyse considérables qui peuvent rivaliser avec les plus puissants superordinateurs[6].
Technologie
N'importe qui possédant un ordinateur ayant un accès à l'Internet peut participer à SETI@home en exécutant un programme gratuit qui télécharge et analyse les données d'un radiotélescope.
Les données sont enregistrées sur des rubans de 36 Go à l'Observatoire d'Arecibo, Puerto Rico. Chacun des disques possède 15,5 heures d'observations qui sont par la suite envoyées à Berkeley[7]. Arecibo n'ayant pas de connexion Internet à large bande passante, les données doivent être envoyées par la poste.
Une fois à Berkeley, les données sont divisées en unités de temps et de fréquence de 107 secondes[8] (approximativement 0,35 Mo). Ces "unités de travail" (work units) sont alors envoyées partout dans le monde, via l'Internet et à partir du serveur de SETI@home, afin d'être analysées.
Le logiciel d'analyse peut rechercher des signaux ayant le dixième de la force de ceux qui pouvaient être détectés lors d'autres recensements. Ceci s'explique par l'utilisation d'un algorithme informatique puissant nommé coherent integration (que l'on pourrait traduire par intégration cohérente) qui demande une puissance de calcul que nul autre projet SETI n'aurait.
Les unités de travail analysées sont normalement renvoyées automatiquement à Berkeley. Elles y sont stockées dans une banque de données par des ordinateurs dédiés au projet. Les interférences sont éliminées et une panoplie d'algorithmes est utilisée afin de chercher les signaux les plus intéressants.
Logiciel
Le logiciel de calcul distribué SETI@home fonctionne soit sous forme d'écran de veille, soit de manière continue pendant que l'utilisateur travaille, utilisant une certaine puissance du processeur qui ne serait pas utilisée autrement.
La plate-forme initiale supportant le logiciel, nommée désormais "SETI@home classique" (SETI@home classic), fut utilisée du 17 mai 1999 au 15 décembre 2005. Elle ne pouvait faire fonctionner que le projet SETI@home. Elle a été remplacée par le Berkeley Open Infrastructure for Network Computing (BOINC, pouvant se traduire par "Infrastructure ouverte de Berkeley pour le calcul distribué ") qui permet aux utilisateurs d'analyser plus de types de signaux et de participer à d'autres projets de calcul distribué en même temps que celui de SETI@home.
La discontinuation du SETI@home classique a empêché les ordinateurs Macintosh utilisant des systèmes d'exploitation pré-OS X de pouvoir participer au projet.
Le 3 mai 2006, de nouvelles unités de travail pour une nouvelle version de SETI@home, appelée "SETI@home Augmenté" (SETI@home Enhanced), ont été distribuées. Ainsi, les ordinateurs fournissent la puissance pour un travail beaucoup plus intensif qu'à l'origine du projet. Cette nouvelle version est deux fois plus sensible aux signaux gaussiens ainsi qu'à certains types de signaux modulés que la version originale (BOINC) du logiciel. Elle a été optimisée au point où elle analyse plus rapidement que les versions précédentes certaines unités de travail. Cependant, d'autres unités de travail (les meilleures, scientifiquement parlant) vont demander un temps d'analyse plus long.
Certaines applications de SETI@home, optimisées pour des types particuliers de processeurs, furent accessibles. On y réfère comme étant les « exécutables optimisés » (optimized executables). En 2008, la plupart de ces applications sont optimisées pour les processeurs Intel[9].
SETI@home a également été utilisé comme outil pour effectuer des tests de performance sur des stations de travail. Plus précisément comme test en stress en utilisant le processeur à puissance maximale pendant une période soutenue. Cela est particulièrement utile pour le surfréquençage.
Statistiques
Avec plus de 5,2 millions de participants depuis son lancement, ce projet de calcul distribué est celui qui a recueilli le plus de participants jusqu'ici. On est bien au-dessus des intentions initiales, qui visaient l'utilisation de 50 000 à 100 000 ordinateurs personnels. Depuis le 17 mai 1999, le projet a accumulé plus de deux millions d'années de temps d'analyse d'ordinateur.
Grâce aux 2,8 millions d'ordinateurs utilisés au 26 février 2011, dont plus de 243 000 actifs[10], SETI@home a une puissance de calcul de 509 TeraFLOPS[11]. En comparaison, un des superordinateurs les plus puissants du monde, K computer, obtient une vitesse de 8 162 TeraFLOPS.
Futur
Mises-à-jour de l'Observatoire d'Arecibo
Observatoire de Parkes
Des annonces avaient été faites concernant la possible utilisation de l'Observatoire de Parkes en Australie afin d'analyser l'hémisphère sud[12]. Cependant, cette idée semble avoir été abandonnée (on n'y fait plus mention sur le site Internet du projet).
Aspect compétitif
Les utilisateurs de SETI@home sont rapidement entrés en compétition les uns contre les autres pour déterminer qui analysera le plus d'unité de travail. Chaque unité de travail analysée est créditée et compilée statistiquement par le projet. Des équipes se sont formées pour combiner les efforts individuels. La compétition s'est poursuivie et s'est étendue avec l'avènement de BOINC.
Comme pour toute compétition, des tentatives de tricherie ont été faite pour obtenir le crédit d'analyses qui n'ont pas été faites. Pour contrer cela, toutes les unités de travail sont envoyées à plusieurs ordinateurs par SETI@home. On appelle cela la "réplication initiale" ("initial replication"). Au départ, on envoie les unités à 3 ordinateurs différents. L'unité de travail est créditée au moment où il y a au moins deux réplications qui ont été retournées et qui présentent des résultats cohérents entre eux. On appelle cela "quorum" ("minimum quorum"). Si suite à des erreurs de traitement informatique ou à une tricherie par soumission de fausses analyses, les résultats ne sont pas cohérents, des répliques supplémentaires sont envoyées jusqu'à ce que le quorum soit atteint. Le même crédit final est alors accordé à toutes les machines qui ont retourné le résultat correct. Puisque le crédit d'analyse varie parfois légèrement d'un ordinateur à l'autre ( à cause de différences mineures entre les processeurs[réf. nécessaire]), le crédit final accordé correspond au plus petit crédit réclamé.
Certains utilisateurs ont installé et fait fonctionner SETI@home sur des ordinateurs de leur milieu de travail. Cette action est nommée, en anglais, "borging", d'après les Borgs, une race de créatures assimilatrices de l'univers de science-fiction Star Trek. Dans au moins un cas[13], ceci a mené au licenciement d'un employé.
D'autres utilisateurs ont accumulé de grandes quantités d'équipement à la maison pour créer des « fermes SETI » (« SETI farms »). Elles consistent normalement en une série d'ordinateurs empilés, sans moniteurs, et n'ayant qu'une carte mère, un processeur, de la mémoire vive et une alimentation électrique ainsi que jusqu'à 4 cartes graphiques PCIE par machine.
Accélération matérielleLes utilisateurs de BOINC ont la possibilité d'accélérer par un facteur 10 à 20 la puissance des calculs SETI de leurs machines grâce à l'utilisation de l'accélération CUDA disponible sur les cartes graphiques de marque NVIDIA. En effet si les processeurs récents contiennent 2, 4 ou 6 cores, les GPU modernes présent sur les cartes graphiques en contiennent plusieurs centaines (336 cores sur une GTX460, 384 cores sur une GTX560 TI) ce qui explique leur puissance inégalé pour des calculs massivement parallèles. La liste des cartes compatibles CUDA est disponible ici: http://www.nvidia.fr/object/cuda_gpus_fr.html
Accélération logicielle
De plus les utilisateurs de BOINC peuvent aussi selon leur configuration hardware machine installer des librairies de calculs SETI très optimisés à la fois pour CPU et GPU permettant encore un gain supplémentaire important. Ces applications optimisées sont disponibles entre autres sur le site suivant:
Téléchargement ici: http://lunatics.kwsn.net/index.php?module=Downloads
les explications en français sont ici http://boinc-af.org/breves/1259-mises-a-jour-de-lapplication-doptimisation-pour-seti.html
Un autre avantage de ces applications optimisés SETI non officielles est notamment la possibilité de faire tourner SETI sur des 'GPU ATI ce que ne permettait pas jusqu'à présent les applicatifs officiels de Berkeley. Ce type d'installation pour les GPUs ATI nécessite une procédure précise et minutieuse même si elle est relativement rapide à mettre en place. Toutes les explications sont en ligne sur le site des lunatics et un forum d'aide est disponible du côté de la plateforme applicative BOINC. Il est avisé avant d'installer ces applications optimisés de renvoyer toutes les unités déjà calculées vers Berkeley et de sauvegarder celles en attente pour éviter leur perte en cas de fausse manipulation.
Les GPUs GeForce de la séries 6,7,8,9,1xx,2xx,3xx,4xx,et 5xx permettent l'utilisation de CUDA 4.0 à condition d'installer la dernière version des pilotes (supérieure à 270.xx) disponible sur le site de NVIDIA. Les explications en français pour l'installation de CUDA 4.0 pour GPU NVIDIA se trouvent ici : http://boinc-af.org/actualites-astronomie/1311-setihome-cuda-4-pour-nvidia.html
Accélération du calcul (X10 attendu) par tri des blocsLorsque les unités de calculs sont calculés à la fois sur GPU et CPU avec BOINC il est possible aussi de les trier afin d'accélérer encore la vitesse des calculs. Ce gain est obtenu en redirigeant toutes les unités de calculs VLAR et VHAR destiné aux GPU vers les CPU. Sur les blocs normaux les GPU vont jusqu'à 20 fois plus vite que sur les CPU. Par contre pour ce type de bloc de calcul VHAR mais surtout VLAR le rendement sur GPU chute dramatiquement ce qui rends sans intérêt leur exécution sur GPU car les CPU les traitent quasiment tout aussi rapidement. Même si la proportion d'unité VHAR/VLAR varie selon les moments et peut ponctuellement être faible, leur exécution sur les GPU est très pénalisant sauf si on procède à ce tri qui peut être automatisé par des logiciels adéquats.
Exemples de gain : (CPU à 3 GHz avec 2 cores et GPU à 800 MHz GTX560TI avec 384 cores)
- temps d'exécution d'une unité de calcul SETI non VHAR/VLAR sur GPU GTX560TI : 5 à 25 minutes
- temps d'exécution d'une unité de calcul SETI non VHAR/VLAR sur CPU à 3 GHz : 60 à 300 minutes
Le temps d'exécution d'une unité de calcul SETI VHAR/VLAR sera sensiblement identique sur un CPU à 3 Ghz et sur un GPU GTX560TI de référence. Mais durant le temps ou le calcul du bloc VHAR/VLAR redirigé se fera sur CPU, le GPU pourra traiter plusieurs dizaines de blocs de calculs non VHAR/VLAR d'où une accélération X10 minimum attendue !!
GPU à architecture non FERMI: (GeForce de la série 6, 7, 8, 9, 1xx, 2xx, 3xx ; exemple GTX260)
Logiciel de tri d'unités de calculs SETI automatisé recommandé : ReSchedule 1.9
Téléchargement ici : http://lunatics.kwsn.net/index.php?action=dlattach;topic=626.0;id=2748
Attention ce programme ne fonctionne pas avec les GPU FERMI, et son développement étant actuellement gelé ses éventuels bugs ne seront pas corrigés...
GPU à architecture FERMI : (GeForce de la serie 4xx et 5xx ; exemple : GTX460) logiciel de tri d'unités de calculs SETI recommandé : boinc_rescheduler_2_5 utilisation manuelle : arrêt obligatoire des calculs SETI, puis lancement du tri puis reboot de la machine
Utilisez selon votre système d'exploitation : BOINC Rescheduler64.exe, BOINC Rescheduler.exe, BoincReschedulerW2k.exe instructions ici : http://www.efmer.eu/forum_tt/index.php?action=printpage;topic=428.0
Téléchargement ici : http://www.efmer.eu/download/boinc/scheduler/boinc_rescheduler_2_5.zip
L'utilisation de ces logiciels ne requière pas de connaissances informatique précises mais un respect scrupuleux des procédures d'utilisation mises en ligne pour éviter des pertes inutiles d'unités de calculs en cache qui seraient dommageable pour le projet SETI. Pour cela il faut s'informer des procédures, des incompatibilités entre OS ou versions d'applications optimisés et de leur évolutions sur des pages de forum comme celles-ci :
http://setiathome.berkeley.edu/forum_thread.php?id=60079&nowrap=true#1006116
Menaces au projet
Comme pour tout projet à long terme, il y a plusieurs facteurs qui pourraient menacer la poursuite de SETI@home. Quelques-uns d'entre eux sont détaillés ci-après.
Fermeture potentielle de l'observatoire d'Arecibo
Pour le moment, SETI@home obtient ses données brutes des installations de l'Observatoire d'Arecibo. Ces dernières sont opérées par le National Astronomy and Ionosphere Center, administré par l'Université Cornell. La baisse du budget d'opération de l'observatoire a créé un manque à gagner qui n'a pas (encore ?) été compensé par d'autres sources telles des donateurs privés, la NASA, d'autres institutions de recherche étrangères ou associations à but non lucratif comme SETI@home. Ce manque tourne aux alentours de 2 5 millions de dollars américain.
Sans les fonds nécessaires, la National Science Foundation a clairement fait savoir que l'observatoire fermera en 2011, ce qui coupera la source des données de SETI@home.
Projets alternatifs de calcul distribué
Lorsque le projet fut lancé, il y avait peu d'autres projets de recherche auxquels il était possible de donner du temps d'ordinateur. Il existe aujourd'hui beaucoup d'autres projets similaires (surtout depuis le lancement de la plate-forme BOINC) avec lesquels SETI@home est en concurrence.
Politiques plus sévères d'utilisation des ordinateurs de compagnies
En date du 16 octobre 2005, approximativement un tiers de l'analyse des unités de travail sur les versions pré-BOINC du logiciel étaient faites à partir d'ordinateurs situés au travail ou à l'école[14]. Des politiques plus sévères concernant l'utilisation des ordinateurs professionnels (en dehors de la « maison ») pourraient donc nuire au projet. Rappelons que, dans au moins un cas, une personne fut renvoyée suite à l'installation et l'utilisation non autorisées de SETI@home sur des ordinateurs utilisés par l'État de l'Ohio[15].
Fonds
En 2011, il n'y a pas de fonds gouvernementaux consacrés à la recherche SETI. Des dons privés, ainsi que l'aptitude du Berkeley Space Science Lab à fonctionner avec de petits budgets, ont permis à SETI@home de se poursuivre bien au-delà de la durée initiale prévue pour le projet. Il reste cependant en concurrence, pour l'obtention de fonds, avec d'autres projets SETI, ainsi qu'avec des projets de sciences spatiales.
Piratage et Fraudes
Certains individus et compagnies ont fait des changements non officiels à la partie distribuée du logiciel pour tenter de produire des analyses plus rapidement. Ceci a compromis l'intégrité de l'ensemble des résultats[16]. En conséquence, le logiciel a dû être mis à jour pour mieux détecter de tels changements. Bien que SETI@home ne soit pas à l'abri des analyses trafiquées, il se protège de ces dernières par l'analyse de la cohérence entre les résultats d'analyses d'une même unité de travail par plusieurs ordinateurs différents[17].
Autres projets de calcul distribué
Article détaillé : Liste des projets BOINC.Le calcul distribué est aussi utilisé pour la recherche médicale avec, entre autres, des projets recherchant des traitements pour le SIDA (FightAIDS@home) et étudiant le repliement de protéine dans diverses configurations de température et de pression (Folding@home). Depuis l'arrivée de la plate-forme BOINC, les utilisateurs peuvent diviser le temps de travail de leur ordinateur entre différents projets en accordant à chacun un pourcentage donné du temps de processeur.
Voir aussi
- SETI
- Calcul distribué
- BOINC
- Liste des projets BOINC
- Einstein@Home
- Folding@home
- PlanetQuest
- Rosetta@home
- Distributed.net
- Grille informatique
Notes et références
- (en)Dr. Tony Phillips, « ET, phone SETI@home! », NASA, 23 mai, 1999. Consulté le 2006-10-06
- (en)Robert Nemiroff, Jerry Bonnell, « Astronomy Picture of the Day », 17 mai, 1999. Consulté le 2006-10-06
- (en)SETI@home Classic: In Memoriam, 15 décembre, 2005. Consulté le 2006-10-06
- (en)Page des signaux candidats sur le site Internet du SETI@home classique
- (en) Shostak, Seth : First Contact Within 20 Years: Shostak, Space Daily (2004-07-22). Consulté le 2006-06-12.
- (en)BOINCstats | BOINC combined - Credit overview
- (en)Eric Korpela, « SETI@home - Massively Distributed Computing for SETI », dans Computing in Science & Engineering, janvier 2001, p. 78-83 [texte intégral]
- (en)SETI@home, « The SETI@home Sky Survey », 2001. Consulté le 2006-06-02
- (en)Seti@Home optimized science apps and information
- Seti@Home - Vue d'ensemble des oridnateurs sur BOINCstats. Consulté le 26 février 2011
- Statistiques sur BOINCstats. Consulté le 26 février 2011
- (en)Southern Hemisphere Search - increasing SETI@home's sky coverage sur la page "Future directions of SETI@home" du site Internet du SETI@home classique
- (en)Foreman, Liz : State Employee Fired For Using State Property To Search For Aliens, Associated Press (2004-10-08).
- (en)SETI@home, « SETI@home computer venues », 2005. Consulté le 2006-06-12
- (en)Knock Down, Then Kick - O'Reilly Databases
- (en)Molnar, David, « The SETI@Home Problem », 2000. Consulté le 2006-06-02
- (en)SecurityIssues - BOINC - Trac
Wikimedia Foundation. 2010.