- Web sémantique
-
Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C[1].
Sommaire
Historique
La notion de métadonnées utilisables par les machines fut proposée assez tôt dans l'histoire du Web, dès 1994 par son inventeur Tim Berners-Lee[2], lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles sont alors présentées comme une nécessaire représentation utilisable par les machines de l'information contenue dans les documents, par exemple le fait qu'une personne X est employée par une organisation Y.
Le développement de cette idée aboutit à la publication en 1999 de la première version de RDF (Resource Description Framework)[3], langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web.
Sur la base de RDF se sont ensuite développés des vocabulaires spécifiques destinés à des applications particulières, comme FOAF destiné à décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d'ontologie OWL, publiés dans leur forme finale en février 2004.
Au cours de cette évolution, la notion de ressource s'étend de son sens original de « document publié sur le Web » à des sens plus généraux et plus abstraits. Dans les langages d'ontologie ou le langage SKOS, en cours de développement, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l'indexation. À ce titre, les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l'environnement Web, permettant de transformer automatiquement les données en information, et les informations en savoir[4].
Principe général
Le Web sémantique est entièrement fondé sur le Web et ne remet pas en cause ce dernier. Le Web sémantique s'appuie donc sur la fonction primaire du Web « classique » : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.) mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :
- générer des données sémantiques à partir de la saisie d'information par les utilisateurs ;
- agréger des données sémantiques afin d'être publiées ou traitées ;
- publier des données sémantiques avec une mise en forme personnalisée ou spécialisée ;
- échanger automatiquement des données en fonction de leurs relations sémantiques ;
- générer des données sémantiques automatiquement, sans saisie humaine, à partir de règles d'inférences.
Cadre de référence
Le Web sémantique est fondé sur les protocoles et langages standards du Web :
- le protocole HTTP ;
- les Uniform Resource Identifiers (URI) ;
- le langage XML (dans le cas, majoritaire, où RDF est sérialisé en XML).
À ces standards s'ajoutent ceux qui sont propres au Web sémantique :
- RDF : modèle conceptuel permettant de décrire toute donnée ;
- RDF Schema : langage permettant de créer des vocabulaires, ensembles de termes utilisés pour décrire des choses ;
- OWL : langage permettant de créer des ontologies, vocabulaires plus complexes servant de support aux traitements logiques (inférences, classification automatique…) ;
- SPARQL : langage de requêtes pour obtenir des informations à partir de graphes RDF.
Ces quatre standards sont ouverts et issus du W3C. Ils forment l'ossature du Web sémantique.
Critiques
L'architecture, les outils et les concepts mêmes du Web sémantique ont été souvent critiqués. Certains analystes pensent que les principes d'organisation sur lesquels ils reposent sont applicables à l'échelle d'un système d'information fermé, comme une entreprise ou une bibliothèque, mais ne fonctionneront pas ou mal à l'échelle plus grande du Web, pour des raisons autant techniques que sociales[5],[6]. D'autres critiques ont reproché au W3C de consacrer trop de moyens au développement du Web sémantique, au détriment d'autres technologies comme les services Web[7].
Applications pratiques
Ces nouveaux protocoles de communication et langages standards permettent le développement de nouveaux usages qui rendent concrète la notion d'intelligence collective. C'est notamment le cas du « social bookmarking », de la recherche sociale (voir par exemple Lycos IQ [1]). Les wiki sémantiques permettent de créer des contenus en précisant leur sens et en caractérisant leurs relations via une syntaxe de type wiki.
Systèmes de question réponse
La recherche de données par requêtes en langage naturel et systèmes de question réponses est l'un des enjeux du web sémantique. La plupart des algorithmes des systèmes de questions-réponse reposent en effet sur l'usage intensif des étiquetages sémantiques (ou étiquetages par entités nommées). Comme illustré par le système de question-réponse EAGLi [2], appliqué aux sciences de la vie et de la santé.
Avec ces systèmes, l'utilisateur ne saisit plus dans un moteur de recherche une requête composée de termes décrivant l'objet de sa recherche (exemple « logiciel freeware traduction ») mais une question en clair, susceptible de produire un résultat de recherche construit et fruit d'un assemblage d'informations (exemple, « qui sont les auteurs classiques du XIXe »).
Les expériences menées actuellement, comme par exemple celle de DBpedia, en construisant des bases d'informations relationnelles décrivant le contenu sémantique de Wikipédia, permettent d'envisager la mise au point rapide de tels moteurs. On visitera par exemple Berlin SNORQL [3] pour imaginer ce que pourraient être ces applications.
Avancement en Europe
L'avancement du Web sémantique dans le monde est suivi par le W3C dans le cadre d'un projet Semantic Web Advanced Deployment (SWAD). Le projet SWAD-Europe SWAD-Europe s'est déroulé de mai 2002 à octobre 2004.
L'organisme européen hôte des projets W3C et qui suit l'avancement du Web sémantique est ERCIM (European Research Consortium for Informatics and Mathematics).
Voir aussi
Articles connexes
Liens externes
- Web sémantique (wiki accueillant tous les publics intéressés par le Web sémantique)
- Le web sémantique - traduction par Élisabeth Lacombe et Jo Link-Pezet de l'article de Tim Berners-Lee, James Hendler, Ora Lassila.
- Julien Plu, Introduction au Web sémantique
- (en) Semantic Web (portail officiel du Web sémantique sur le site du W3C)
- (en) Canadian Semantic Web Interest Group et le Canadian Semantic Web Working Symposium
- Alexandre Monnin, Qu'est-ce que le Web Sémantique ?, long billet publié sur le C/blog du Ministère de la Culture et de la Communication.
Notes et références
- W3C Semantic Web Activity
- Notes de Tim Berners-Lee pour la conférence WWWF94, Genève
- RDF Model and Syntax Specification W3C Recommendation - Février 1999
- Introduction to Data, Information, Knowledge - Semanticweb.org (en)
- « L'ontologie est surfaite », par Clay Shirky
- Sept Illusions de la Méta Utopie
- « L'éclosion des services web coince sur les standards » (ZDNet, mars 2002)
Wikimedia Foundation. 2010.