Web semantique

Web semantique

Web sémantique

Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C[1].

Sommaire

Historique

La notion de métadonnées utilisables par les machines fut proposée assez tôt dans l'histoire du Web, dès 1994 par son inventeur Tim Berners-Lee[2], lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles sont alors présentées comme une nécessaire représentation utilisable par les machines de l'information contenue dans les documents, par exemple le fait qu'une personne X est employée par une organisation Y.

Le développement de cette idée aboutit à la publication en 1999 de la première version de RDF (Resource Description Framework)[3], langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web.

Sur la base de RDF se sont ensuite développés des vocabulaires spécifiques destinés à des applications particulières, comme FOAF destiné à décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d'ontologie OWL, publiés dans leur forme finale en février 2004.

Au cours de cette évolution, la notion de ressource s'étend de son sens original de « document publié sur le Web » à des sens plus généraux et plus abstraits. Dans les langages d'ontologie ou le langage SKOS, en cours de développement, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l'indexation. À ce titre, les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l'environnement Web, permettant de transformer automatiquement les données en information, et les informations en savoir[4].

Principe général

Le Web sémantique est entièrement fondé sur le Web et ne remet pas en cause ce dernier. Le Web sémantique s'appuie donc sur la fonction primaire du Web « classique » : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.) mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :

  • générer des données sémantiques à partir de la saisie d'information par les utilisateurs ;
  • agréger des données sémantiques afin d'être publiées ou traitées ;
  • publier des données sémantiques avec une mise en forme personnalisée ou spécialisée ;
  • échanger automatiquement des données en fonction de leurs relations sémantiques ;
  • générer des données sémantiques automatiquement, sans saisie humaine, à partir de règles d'inférences.

Cadre de référence

Le Web sémantique est fondé sur les protocoles et langages standards du Web :

À ces standards s'ajoutent ceux qui sont propres au Web sémantique :

  • RDF : modèle conceptuel permettant de décrire toute donnée ;
  • RDF Schema : langage permettant de créer des vocabulaires, ensembles de termes utilisés pour décrire des choses ;
  • OWL : langage permettant de créer des ontologies, vocabulaires plus complexes servant de support aux traitements logiques (inférences, classification automatique…) ;
  • SPARQL : langage de requêtes pour obtenir des informations à partir de graphes RDF.

Ces quatre standards sont ouverts et issus du W3C. Ils forment l'ossature du Web sémantique.

Critiques

L'architecture, les outils et les concepts mêmes du Web sémantique ont été souvent critiqués. Certains analystes pensent que les principes d'organisation sur lesquels ils reposent sont applicables à l'échelle d'un système d'information fermé, comme une entreprise ou une bibliothèque, mais ne fonctionneront pas ou mal à l'échelle plus grande du Web, pour des raisons autant techniques que sociales[5],[6]. D'autres critiques ont reproché au W3C de consacrer trop de moyens au développement du Web sémantique, au détriment d'autres technologies comme les services Web[7].

Applications pratiques

Ces nouveaux protocoles de communication et langages standards permettent le développement de nouveaux usages qui rendent concrète la notion d'intelligence collective. C'est notamment le cas du « social bookmarking », de la recherche sociale (voir par exemple Lycos IQ [1]). Les wiki sémantiques permettent de créer des contenus en précisant leur sens et en caractérisant leurs relations via une syntaxe de type wiki.

Systèmes de question réponse

La recherche de données par requêtes en langage naturel et systèmes de question réponses est l'un des enjeux du web sémantique. La plupart des algorithmes des systèmes de questions-réponse reposent en effet sur l'usage intensif des étiquetages sémantiques (ou étiquetages par entités nommées). Comme illustré par le système de question-réponse EAGLi [2], appliqué aux sciences de la vie et de la santé.

Avec ces systèmes, l'utilisateur ne saisit plus dans un moteur de recherche une requête composée de terme décrivant l'objet de sa recherche (exemple « logiciel freeware traduction ») mais une question en clair, susceptible de produire un résultat de recherche construit et fruit d'un assemblage d'informations (exemple, « qui sont les auteurs classiques du XIXe »).

Les expériences menées actuellement, comme par exemple celle de DBpedia, en construisant des bases d'informations relationnelles décrivant le contenu sémantique de Wikipédia, permettent d'envisager la mise au point rapide de tels moteurs. On visitera par exemple Berlin SNORQL [3] pour imaginer ce que pourraient être ces applications.

Avancement en Europe

L'avancement du Web sémantique dans le monde est suivi par le W3C dans le cadre d'un projet Semantic Web Advanced Deployment (SWAD). Le projet SWAD-Europe s'est déroulé de mai 2002 à octobre 2004.

Voir : SWAD-Europe

L'organisme européen hôte des projets W3C et qui suit l'avancement du Web sémantique est ERCIM (European Research Consortium for Informatics and Mathematics).

Voir : Site officiel de l'ERCIM

C'est l'INRIA qui représente la France dans ERCIM.

Voir aussi

Liens internes

Liens externes

Notes et références

  • Portail sur Internet Portail sur Internet
Ce document provient de « Web s%C3%A9mantique ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Web semantique de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

  • Web sémantique — Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la …   Wikipédia en Français

  • Web sémantique et développement durable — Développement durable Schéma du développement durable : à la confluence de trois préoccupations, dites « les trois piliers du développement durable ». Le développement durable (ou développement soutenable, anglicisme tiré de… …   Wikipédia en Français

  • Semantique — Sémantique Linguistique Disciplines : Phonétique Phonologie Morphologie Syntaxe Lexicologie …   Wikipédia en Français

  • Web 2 — Web 2.0  Ne doit pas être confondu avec Internet2. Cartographie sensible du web 2.0 Le Web 2.0 désigne les technologies et les usages du …   Wikipédia en Français

  • Web 3 — Web 3.0 Le Web 3.0 désigne le futur du Web comme évolution du Web 2.0. Cette expression est un développement sur le terme Web 2.0 désignant l ensemble des transformations majeures dont le Web a fait l objet depuis son lancement. Elle est utilisée …   Wikipédia en Français

  • Web Ontology Language — Pour les articles homonymes, voir OWL. Web Ontology Language (OWL) est un langage de représentation des connaissances construit sur le modèle de données de RDF. Il fournit les moyens pour définir des ontologies web structurées. Le langage OWL est …   Wikipédia en Français

  • Sémantique — La sémantique est une branche de la linguistique qui étudie les signifiés. Le mot sémantique est dérivé du grec σημαντικός (semantikos), « signifié » lui même formé à partir de σημαίνω (semaino), « signifier, indiquer » ou… …   Wikipédia en Français

  • Web des données — Le Web des données (Linked Data, en Anglais) est une initiative du W3C (Consortium World Wide Web) visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en… …   Wikipédia en Français

  • Web 3.0 — L expression Web 3.0 est utilisée en futurologie à court terme pour désigner l internet qui suit le web 2.0 et constitue l étape à venir du développement du World Wide Web. Son contenu réel n est pas défini de manière consensuelle, chacun l… …   Wikipédia en Français

  • Web 2.0 —  Ne doit pas être confondu avec Internet2. Cartographie sensible du web 2.0 …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”