- DBpedia
-
DBpedia Développeur Université de Leipzig, Université libre de Berlin, OpenLink Software (en) Dernière version DBpedia 3.6[1] (23 Janvier 2007) [+/−] Environnement Virtuoso Universal Server (en), Scala (langage), Java (langage) Type Web sémantique, Linked Data (en) Licence GNU General Public License Site web www.dbpedia.org modifier DBpedia est un projet d'extraction de données de Wikipédia pour en proposer une version web sémantique structurée. Ce projet est mené par l'Université de Leipzig, l'Université libre de Berlin et l'entreprise OpenLink Software.
Sommaire
Contenu du dataset
DBpedia est interconnecté avec GeoNames, MusicBrainz, CIA World Factbook, le projet Gutenberg et Eurostat, entre autres[2].
En novembre 2010, la base de données décrit 3,4 millions d'entités, incluant au moins 312 000 personnes, 413 000 lieux, 94 000 albums de musique, 49 000 films, 15 000 jeux vidéo, 140 000 organisations (dont 31 000 sociétés et 31 000 établissements d'enseignement), 146 000 espèces et 4 600 maladies et contient 1 461 000 liens vers des images, 5,54 millions de liens vers des pages extérieures, 4,87 millions de liens vers des datasets externes, 565 000 catégories Wikipédia et 75 000 catégories YAGO[3].
Disponibilité
Le contenu de la base est disponible sous double licence Creative Commons BY-SA 3.0 et GFDL depuis la version 3.4. Bien que le contenu soit seulement dérivé de Wikipédia par des méthodes heuristiques et constitué de données structurées, les promoteurs adoptent depuis le lancement les mêmes licences que Wikipédia[4].
Technologies
Les informations étant stockées avec Resource Description Framework, on peut effectuer des requêtes sur la base de données via SPARQL.
Le moteur d'extraction de données est réalisé avec Scala[5], c'est un logiciel libre diffusé sous Licence publique générale GNU. Son code source est distribué : il est hébergé sur SourceForge.net et disponible via Subversion.
Notes et références
Annexes
Articles connexes
Liens externes
- (en) Site officiel
- (en) Accueil du projet DBpedia sur SourceForge.net
Catégories :- Base de données sémantique sur Internet
- Wikipédia
- Logiciel libre
Wikimedia Foundation. 2010.