- Données ouvertes
-
Une donnée ouverte (en anglais open data) est une information publique brute, qui a vocation à être librement accessible. La philosophie pratique de l'open data préconise une libre disponibilité pour tous et chacun, sans restriction de copyright, brevets ou d'autres mécanismes de contrôle.
En informatique, l’open data est une information structurée publique ou privée et généralement non utilisable par un humain mais interprétable par une machine.
Sommaire
Mouvements culturels et politiques
Mouvements culturels
L'ouverture des données est une philosophie visant à rendre certaines données accessibles à tous et s’affranchir des restrictions imposées par les licences payantes parfois mises en place par les personnes publiques ou autres formes de contrôle qui en limitent notamment l’exploitation et la reproduction. Les données ouvertes sont applicables à tout type d'information publique[1] et par analogie et sous certaines conditions à des œuvres protégées par le droit d’auteur, des œuvres littéraires, artistiques et scientifiques, œuvres cinématographiques, dessins, photographies, sites internet, à l’exception des logiciels qui connaissent leur propre mouvement avec les logiciels libres.
Les données ouvertes sont assimilées au terme plus général d’Open knowledge[2] par l’Open Knowledge Foundation qui le définit comme étant une connaissance, c'est-à-dire une œuvre, notamment musicale, cinématographique ou des données tel qu'un article scientifique, une donnée géographique, gouvernementale ou administrative. Le terme Open est défini comme la liberté d’utiliser, de réutiliser, de redistribuer plus ou moins librement l’œuvre originale. Elles s'inscrivent dans une démarche plus vaste de transparence et de participation des citoyens que l’on retrouve dans toutes les politiques d’ouverture des droits et qui se manifeste parfois par l’acronyme ODOSOS[3] (pour open data, open source et open standards (en)), démarche elle même comprise dans le mouvement plus général de l’innovation ouverte.
Elles concernent les données du secteur public avec les notions de e-gouvernement ou encore d’e-démocratie, puis particulièrement celles des instituts de recherche scientifique avec la libre diffusion des résultats de recherches. On parle dans ce contexte d’Open Access dont la première définition a été donnée par la Déclaration internationale sur le libre accès de Budapest en 2001 qui constitue un véritable appel lancé aux chercheurs et visant à encourager leur participation au mouvement du partage gratuit de la production scientifique[4].
De là, de nombreuses autres initiatives vont voir le jour ailleurs dans le monde avec la Déclaration de Berlin de 2003 sur le libre accès à la connaissance en sciences et sciences humaines[5] ; suivi en mars 2005, depuis Southampton, d’une nouvelle Déclaration appelée Berlin III visant à renforcer les mesures adoptées dans le cadre de Berlin I.
Cela va notamment prendre la forme d'un projet pour le séquençage du génome humain avec un Open data Consortium[6] crée sur proposition de Jim Kent (en) en 2003 et dont les premiers bénéficiaires vont être les pays en voie de développement, dans lesquels les universités et centres de recherche n’ont pas toujours accès aux périodiques scientifiques.
A côté du mouvement de l’open science data, les données ouvertes vont être étendues au secteur privé, avec certaines organisations à but non lucratif ou certaines entreprises[7] qui s'orientent vers le libre en choisissant des licences plus ou moins permissives pour les informations qu'elles génèrent, par exemple des articles, des études, même des œuvres artistiques et qui dépassent donc le simple droit d'accès aux documents administratifs.
La libération des données publiques connait un regain d’intérêt dans le secteur public qui multiplie les mesures en faveur de davantage de transparence vis-à-vis des citoyens et vise à satisfaire leur volonté de participer à la vie de la Communauté et d’exercer leur droit d’être informé. C'est le principe des externalités positives. Ces initiatives entrent dans le cadre de l’exercice du droit d'accès des personnes aux documents administratifs prévu en France par la loi du 17 juillet 1978[8] puis par la directive 2003/98/CE du Conseil de l'Europe du 17 novembre 2003 sur la réutilisation des données publiques[9].
Tendances publiques, associatives, politiques et entreprenariales...
Les données publiques ouvertes ont vu le jour aux États-Unis dès 1966 avec l'adoption de la loi sur le libre accès à l'information, la Freedom of Information Act[10], amendée plusieurs fois notamment en 2007 par la loi OPEN Government Act[11]. Le phénomène a pris une place considérable au sein du gouvernement après les évènements du 11 septembre 2001.
La libération des données s'est développée de manière formelle au niveau d'un État puis au niveau fédéral avec l’élection de Barack Obama, qui, dès son investiture à dévoilé son intention de « créer un niveau d’ouverture du gouvernement sans précédent », dans le but de « renforcer la démocratie et promouvoir son efficacité et son effectivité au sein du gouvernement »[12]. En mars 2009, le projet data.gov (en) est lancé, puis en décembre de la même année la Directive du gouvernement ouvert[13] est publiée et pose les trois piliers de la coopération entre l'État et les citoyens qui sont la transparence du gouvernement, la participation et la collaboration. Vivek Kundra, premier responsable fédéral des systèmes d'informations (Chief Information Officer) dans l'administration Obama, observe que « la libération de ces données a donné naissance à une économie des applications […] on assiste à une explosion de ces communautés de développeurs ».
Au Royaume Uni, un projet analogue[14] a officiellement été lancé en janvier 2010, par Gordon Brown et sous l'impulsion de Tim Berners-Lee. Le projet oblige le gouvernement à publier, entre autres, toute dépense supérieure à 25 000 livres sterling en utilisant les technologies du Web sémantique que Tim Berners-Lee met en œuvre depuis 10 ans.
En France, l'ouverture s'est faite dans domaine du droit en 2002[15] (8 ans avant le gouvernement britannique qui a ouvert son site « Acts and statutory » [16]en 2010), puis via des initiatives de villes dont Rennes puis Paris grâce à la délibération prise par le Conseil Municipal en date du 8 juin 2010 relative à la diffusion des données publiques et l’adoption d’une résolution[17] puis du portail « Paris Data » (27 janvier 2011) diffusant des millions de données, dont cartographiques (plan parcellaire, éléments de signalétique, notices d'ouvrages en prêt dans les bibliothèques...), qui a rapidement permis de créer par exemple une carte sur l'histoire des noms des rues de Paris[18], une carte électorale interactive[19] ou une carte[20] des 70 espèces d’arbres présentes à Paris, utile pour les allergiques ».
Séverin Naudet pilote une équipe devant créer le portail de données publiques ouvertes data.gouv.fr[21] qui sera testé d'ici octobre 2011[22]. Besançon[23] et d'autres sont en réflexions. Le Kenya, le 8 juillet 2011, met en ligne sa «Kenya Open Data Initiative», permettant l'accès à 160 bases de données[24].La FING a publié début 2011 un [25], qui recommande aux collectivités de développer, outre une infrastructure technique d'ouverture des données (bases de données, outils de téléchargement, licences, portails, etc.) d'aussi compléter la démarche par une "infrastructure sociale[26]" (« modalités d’accompagnement de la réutilisation, les formes d’animation de la communauté des ré utilisateurs, la facilitation des modes de partage entre réutilisateurs »)[25].
Impacts économiques de l'open data
Selon certaines études, la libération de ces données publiques diviserait par cinq le capital nécessaire pour exercer une activité professionnelle dans le secteur de la téléphonie mobile[27]. Le rapport MEPSIR datant de 2006, financé par la commission européenne, estime que le marché européen lié à la réutilisation des informations publiques représente 27 milliards d'euros. Mais certaines applications de réalité augmentée dérangent : par exemple, BeenVerified.com indique les adresses des délinquants sexuels répertoriés et Whoslobbying croise les agendas des ministres aux rendez-vous qu'ils ont avec les milieux d'affaires[28].
Leader dans le secteur de l’informatique mobile, Apple a reversé plus d'un $1 milliard aux développeurs de ses 300 000 applications[29].
Données ouvertes et technologies
Les données ouvertes sont soumises à une seule contrainte qui est d'être ouverte c'est-à-dire aussi d'être accessible par tous types de machines pour permettre leur traitement. En un mot, cela implique que les données ouvertes doivent être interopérable. Si les données ne respectent pas les standards du Web pour permettre leurs intéropérabilités, on parlera de données bridés car leur réutilisation est moindre voir quasiment nulle.
Ce critère d’interopérabilité n'a jamais été réellement respecté dans l'industrie jusqu'en 2008 où le standard SPARQL est devenu une recommandation du W3C. Ce langage de requête permet à tous développeurs de tester leur requête directement depuis leurs navigateurs Web sur les données ouvertes en ligne puis de développer leur propre programme pour analyser ces données. On peut ainsi consommer les données à distance sans avoir à les transformer ou à les déplacer. Ainsi, le gouvernement en Angleterre et aux Etats Unis ont commencé à basculer leurs données dans le Web des données ouvert (en anglais, Linked Open Data ou LOD) en respectant les standards du W3C et en offrant un point d'accès SPARQL pour les développeurs.
Exemple de données réellement ouvertes : pour trouver sur une carte les écoles les plus proches de son domicile avec les données de Data.gov.uk (du gouvernement en Angleterre) qui offre toutes les données relatives aux écoles sur son territoire.
Le résultat, de ce choix politique d'offrir un vrai standard pour les données publiques comme le Web des données, est simple : la quantité de données disponible explose depuis 2007 comme on peut le voir sur ce graphique.
Données ouvertes et droit français
La libéralisation des données se fait par le biais de licences qui fixent les conditions dans lesquelles ces données pourront être copiées, diffusées, réutilisées. Les données publiques sont toutefois susceptibles de contenir des informations sensibles, soit, car elles permettent d'identifier une personne, soit car elles sont soumises au droit d'auteur, secret d'État ou pour des considérations de défense nationale. Dans ce contexte, les données ne peuvent pas être librement diffusées ou doivent faire l'objet d'une anonymisation préalable. En dehors de ces exceptions, des licences vont s'appliquer notamment grâce à l'intervention de différents organismes qui ont élaboré des licences libres applicables à tout type de contenu, public ou créations de l'esprit. Il s'agit de simples modèles de licence d'exploitation qui n'imposent pas de s'y conformer. Des contrats inédits peuvent être élaborés, à la condition de respecter le droit interne, tant au regard des dispositions des lois du 17 juillet 1978 ou encore du 6 janvier 1978 qu'au regard des règles d'ordre public applicables au contrat[30].
Licence du Ministère de la justice français
Le Ministère de la justice a pris l'initiative de concevoir une licence adaptée aux données publiques, la Licence information publique librement réutilisable[31] communément appelée la LIP. Elle donne la possibilité de réutiliser les données du Répertoire du Ministère[32] gratuitement, même à des fins commerciales sous réserve de mentionner les sources, la date de mise à jour, de ne pas altérer les données et de ne pas en dénaturer le sens. Il est également prévu que l'utilisateur ne puisse autoriser une nouvelle réutilisation sous une licence qu'à la condition d'avoir ajouté de la valeur à la donnée d'origine.
Licence ouverte
Cette licence créée par ETALAB est destinée à être utilisée notamment sur data.gouv.fr.
Licences de la Creative Commons
Inspirée de la philosophie des logiciels libres fondée par Richard Stallman, la Creative Commons a pris l’initiative d’adapter les licences de logiciels libres à d’autres types de supports, notamment à des œuvres littéraires, scientifiques, multimédias ou bases de données. Ces licences ont été réalisées pour encadrer l'utilisation d’œuvres protégées par le droit d'auteur, bien qu'aucune disposition n'exclut expressément les données publiques, à l'exception de la définition de la notion d’œuvre à laquelle elle s'applique[33].
Ces licences, plus ou moins souples et adaptables, garantissent un large contrôle de l’auteur sur son œuvre et sont basées sur un principe modulaire. L’auteur peut choisir lui-même l’étendue de protection de son œuvre. Elles ont favorisé la libre circulation de contenus culturels, tout en garantissant à l’auteur une protection au niveau mondial. Les créations protégées par ces licences sont ainsi libres de diffusions mais ne sont pas libres de tout droit puisqu’une totale liberté n’est jamais permise par les licences Creative Commons.
La protection de l’œuvre par la licence Creative Commons est conforme au Code de la propriété intellectuelle[34]. Les œuvres ainsi protégées répondent aux exigences des articles L. 123-1 à 12[35] ainsi qu'aux articles L. 132-19[36] et L. 211-4[37].
On distingue 6 licences qui peuvent être considérées comme des contrats cadres. Elles sont définies comme « la manifestation de volonté par laquelle une personne propose à une ou plusieurs autres (déterminées ou indéterminées) la conclusion d’un contrat à certaines conditions »[38]. Comme mentionné plus haut, ces contrats sont conformes aux droits des obligations et au formalisme exigé par la propriété littéraire et artistique française, particulièrement au droit à la paternité de l’auteur, principe fondamental en droit français. Les licences proposées par la Creative Commons sont certes adaptables mais l’auteur qui adhère à l’une d’elles[39] se verra imposé le droit à la paternité, devenu obligatoire depuis la version 2.0. Ainsi, il n’est pas possible de trouver parmi les licences, une option « non attribution » qui permettrait d’utiliser l’œuvre sans indiquer le nom ou l‘identification sous lequel l’auteur a diffusé son œuvre originale. Avant cette version, les licences de la Creative commons n’étaient pas valables en droit français dans la mesure où le droit à la paternité est inaliénable[40].
Une œuvre peut certes faire l’objet d’une cession à titre onéreux ou gratuit mais il y aurait nullité du contrat imposant une renonciation définitive de la part de l’auteur, de son droit à la paternité. Enfin, les versions françaises[41] des licences creative Commons ont permis de renforcer leur valeur juridique en France en ce qu’elles deviennent conformes à la loi n° 94-665 du 4 août 1994 dite loi Toubon[42] qui exige d’utiliser la langue française dans la rédaction des contrats et répondent en partie aux problématiques de droit international privé en désignant la loi applicable en cas de conflit[43].
La Creative Commons veille à renseigner les auteurs sur le sens de la notion de domaine public et précise qu’une œuvre ne peut être placée dans le domaine public que si le droit national de l’œuvre le permet[44] et en respectant la licence Creative Commons 0[45].
Licences de l'Open Knowledge Foundation
Open data commons est un projet lancé au Royaume Uni en décembre 2007 par l’Open Knowledge Foundation. La première licence libre du projet a été élaborée en mars 2008 par Jordan Hatcher et Dr Charlotte Waelde.
Ces licences peuvent être appliquées aux bases de données et données qu'elles contiennent prises isolément. L’Open Knowledge Foundation a élaboré trois types de licences de données libres qui se fondent sur leur droit interne, lui-même basé sur le modèle anglo-saxon et qui diffère des droits romano-germaniques, c’est-à-dire civilistes, avec une protection plus reconnue et aboutie du droit moral. De là, l'application de certaines de ces licences aux œuvres de l'esprit n'est pas valable en France mais peut être envisagée pour la diffusion des données publiques dans la mesure où elles sont par définition, publiques.
Public Domain Dedication and License
La licence Public Domain and License (PDDL)[46] donne la possibilité d’utiliser, de copier, de modifier, de redistribuer une base de données sans aucune restriction. C’est une licence libre de tout droit, de type domaine public. Les données peuvent donc être exploitées de façon totalement libre et l’auteur abandonne son droit moral.
Open Database Commons
Cette licence[47] que l'on retrouve sous le sigle ODC-by autorise l’utilisation, la copie, la redistribution, la modification, la réalisation de travaux dérivés de la base de données, sous réserve d’indiquer le nom de l’auteur de la base de données originale. On retrouve ces principes dans la licence Creative Commons By.
Open Database License
La licence ODC-ODbl[48] est fondée sur le droit d'auteur et le droit sui generis des bases de données. Elle donne la possibilité aux utilisateurs de copier, distribuer, utiliser, modifier et produire une œuvre dérivée à partir d’une base de données sous réserve de la redistribuer sous les mêmes conditions imposées par la licence originale. Elle implique aussi d’indiquer le nom de l’auteur de la base de données d’origine. On peut citer à titre d’exemple le projet Open Street Map qui place ses bases de données sous licence ODC-ODbl.
Projets d’ouverture des données publiques
Problématique
L'open data est un outil anti-monopolistique qui apporte un bénéfice structurel à la société civile en permettant une concurrence équitable entre toutes les entreprises. La réussite de ce modèle repose sur quatre problématiques :
- l’existence de la donnée ;
- le format de la donnée brute (RDF, PDF, RSS…) ;
- la qualité de la donnée ;
- la fréquence et l’automatisation des mises à jour de la donnée.
Ses principaux avantages sont de faciliter la réduction des coûts mais aussi les innovations de rupture par l'émergence d'usages inattendus. A titre d'illustration, la publication de données ouvertes sur les hôpitaux permet d'améliorer la qualité de leurs services.
Exemples de données publiques ouvertes
- les cours de bourse
- les données météo
- la cartographie
Budgets et réductions de coûts
Force est de souligner que les budgets informatiques nécessaires pour la mise en œuvre de portails open data sont faibles. Aux US, le pilotage de l'Electronic Gouvernment Fund ne nécessite que $34 millions en 2010[49]. En France, l'équipe de Séverin Naudet, ancien conseiller "internet" de François Fillon en charge notamment du développement de france.fr, comprend 9 personnes et dispose d'un budget de 4M€ hors charges salariales pour réaliser le portail data.gouv.fr ; elle est rattachée au premier ministre et a le soutien de la DILA.
En Grande Bretagne, le croisement des données ouvertes a permis une diminution de 30% de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[50]. Le portail britannique data.gouv.uk a coûté 600K€.
Notes et références
- A titre d'exemple, on peut citer les transport, la cartographie, les statistiques, la géographie, la sociologie, l'environnement ou encore le juridique.
- http://www.opendefinition.org/okd/
- Sigle qui a été développé lors du lancement de grands projets scientifiques fondés sur l'ouverture des résultats de recherche
- http://openaccess.inist.fr/spip.php?article9 Open Acess initiative ;
- http://www.zim.mpg.de/openaccess-berlin/BerlinDeclaration_fr.pdf Déclaration de Berlin ;
- http://www.opendataconsortium.org/
- A titre d'exemple, Wikipedia place son contenu sous licence libre CC-by-sa
- http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006068643&dateTexte=20110517 Texte en vigueur :
- http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:345:0090:0096:FR:PDF Texte en vigueur:
- http://www.justice.gov/oip/foia_updates/Vol_XVII_4/page2.htm Texte en vigueur :
- http://www.justice.gov/oip/amendment-s2488.pdf Texte en vigueur :
- "L'information détenue par le gouvernement fédéral est un bien national" (discours du 20 janvier 2009)
- http://www.whitehouse.gov/sites/default/files/omb/assets/memoranda_2010/m10-06.pdf
- http://data.gov.uk/project ; Projet data.gov.uk
- Décret n° 2002-1064 du 7 août 2002 instaurant la mise en ligne gratuite sur l'internet des informations juridiques
- Acts and statutory instruments" "
- http://odjcp.paris.fr/odjcp/jsp/site/RunStandaloneApp.jsp?page=xmlpage&xmlpage=odjcmunicipal&style=html
- [Carte interactive sur l’histoire des noms des rues de Paris], à partir de données Open data
- [Carte électorale interactive]
- [Cartographie des 70 essences d'arbres à Paris]
- Etalab, mission de création du portail de données publiques data.gouv.fr
- « Avec l'internet, il est logique d'adosser le prix de l'information sur son coût marginal proche de zéro, surtout lorsque la donnée est financée par tous via l'impôt. » Allocution de Séverin Naudet lors du salon i-expo le 18 mai 2011 :
- Open Data : Besançon pourrait suivre le mouvement, consulté 2011-09-25 theitcircle.net,
- #OpenData : Le Kenya lance le mouvement ». Consulté le 13 juillet 2011 Joan Tilouine, «
- Guide pratique de l'ouverture des données publiques territoriales, à l'usage des territoires et de leurs partenaires (version Beta)
- used-in-practice.pdf How is open government data being used in practice" infrastructure sociale : Expression de Tim Davies dans son rapport "
- Chiffre cité par Olivier Schmit lors la conférence Les modèles économiques de la réutilisation des données publiques (open data) du salon i-expo le 18 mai 2011
- Émilien Ercolani, Open data : pas si simple ! L'informaticien, n°91, mai 2011, page 29.
- Depuis le lancement de l'App Store, Apple a reversé plus d'un milliard de dollars aux développeurs. Par conséquent, sa plate-forme de téléchargement a généré un chiffre d'affaires de 1,4 milliard de dollars.
- A titre d'exemple, le droit moral de l'auteur ou encore la nullité des clauses abusives
- http://www.rip.justice.fr/information_publique_librement_reutilisable
- http://www.rip.justice.fr/ ; licence conçue par Thomas Saint Aubain
- « œuvre de l'esprit protégeable par le droit de la propriété littéraire et artistique ou toute loi applicable et qui est mise à disposition selon les termes du présent Contrat. » Article 2 de la CC-by ;
- http://www.legifrance.gouv.fr/affichCode.do?cidTexte=LEGITEXT000006069414 Texte en vigueur :
- http://www.legifrance.gouv.fr/affichCode.do;jsessionid=BEEFB44C9644C589D0DA29DB5BCDF9E8.tpdjo15v_2?idSectionTA=LEGISCTA000006161638&cidTexte=LEGITEXT000006069414&dateTexte=20110517
- http://www.legifrance.gouv.fr/affichCodeArticle.do?cidTexte=LEGITEXT000006069414&idArticle=LEGIARTI000006278994&dateTexte=20110517 Texte en vigueur :
- http://www.legifrance.gouv.fr/affichCode.do?idArticle=LEGIARTI000006279025&idSectionTA=LEGISCTA000006161642&cidTexte=LEGITEXT000006069414&dateTexte=20110517#LEGIARTI000006279031
- Dir. Gérard Cornu, Vocabulaire Juridique Association Henri Capitant, PUF Quadrige 4ème éd. 2003
- au sens de choisir de placer son œuvre sous l’une d’elles puisqu'il est admis que les licences libres sont considérées comme des contrats d’adhésion
- qui ne peut être ni cédé, ni donné.
- http://creativecommons.org/licenses/by/2.0/fr/legalcode
- http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000005616341&dateTexte=vig
- http://creativecommons.org/licenses/by/2.0/fr/legalcode
- http://creativecommons.org/choose/publicdomain-2
- http://creativecommons.org/choose/zero/
- http://download.opencontentlawyer.com/ODC_PDDL.pdf Licence ODC PDDL :
- http://www.opendatacommons.org/licenses/by/1.0/ Licence ODC by :
- http://www.opendatacommons.org/licenses/odbl/1.0/ Licence ODC ODbl :
- mai 2011, page 29. Émilien Ercolani, Open data : pas si simple ! L'informaticien, n°91,
- Open World Forum du 24 septembre 2011. Citation de Charles-Henri Schulz lors de l'atelier Open data, open standards lors de l'
Annexe
Bibliographie
Articles connexes
- SPARQL : un langage de requête pour les données ouvertes, avec des exemples
- Licence libre
- Licence Art Libre
- Open source
- Culture libre
- Creative Commons
- Licence Creative Commons
- Science Commons
- Licence information publique librement réutilisable
- Directive 2003/98/CE
Liens externes
Wikimedia Foundation. 2010.