Édition électronique

Édition électronique

L'édition électronique est une édition qui s'appuie sur le réseau pour sa diffusion et, parfois, sa construction même. Elle est composée de trois grandes familles : la numérisation (par exemple Google livres), l'édition numérique (la mise en ligne de textes nativement numériques) et l'édition en réseau (la publication des documents nativement construits au cœur du réseau, symbolisé par Wikipedia).

L'édition électronique est une forme d'édition dans laquelle le numérique joue un rôle plus ou moins important, allant de la simple mise en page d'un livre en utilisant un logiciel de PAO (Publication assistée par ordinateur) en vue de l'impression papier d'un livre jusqu'à la création et la diffusion en ligne d'œuvres. L'édition électronique, qui tend à se développer depuis plusieurs années, coexiste donc avec l'édition papier sans vouloir la remplacer.

L'histoire de l'édition électronique se divise en trois temps : le temps de la numérisation, le temps de l'édition numérique et le temps de l'édition en réseau. C'est l'ensemble de ces trois temps qui compose l'édition électronique, les modèles ne se remplacent pas l'un l'autre.

Sommaire

La numérisation

Naissance de l'informatisation des textes imprimés et manuscrits : le projet Gutenberg

L'informatisation au format "texte" est née aux États-Unis en 1971 à l’initiative de Michael Hart, alors étudiant à l’université de l’Illinois[1]. Le 4 juillet 1971, jour de la fête nationale, il saisit la Déclaration de l’indépendance des E.-U. (signée le 4 juillet 1776) sur le clavier de son ordinateur. Cette saisie est faite en caractères majuscules car les caractères minuscules n’existent pas encore.

En 1989, il lance le Projet Gutenberg avec l'ambition de numériser le patrimoine de l'humanité. Ce projet, qui ne compte pas plus de dix textes à ses débuts, atteint en 2008 le nombre plus important de 25000 titres. La reproduction a été faite dans un premier temps à la main (copie), puis au scan. Les ouvrages concernés par la numérisation sont des textes appartenant au domaine public, non protégés par le droit d'auteur. En 2010 le projet Gutenberg a permis de reproduire en format texte plus de 37 500 ouvrages[2].

La particularité de cette initiative réside dans l'utilisation de technologies rudimentaires produisant une description simple des données. Cela permet d'éviter d'introduire des systèmes d'incompatibilité avec les systèmes futurs et de réduire le possibilité d'un Low-tech (technologie faible) Par exemple, le livre « Napoléon le petit », numérisé en 2007 par le projet Gutenberg, bénéficie d'un encodage simple avec une structuration de données très rudimentaire.

Sous l'impulsion du projet Gutenberg, des projets similaires ont vu le jour.

L’ABU, la Bibliothèque universelle, qui est un projet du Cnam, en arrêt depuis 2002, a reproduit une centaine de textes toujours disponibles.

Plus ambitieux, le projet initialement baptisé "projet Sourceberg", vise la constitution d'une bibliothèque numérique multilingue. Soutenu par la Wikimedia Foundation, il propose un libre accès à l’information, sans publicité, édifié par des bénévoles qui utilisent la technologie wiki. Le 26 décembre, il change officiellement de nom pour devenir « Wikisource ». Il propose quant à lui 55 715 textes libres de droits.

Des projets comparables s'appuient sur une autre stratégie : l'OCR (Optical Character Recognition, ou ROC : Reconnaissance Optique de Caractères) : à partir d'une reproduction de la page par scanner, sous forme image, le texte est reconstitué. Cette technique, qui permet de passer du mode image au mode texte, a toutefois l’inconvénient de laisser beaucoup de coquilles.

La pérennité : un enjeu essentiel de la numérisation

Cet enjeu soulève de nombreuses inquiétudes concernant la démagnétisation des supports. La mauvaise fiabilité des stockages et l’évolution rapide des formats (apparition des formats propriétaires) posent de réels problèmes de conservation physique des fichiers. Cette dernière comprend deux logiques : le back-up et l’archivage.

  • Le back-up correspond à la duplication des données.
  • L’archivage fait référence à la conservation et la duplication sur le long terme.

Quelques exemples:

OAIS : (Open Archival Information system) il s’agit d’un système de gestion de documents numériques utilisé uniquement par les professionnels.

LOCKSS : utilisé pour les structures plus petites comme les bibliothèques. Celles-ci peuvent mettre leurs données au sein d’un réseau et copier le fichier autant de fois qu’il y a d’utilisateurs.

CLOCKSS : ressemble à LOCKSS mais permet un contrôle plus grand sur le réseau des acteurs.

Les premières bibliothèques numériques

Après le développement du projet Gutenberg, et bientôt suivi d'autres projets du même type consistant à copier les textes à la main, des projets plus ambitieux, dans lesquels sont mis à disposition sur intranet ou Internet des œuvres reproduites par scanner sous forme image, ont vu le jour.

Gallica a été lancé en 1998 par la Bibliothèque nationale de France. Elle reproduit dans un premier temps des ouvrages anciens imprimés, mais aussi des livres récents sous droits de la BNF et d'autres établissements, comme par exemple la bibliothèque municipale de Lyon. Les estampes et collections inconographiques de même que les manuscrits ont été ajoutés depuis.

Le risque d'un monopole de la numérisation par Google livres

Google livres

Les différents projets de reproduction des livres menés jusque-là ont été bouleversés par Google livres, entreprise de numérisation en mode image et OCR du patrimoine de l'humanité. Sept millions d'ouvrages ont aujourd’hui été numérisés dans différentes bibliothèques.

Pour comprendre la stratégie de Google, il est utile de distinguer les trois temps juridiques d’un livre : le temps pendant lequel il n'y a plus de droits d’auteurs ; une période sous droit (auteur ou ayant droit) ; et entre les deux une zone grise, période couverte par le droit d’auteur, mais pendant laquelle persiste un flou sur la capacité de l'ayant droit à faire valoir son droit. Beaucoup d'œuvres restent en effet orphelines, et cette zone grise suscite beaucoup d'intérêt. Google a donc décidé de redonner vie à ces œuvres inexploitées.

Des éditeurs se ainsi sont attaqués à Google : aux États-Unis, un accord a été trouvé dans la tenue d'un registre de gestion des droits des œuvres orphelines, géré et financé par Google (qui a dédommagé des nombreux éditeurs). Cet accord n'est toujours pas opérationnel. Sur le même type de conflit, La Martinière a, lui, obtenu gain de cause en France. Un autre reproche souvent fait à Google réside dans le fait que ce dernier procède par ailleurs à l'indexation et la numérisation automatique des œuvres de Google livres[3] .

Les tentatives de GBS pour prendre le monopole de la numérisation met en lumière le problème de la propriété intellectuelle sur le web et du droit d'auteur. Quand un contrat est formé entre un auteur et un éditeur, il n'est pas possible de mentionner « tous supports » : chacun des supports doit être mentionné (papier, CD-Rom, Internet, etc.). Les supports non mentionnés sont exclus du contrat. Il y a un processus de mise à jour des contrats pour avoir les droits Internet sur les ouvrages édités. Les auteurs n'adoptent pas de position claire, c'est donc l'occasion de négocier les contrats, notamment en ce qui concerne la durée. Régime de la licence est apparu avec Internet à cause de la révolution de l'accès provoquée par le réseau. Bien qu'il existe des exceptions du Droit d'auteur pour les handicapés, et à des fins d’enseignement et de recherche, sans les Licences, les échanges entre auteurs et personnes souhaitant utiliser leurs œuvres exploseraient puisqu'utiliser une œuvre sans autorisation de son auteur est interdit par la Loi.

Dans Google livres, il y a différentes fonctionnalités sociales permettant d'interagir avec les autres internautes ou bien avec les créateurs du site:

  • Il est possible de signaler les anomalies, ce qui permet à Google d'améliorer la qualité de ses données (initialement fortement perfectibles).
  • Il est possible de laisser son avis à destination du lectorat.
  • Il est possible de partager le lien du document sur sa messagerie ou sur son site web (génération de code)
  • Il est possible de sélectionner seulement une partie du texte et de le partager de la même façon.

Quelques exemples de contre-offensive à la prise de monopole par Google livres :

L'Open Content Alliance

Ce projet non commercial[4] aurait numérisé un million d'ouvrages avec autorisation des ayants-droit.

Pour l’heure, Google a gagné la bataille de la vitesse et du nombre d'ouvrages en ligne, notamment en exploitant la capacité de calcul de centres de données (data-center[5]), fermes de données de serveurs par milliers, répartis partout dans le monde, permettant entre autres des opérations de traduction, de data-mining, etc.

Gallica

Gallica semble réfléchir à un partenariat avec Google.

Europeana

Europeana : bibliothèque virtuelle européenne, est en cours de construction, et annonce la numérisation de trois millions d'ouvrages.

ABU

Bibliothèque universelle : à l'arrêt depuis 2002, quelques centaines de livres disponibles.

Wikisource

Wikisource : 55 715 textes libres de droit.

L'édition numérique

Deuxième âge de l'édition électronique, celui où l'édition de texte est nativement numérique mais n'est pas encore pensée spécifiquement pour les usages en réseau. L'édition numérique illustre bien l'un des enjeux essentiel de l'édition électronique, à savoir l'accessibilité d'un texte. C'est en effet le plus révolutionnaire des enjeux de l'édition électronique. On bascule d'un univers analogique à un univers numérique où la circulation et l'accessibilité sont facilitées, ce qui entraîne une explosion de l'accès. Par exemple, les revues scientifiques comptent beaucoup plus de lecteurs dans leur version numérique que dans leur version papier. C'est donc une véritable révolution de la consultation grâce à l'Accessibilité du Web.

Avec l’arrivée du numérique, on a beaucoup dématérialisé les œuvres. Cette dématérialisation massive a poussé à mettre en place une logique de rematérialisation. Le numérique a de nombreux avantages, il permet :

  • Une impression de livres à la demande (print on demand)

Ce système commence à être utilisé dans les bibliothèques. Cette logique est également développée par wikipédia.

  • Un débouché commercial pour les œuvres en libre accès.
  • Un aspect pratique pour la lecture, la conservation et l'annotation.

On a souvent tendance à associer l’impression à la demande à l’autoédition (cf. Lulu.com). En fait, l'impression à la demande correspond aussi à des démarches d'édition très professionnelle, qui couvrent des marchés de niches, ou qui concernent des épuisés. Cela permet de s'émanciper des questions d'investissement pour le tirage initial, ainsi que des problèmes de stockage.

Le travail d'un éditeur électronique reste comparable à celui d'un éditeur traditionnel. Il reçoit des manuscrits. Il les sélectionne, il les retravaille avec les auteurs pour les corrections éventuelles, mais plus souvent en ligne. Il effectue ensuite les opérations classiques de mise en page, illustration, mais l'impression papier est remplacée par la production de fichiers en différents formats de livre électronique. Après publication, il devra faire connaître l'œuvre, gérer les ventes, reverser la rémunération à l'auteur...

Économiquement parlant, en France, une autre différence notable réside dans leur différence de traitement par l'administration fiscale : l'édition traditionnelle bénéficie d'un taux de TVA réduit, tandis que l'édition électronique supporte le taux de TVA standard, au même titre que l'informatique, dont elle est issue. Malgré la naissance de certaines polémiques cette norme semble perdurer. En effet, le 28 octobre 2010, la proposition de loi déposée par le député de Savoie (UMP) Hervé Gaymard et défendue par le Syndicat national de l'édition qui souhaitait que les fichiers numériques soient taxés au même niveau que le livre papier, fut rejetée par le Sénat. Celui-ci refuse l'abaissement de la TVA sur le livre numérique à 5,5 % au lieu de 19,6 %. Les sénateurs ont cependant accepté à l'unanimité la proposition de loi présentée par l'UMP sur le prix du livre numérique qui permet à l'éditeur de fixer le prix de vente au public comme il le fait pour le livre papier. Pour l'instant cette loi est réservée aux éditeurs français mais un amendement visant à l'étendre aux éditeurs établis à l'étranger publiant leurs livres en France a été réclamé.

Comme dans l'édition traditionnelle, la relation entre l'auteur et l'éditeur électronique est régie par un contrat signé par les deux parties, définissant les droits et les obligations de chacun, leur rémunération, et l'engagement de l'éditeur à diffuser l'œuvre. Une différence cependant : contrairement à un livre imprimé, l'œuvre numérique n'est jamais "épuisée", alors qu'en édition traditionnelle l'épuisement du stock pouvait conduire à l'extinction du contrat, si l'éditeur n'entreprenait pas une réimpression dans un délai fixé. La durée du contrat, (obligatoirement limitée, pour respecter la loi sur le droit d'auteur) doit donc être définie par d'autres critères.

Les modèles économiques de l'édition électronique restent largement à inventer. On distingue la vente à l'unité (Amazon) et l'abonnement à des bouquets (Safari d'O'Reilly).

Dans ce domaine se pose la question du prix du livre électronique qui peut provoquer une décote par rapport à l'édition papier. Mise en place d'offres plus attrayantes.(vente avec une garantie) Quelques exemples de modèles économiques:

  • Modèle freemium : associe une offre gratuite, en libre accès, et une offre « Premium », haut de gamme, en accès payant.

Exemple : Flickr. On peut y déposer gratuitement nos images, gratuit jusqu’à 200 images, au-delà il faudra payer ou accepter de perdre les plus anciennes photos. Pour avoir accès à l’offre prémium: 2 dollars/mois

  • Modèle de longue traîne : Dans le monde réel, ces contraintes là sont très importantes.

Exemple : La Fnac. Dans le modèle de longue traîne, il y aura une explosion du pourcentage de livre. (CA de la librairie en ligne) ça peut être des hits qui ont eu beaucoup de résultat au début. Ce sont des livres qui se vendent régulièrement. Les différentes offres économiques :

  • Safari : offre de bouquet de l'éditeur O'Reilly Media, on crée un modèle de bouquet de livre sur les technologies, qui rapporte de l’argent à l’éditeur, et qui donne au lecteur un accès à un catalogue assez conséquent, mais assez limité.
  • Wikipédia : qui s’appuie sur des dons en infrastructure (par exemple google et particuliers). C'est un financement populaire. Chaque année, ils font des appels de dons, qui leur rapportent environs 8 millions de dollars par an. C’est un modèle qui existait déjà, qui est un modèle de souscription.

L'édition en réseau

C'est l'édition nativement en ligne, dans laquelle on rédige les textes sur le réseau lui-même. L'archétype de l'édition en réseau est Wikipedia. Les blogs et les Wikis font partie de l'édition en réseau. Alors que les blogs sont des contenus publiés directement par l'auteur, sans intermédiaire (désintermédiation), les encyclopédies collaboratives, comme Wikipedia, sont de plus en plus régulées, ainsi que le montrent le nombre et la complexité des rôles différents de l'encyclopédie, l'évocation des guerres d'édition et d'une stratégie de labellisation des notices les plus complètes, ainsi que d'une politique d'avertissements clairs concernant les notices qui sont incomplètes ou l'objet de fortes controverses.

Licence libre contre licence propriétaire

Le régime de la Licence (juridique) permet à l’ayant droit de décider de donner à son œuvre une licence d’utilisation bordée par des conditions. La première licence est la GNU, à l’initiative de Richard Stallman, et la seconde la GPL (qui s’applique essentiellement aux logiciels, et se base sur un système de Copyleft - voir Licence publique générale GNU). Différentes licences peuvent s’appliquer aux œuvres textuelles, telle que la Licence Creative Commons, adoptée par Wikipedia depuis 2009. Cette licence « à la carte » permet de définir des contraintes sur la paternité de l’œuvre, ses modifications, son utilisation commerciale, etc. La formule la plus ouverte est la CC-by, et la plus fermée la CC-by-nc-md. Si quelqu’un souhaite outrepasser une licence Creative Commons, il lui faut établir un contrat avec l’ayant droit. Ce régime ne s’oppose donc pas à celui du contrat et d’une exploitation commerciale, et lui est au contraire complémentaire.

Technologies

Au sein de l’édition numérique on peut distinguer trois catégories de supports électroniques :

Le web

Le web est un système hypertexte (soit il contient des hyperliens et des informations)public fonctionnant sur Internet. Il permet de consulter, à l’aide d’un navigateur, des pages accessibles sur divers sites. Les livres consultables sur le web sont sous différents formats, dont l’EPUB (qui clone le format papier). Ces livres « web » sont en réalité des fichiers dynamiques. Il s’agit de documents web générés en temps réel, soit au moment où ils sont consultés. Grâce à des flux RSS continus, la page présente de nouvelles informations lors de chaque consultation du lecteur.

La technologie utilisant l’encre numérique : les liseuses

Articles détaillés : Papier électronique et Liseuse.

La « liseuse » (« bouquineur » ou « reader ») est un tablette électronique qui permet de restituer un texte sous format numérique. Il y a peu, les fabricants proposaient des machines dites « à afficher ». Celles-ci étaient peu autonomes, lourdes, rétro-éclairées et se rapprochaient sensiblement des Tablet PC. Aujourd’hui, les fabricants adoptent une vision différente en utilisant des dispositifs de lecture e-paper. Il s’agit d’une technique d’affichage qui imite l’apparence d’une feuille imprimée et qui ne nécessite pas de rétro-éclairage. L'encre électronique est aussi appelé e-paper.

Quelques exemples :

Avec sa Kindle DX, Amazon propose une technologie originale. Cette dernière présente un écran sans scintillements, qui ne nécessite pas de rétro-éclairage. Seul le changement de statut à l’écran requiert de l'énergie. Produisant peu de lumière, la Kindle Dx est ainsi moins fatigante pour les yeux. Mais, malgré ces nombreux avantages, cette liseuse présente certains aspects décevants. La Kindle Dx (comme beaucoup de ses concurrents) ne possède pas d'écran couleur. Ce dernier se compose uniquement de plusieurs niveaux gris. La liseuse ne possède pas d’écran tactile ni de connexion Internet. Le changement d’une page à l’autre demeure relativement lent. Peu interactive, elle présente un menu extrêmement simple. Les copier-coller, les annotations, les signets et les soulignements ne sont pas envisageables (ou sont de très mauvaise qualité) sur ce modèle.

La Cybook Opus se décline en une dizaine de couleurs. De forme arrondie, la liseuse française possède dès son achat une bibliothèque de soixante quatre ouvrages. Malgré de nombreux avantages, Cybook Opus présente de nombreux aspects décevants. La liseuse ne possède pas d’écran tactile ni de connexion internet. Peu interactive, elle présente un menu extrêmement simple. Les copier-coller, les annotations et les soulignements ne sont pas envisageables sur ce modèle.

Les smartphones et tablettes

Un smartphone est un téléphone « intelligent » mobile disposant des fonctions d’un assistant électronique : agenda, navigation web, messagerie et depuis peu lecteur d’e-books. Ces applications diverses sont développées par le fabricant, l’opérateur ou l’éditeur de logiciel. Certains de ces logiciels ou applications, tel Stanza, Androïd, Aldiko, permettent de rapatrier des titres sur son IPhone (ou IPod-Touch) et de constituer sa propre bibliothèque. Ces derniers, gratuits, sont des concurrents directs des liseuses.

Quelques exemples :

Nintendo, a sorti courant 2010 sa toute dernière Nintendo DSi Xl accompagnée d’un "jeu" éducatif intitulé « 100 livres classiques ». Le marché du livre électronique est en plein essor et en réunissant ainsi une centaine d’œuvres classiques sur une simple cartouche DS, le constructeur Nintendo a montré que lui aussi comptait y prendre part. Dès les premières prises en mains, les utilisateurs découvrent un défaut principal : le format d’écriture. Même au plus faible niveau de zoom, la Nintendo ne peut afficher que quatre à cinq mots par ligne. Il est donc évident que les longues phrases ne peuvent tenir sur une même page. Ce format d’écriture pose de réels problèmes de lecture. Le texte est déstructuré, ce qui pour un ouvrage classique (tel l’Iliade d’Homère) le rend encore plus dure à déchiffrer.

Présenté récemment aux États-Unis, l'iPad serait selon ses constructeurs la grande révolution de cette année 2010. Malgré des innovations constantes, la liseuse est un dispositif aux ressources limitées. Elle n’a qu’une seule utilité : lire des livres numériques. L’i-Pad apparaît alors comme une véritable nouveauté. Il s’agit d’une tablette, (aux dimensions imposantes) à écran tactile, possédant presque toutes les applications d’un iPhone. Parmi ses nombreux logiciels installés figurent Safari, Mail, Photos, Vidéo, iPod, iTunes, Notes et iBooks. Ce dernier est une application permettant l’achat et la lecture de livres numériques.

Qualités du texte électronique « idéal »

Trois qualités ont été identifiées par Marin Dacos et Pierre Mounier - la lisibilité, la maniabilité et la citabilité[6], auxquelles on peut ajouter la localisation.

Lisibilité

Le livre numérique ainsi diffusé devra être lisible. Cela suppose :

- qu’il soit décrit par un format ouvert, par opposition au format propriétaire (ou formats fermés). Par exemple : l’application livre des sociétés américaines n’est pas du tout décrit grâce à un format ouverts, il s’agit d’un logiciel propriétaire avec des standards qui ne sont pas interopérables entre les liseuses. Il faudra que des consortiums puissent se constituer autour de format ouvert pour espérer avoir une inscription dans la durée des travaux de l’encodage des fichiers destinés à l’édition électronique.

- qu’il soit recomposable (reflowable), c’est une qualité que n’a pas le « PDF », par exemple ce dernier ne permet pas au fichier de s’adapter à la taille de l’écran, alors que le format Epub le permet.

- qu’il soit conservable, les formats évoluent rapidement et il n’est pas certain que l’on puisse conserver nos fichiers très longtemps car les formats se périment, ou parce qu’une DRM peut-être appliquée au fichier. Les mesures techniques de protection mises en place dans le cadre des systèmes de gestion des droits d'auteurs (DRM) repose sur un cryptage du document rendant obligatoire l'utilisation d'un logiciel et d'un système particulier contrôlant les droits du lecteur. Ceci met donc en danger la conservation et la lisibilité du texte.

Maniabilité

Le livre électronique doit être manipulable, pour cela il faut qu’il soit d’abord indexable et cherchable. Plus on créera de livres applications, plus il sera difficile de les indexer et de créer des outils d’indexation. Donc, on aura de plus en plus besoin d’outils pour se faire une cartographie de notre bibliothèque virtuelle. De même, le texte devra être copiable et collable, afin d’être rapidement inséré dans un autre contexte (procédure du copier-coller). Enfin, le texte devra aussi être annotable et inscriptible (annotations, remarques, jalons, etc.) dans des dispositifs ouverts.Par exemple avec le Kindle, on dépend de l’outil d’annotation propre au Kindle, ce qui engendre une dépendance à une société privée.

Citabilité

Le livre doit être citable et ce de façon simple. Le numérique conduit vers des solutions reposant sur la logique d'un identifiant unique (ID). Plusieurs dispositifs mis en place dans différents environnements et reposant sur des logiques différentes, se sont développés. Dans le monde de l'édition du livre, sont utilisés depuis de nombreuses années, l’ISBN pour les livres et l’ISSN pour les périodiques. Ces identifiants uniques décrivent des objets éditoriaux, c'est-à-dire un titre d'ouvrage ou un titre de périodique. La problématique posée aujourd'hui porte sur la granularité (de l’information) et sur le niveau d'identification la plus pertinente : un livre, un chapitre, un article pour des textes juridiques ? Ainsi l’ISBN correspond à un niveau important de granularité puisque c’est le livre en entier qui est identifié, ne permettant pas la citation d'un passage particulier par ce type de mécanisme.

Localisation
Il ne suffit pas de recueillir la citation d'un ouvrage : localiser l'ouvrage reste une étape décisive. Le numérique permet d'articuler citation et localisation et bien souvent les deux sont confondus. Il semble pourtant indispensable de distinguer ces deux fonctions. Citons deux systèmes utilisés : les URL, système ouvert proposé dans le cadre du Web, et les DOI (Digital Object Identifier), dispositif fermé et commercial.

  • Les pratiques actuelles de création des URL, en particulier quand elles sont liées à un logiciel spécifique ou à une organisation "physique" d'un site à une date donnée, rendent difficiles la généralisation de cette méthode puisque l'URL est sujette à des modifications. Si l'application de bonnes pratiques[7] permet de répondre aux problèmes les plus courants, pour les dispositifs à vocation pérenne la solution consisterait à adopter le principe des URI.
  • Le système du DOI, utilisé notamment dans le domaine scientifique à travers l’agence Crossref, repose sur une identification associée à la localisation des ressources. Le dispositif propose à la vente, des identifiants uniques essentiellement à destination des éditeurs de revues puis plus récemment aux éditeurs de monographies.

Impacts

  • Le principe des identifiants uniques facilite l'interopérabilité entre les systèmes et entre les fonds ou catalogues. Par exemple on sera capable de chercher quel article cite tel autre article. Ce type de fonctionnalités dites de Crosslinking (liens croisés) permet de naviguer dans un écosystème documentaire - limité toutefois au système d'identification choisi. Un travail sur l'interopérabilité entre ces systèmes reste à développer.
  • Pour exploiter pleinement ces techniques, il faut par ailleurs que les ressources soient correctement décrites à travers différentes métadonnées qui leur sont rattachées. Dans le cas contraire, le document devient impossible à retrouver. Les métadonnées transportées par les logiciels et ne reposant pas sur un minimum de normalisation peuvent être erronées ; elles sont souvent très pauvres. Il est donc fortement recommandé d'utiliser au minimum le format Dublin Core qui dans sa version normalisée ISO 15836, propose un jeu de 15 éléments. Le format ONIX[8], le standard de l'industrie du livre, cumule quant à lui des informations bibliographiques alignées à celles du Dublin Core mais aussi commerciales et promotionnelles [9].

Valoriser le texte en ligne : formats et protocoles

Pour valoriser les textes en ligne, on utilise plusieurs stratégies. En particulier, on travaille sur la typographie et l'accessibilité. On doit également travailler sur les protocoles d'échanges de données (interopérabilité), comme l'OAI-PMH, sur les formats d'échanges de données, comme l'OPDS (Bookserver)[10], le Dublin Core, ONIX[11]. Interopérabilité, accessibilité, pérennité des documents... doivent répondre à des normes spécifiques au Web et être standardisées. C'est la tâche du W3C.

OAI-PMH

L'OAI-PMH permet d'échanger les notices de ressources par le biais d'entrepôts en ligne. Les spécifications en sont publiques[12].

L'interrogation des dépôts utilise le protocole HTTP et les résultats s'affichent en XML. Le tableau suivant reprend les différents verbes et arguments utilisables, ainsi que quelques exemples[13].

Verbe Rôle Arguments
GetRecord Récupération d'un enregistrement donné.
  • identifier
  • metadataPrefix
Identify Informations sur l'entrepôt de données. Aucun
ListIdentifiers Récupère la liste des identifiants disponibles.
  • from : date de début
  • until : date de fin
  • metadataPrefix
  • set
  • resumptionToken
ListMetadataFormats Demande la liste des formats de métadonnées disponibles. Sans paramètres tous les formats disponibles pour au moins un item sont retournés. Avec le paramètre identifier, ne sont retournés que les formats disponibles pour l'item concerné
  • identifier
ListRecords Retourne une liste d'enregistrements correspondant aux différents paramètres (dates, ensemble) demandés.
  • from : date de début
  • until : date de fin
  • metadataPrefix
  • set
  • resumptionToken
ListSets Demande la liste des ensembles disponibles sur un entrepôt. La réponse peut être sur plusieurs pages. resumptionToken

Cette norme permet donc de centraliser les notices de ressources mais pas leur contenu, ce qui en montre ses limites, par rapport à l'OPDS.

OPDS

Internet Archive a mis au point un système ouvert qui permet de rechercher via un moteur d'index les livres qui sont disponibles à partir d'une multitude de sources. De cette sorte il permet d'interconnecter entre eux un certain nombre d'acteurs du livre : libraires, bibliothèques, moteurs de recherches et lecteurs. Les catalogues bookserver se présentent via le format OPDS. Bookserver permet de créer des catalogues et de les mettre à disposition des acteurs qui le souhaitent, pour une diffusion gratuite ou payante.

Ce format libre et ouvert est décrit sur Google code[14]  :

Logiciels compatibles avec le format OPDS.

Dublin Core

Le format Dublin Core est une norme simple décrivant des ressources bibliographiques. La difficulté de décrire sans aucune ambiguïté des documents complexes est grande. Ces descriptions sont surtout destinées à être interprétées par des machines, et beaucoup moins par des humains. Cela implique d'utiliser des listes d'autorités et des schémas d'encodage connus. C'est pourquoi il faut recourir le plus souvent possible à une déclaration de "scheme".

Unicode

L'Unicode est un jeu de caractère central dans le domaine de l'édition électronique. C'est un système de codage des caractères des différents alphabets utilisés dans le monde, assignant à chacun un identifiant numérique unique, quelle que soit la langue qui l'utilise. Cette norme d'encodage tend ainsi à l'universalité, son objectif étant de s'imposer comme standard en remplaçant les systèmes d'encodages appliqués auparavant dans différentes langues et pays. Cette uniformisation du code a pour objectif de permettre l'échange de documents électroniques à l'échelle mondiale, et ainsi adapte l'édition électronique à cette échelle.

W3C

Le W3C est un organisme d'experts qui standardise et développe les formats de données les plus importants pour écrire des pages Web.

Quelques éditeurs de livres électroniques

ex-éditeurs
éditeurs actuels

Quelques distributeurs et diffuseurs de livres électroniques

Article détaillé : Livre électronique#En France.
distributeur de livres électroniques
distributeurs et diffuseurs de livres électroniques
diffuseurs de livres électroniques

Bibliographie

  • Marie Lebert, Les Mutations du livre à l'heure de l'internet, Montréal, Net des études françaises, 2007 
  • Marin Dacos, Pierre Mounier, L'Édition électronique, Paris, La Découverte, coll. « Repères, 549 », 2010, 128 p. (ISBN 978-2-7071-5729-4) 
  • (en)2001 : In Oldenburg's Long Shadow : Librarians, Research Scientists, Publishers, and the Control of Scientific Publishing

Version française (2009) : A l'ombre d'Oldenburg : Bibliothécaires, chercheurs scientifiques, maisons d'édition et le contrôle des publications scientifiques

  • Hubert Guillaud, Alain Pierrot, Bob Stein, Nova Spivack, Joël Faucilhon, Milad Doueihi, Philippe Aigrain, Robert Darnton, Tim O'Reilly, Andrew Savikas, Fabrice Epelboin, André Gunthert, Pierre Mounier, Janet Stemwedel, Antoine Blanchard et Jean Sarzana. Sous la direction de Marin Dacos, Read/Write Book. Le livre inscriptible, Marseille, Cléo, coll. « Edition électronique », 2010 (réimpr. 1ere éd.), 2e éd., 198 p. (ISBN 978-2-9536419-0-5) 
  • Bernard Poulet, La Fin des journaux et l'avenir de l'information, Paris, Editions Gallimard, coll. « Le Débat », 2009, poche, 217 p. (ISBN 978-2-07-012272-1) 
  • Olivier Bomsel, Gratuit ! Du déploiement de l'économie numérique, Paris, Editions Gallimard, coll. « Folio actuel », 2007, 301 p. (ISBN 978-2-07-033957-0) 
  • Stiegler Bernard, Giffard Alain, Fauré Christian, Pour en Finir avec la Mécroissance, Paris, Flammarion Lettres, coll. « Essais », 2009, 305 p. (ISBN 978-2-08-122492-6) 
  • Lise Vieira, L'Édition électronique, de l'imprimé au numérique, évolutions et stratégies, Saint-Etienne, Presses universitaires de Bordeaux, coll. « Labyrinthes », 2004, 188 p. (ISBN 978-2-86781-342-9) 

Voir aussi

Général
Livre électronique
Formats de livres électroniques EPUB - PDF - PRC/MOBI
Liseuses Kindle DX - Sony Reader - Iliad - Digital Reader 1000 - Cybook Gen3 - Cybook Opus - Nook - Amazon Kindle
Technologies et normes Papier électronique - Unicode - Open Publication Structure
Portails de revues Persée (portail) - Cairn (portail) - Érudit (édition) - Revues.org
Bibliothèques numériques et projets de numérisation Google livres - Gallica - Europeana - Projet Gutenberg - Association des bibliophiles universels

Notes et références

  1. Marie Lebert, Les mutations du livre à l'heure de l'internet, Net des études françaises, Montréal, 2007
  2. Project Gutenberg: Timeline Events sur www.gutenbergnews.org
  3. (fr)La bibliothèque sur books.google.fr. Consulté le 5 octobre 2010.
  4. http://www.opencontentalliance.org/
  5. Data center
  6. Marin Dacos, Pierre Mounier, L'édition électronique, La Découverte, coll. « Repères, 549 », Paris, 2010, p.71. (ISBN 978-2-7071-5729-4)
  7. Cool URI for the semantic web, 2008. Consulté le 31 octobre 2011
  8. Site de l'éditeur du format ONIX
  9. L'utilisation d'ONIX pour vos livres imprimés et numériques, OnixEdit, consulté le 31 octobre 2011
  10. (en)A Future for Books -- BookServer sur www.archive.org. Consulté le 5 octobre 2010.
  11. (en)Site officiel de ONIX sur www.editeur.org. Consulté le 5 octobre 2010.
  12. Le document de référence est disponible sur Openarchives.org : The Open Archives Initiative Protocol for Metadata Harvesting, http://www.openarchives.org/OAI/openarchivesprotocol.html
  13. Pour d'autres exemples : Laurent Dousset, Jean-Luc Minel, Stéphane Pouyllau, Richard Walter, Le Guide des Bonnes Pratiques Numériques, http://www.tge-adonis.fr/wiki/index.php/Guides
  14. (fr)Project Hostingon google code sur code.google.com. Consulté le 5 octobre 2010.
  15. Voir le mémoire de 2004 d'Élodie Ressouches.
  16. Site arrêté : voir http://www.lemague.net/dyn/spip.php?article1436.
  17. Voir http://www.numeriklivres.com/.
  18. Voir http://www.smartnovel.com.
  19. Voir http://www.storylab.fr/.
  20. Voir http://emue.fr/.
  21. Voir http://www.erenumerique.net/.
  22. Voir la Vitrine Eden livres.
  23. Voir http://librairie.immateriel.fr/.
  24. Voir http://www.epagine.fr/.
  25. Voir http://fr.feedbooks.com/.
  26. Voir http://oyo.chapitre.com/ebook/shop/start.jsp.
  27. Voir http://bibliosurf.epagine.fr/.
  28. Voir http://www.1001libraires.com/accueil-numerique.

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Édition électronique de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • ÉDITION ÉLECTRONIQUE — Pendant près de cinq siècles notre culture de l’écrit a été façonnée par les techniques et les usages de l’imprimé. Cette période s’achève aujourd’hui avec l’avènement de l’édition électronique. En passant du papier au numérique, le texte ne… …   Encyclopédie Universelle

  • Centre pour l'édition électronique ouverte — Siège Marseille, Paris Rattachement CNRS, Université de Provence, EHESS, Université d Avignon …   Wikipédia en Français

  • ÉDITION — Quand il s’agit d’exprimer l’idée d’édition, les langues hésitent entre deux racines qui sont représentées en français respectivement par le verbe «publier» et le verbe «éditer». L’un vient du latin publicare , qui signifie «mettre à la… …   Encyclopédie Universelle

  • Édition littéraire — L édition littéraire consiste à choisir des textes, à les imprimer et à les commercialiser. Les textes peuvent être anciens ou modernes, des originaux ou des commandes. Le support est en grande majorité le papier et le livre. Sous l influence de… …   Wikipédia en Français

  • Édition Garnier — Garnier Frères Pour les articles homonymes, voir Garnier. Les éditions Garnier Frères (parfois Garnier et Frères, ou simplement éditions Garnier) étaient une maison d édition française (1833 1983) et une librairie parisienne. Les marques GF (GF… …   Wikipédia en Français

  • Édition Garnier et frères — Garnier Frères Pour les articles homonymes, voir Garnier. Les éditions Garnier Frères (parfois Garnier et Frères, ou simplement éditions Garnier) étaient une maison d édition française (1833 1983) et une librairie parisienne. Les marques GF (GF… …   Wikipédia en Français

  • Édition Garnier frères — Garnier Frères Pour les articles homonymes, voir Garnier. Les éditions Garnier Frères (parfois Garnier et Frères, ou simplement éditions Garnier) étaient une maison d édition française (1833 1983) et une librairie parisienne. Les marques GF (GF… …   Wikipédia en Français

  • Édition de la poésie en France — Sommaire 1 État des lieux 2 Notes et références 3 Voir aussi 3.1 Articles connexes 3.2 …   Wikipédia en Français

  • Livre électronique — L auteur Joseph Incardona tenant les éditions papier et électronique sur une liseuse de 220 Volts Un livre électronique, dit aussi livrel ou e book (en anglais), est un fichier électronique contenant un texte sous forme numérique. Il ne doit pas… …   Wikipédia en Français

  • Libre accès (édition scientifique) — Le libre accès (en anglais : Open Access), est la libre disponibilité en ligne de contenus numériques, qui peuvent eux mêmes être soit libres (Creative commons, etc.), soit sous un des régimes de propriété intellectuelle. L’Open Access est… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”