- Doc (informatique)
-
Pour les articles homonymes, voir DOC.
En informatique, DOC ou doc (abréviation de « document ») est une extension de nom de fichier, traditionnellement utilisée pour la documentation en format texte propriétaire, sur une large variété de systèmes d'exploitations.
Dans les années 1980, WordPerfect a utilisé l'extension DOC en tant que format propriétaire. Puis, dans les années 1990, Microsoft a également utilisé l'extension DOC pour les fichiers de leur logiciel de traitement de texte Microsoft Word. En conséquence, l'usage majoritaire depuis lors est de comprendre document texte Microsoft.
Sur les Palm OS, DOC est un raccourci pour PalmDoc, un format de fichier totalement différent utilisé pour des fichiers de texte tels que des livres électroniques.
Sommaire
Caractéristiques
Le format de fichier est un standard et change au fil du temps avec la version de Microsoft Word. N'étant pas une norme le format reste peu documenté malgré les demandes de divers organisme à des fins d'interopérabilité dont l'union européenne. On peut dire que ces formats contiennent les données suivantes :
- du texte ;
- de la mise en forme (ce n'est plus du plain text) ;
- des informations sur des états précédents du fichier, inaccessibles à l'utilisateur normal ;
- des scripts, et même des langages de programmations de type script.
Les fichiers DOC, qui ne constituent pas une norme industrielle, posent problème. Pour cette raison le format bureautique OpenDocument (ISO 26300) basé sur XML a été créé afin de garantir l'interopérabilité et la pérennité des documents bureautiques. Par la suite, pour tenter de contrer OpenDocument, Microsoft a créé son propre format, OpenXML, lui aussi basé sur XML. Il est maintenant certain que .doc va être délaissé par les utilisateurs institutionnels[1] et les grandes entreprises pour des raisons d'interopérabilité et de pérennité de l'information.
Les spécificités du format DOC ont été par la suite libérées[2], mais après l'abandon de son développement par Microsoft, ce dernier préférant se recentrer sur son nouveau format. Il est à noter qu'en 2007, le format avait été largement décortiqué par l'équipe de Sun travaillant sur OpenOffice.org et ayant publié alors leurs propres spécifications[3].
Défauts techniques
Certaines personnes qualifiées par Microsoft de Most valuable professionnals (MVP) font état d'une faiblesse importante du format de fichier doc pouvant mener à une corruption de fichiers (perte des données contenues) : toutes les mises en formes seraient reliées au dernier saut de section du document (qui est la dernière marque de paragraphe). Le nombre de propriétés à gérer par Word pour ce saut de section croît exponentiellement avec la taille du document, augmentant le risque d'erreur lorsque le fichier devient trop complexe[4],[5],[6],[7].
La rétro compatibilité n'est pas assurée pour certaines versions de Microsoft Word et donc par ses formats[8].
Alternatives
Le format propriétaire doc de Word pose des problèmes aux utilisateurs en raison de sa non interopérabilité. Aussi des « formats ouverts » ont-ils été présentés :
- ODF - OASIS Open Document Format for Office Applications, norme ISO 26300, pour les documents bureautiques ;
- PDF - Adobe Portable Document Format, norme ISO 19005-1, pour les documents finalisés.
Notes et références
- (en)Belgif
- http://www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx
- Microsoft Compound Document Format, OpenOffice.org, 2007-08-07
- Why Master Documents corrupt
- How can I recover a corrupt document or template – and why did it become corrupt?
- Word:Mac — Document Corruption
- Word:Mac — Troubleshoot Word 2001 (and 98)
- http://www.archivesdefrance.culture.gouv.fr/fr/publications/dafbuln%B014.html Françoise Banat-Berger, Compte rendu du colloque de l'association Aristote : Enjeux et impacts d’XML pour la bureautique, Bulletin des Archives de France sur l'archivage à long terme des documents électroniques no 14, janvier 2004. ,
Voir aussi
Article connexe
Lien externe
Catégories :- Format de données numériques
- Format fermé
Wikimedia Foundation. 2010.