- Comma separated values
-
Comma-separated values
Pour les articles homonymes, voir CSV.Comma-separated values .csv
text/csv
Type de format
fichier texte Standard(s)
(en) RFC 4180 Spécification
Format ouvert Comma-separated values (CSV) est un format informatique ouvert représentant des données tabulaires sous forme de « valeurs séparées par des virgules ».
Ce format n'a jamais vraiment fait l'objet d'une spécification formelle. Toutefois, la RFC 4180 décrit la forme la plus courante et établit son type MIME "text/csv", enregistré auprès de l'IANA.
Un fichier CSV est un fichier texte (par opposition aux formats dit « binaires »). Chaque ligne correspond à une rangée du tableau et les cellules d'une même rangée sont séparées par une virgule.
Une ligne est une suite ordonnée de caractères terminée par un caractère de fin de ligne (line break – CRLF), la dernière ligne pouvant être exempt de ce dernier.
Par exemple :Sexe,Prénom,Année de naissance M,Alphonse,1932 F,Béatrice,1964 F,Charlotte,1970
représente les données suivantes :
Sexe Prénom Année de naissance M Alphonse 1932 F Béatrice 1964 F Charlotte 1970 Variantes françaises
Le fait que les fichiers CSV soient essentiellement utilisés autour du logiciel Microsoft Excel, et que les séparateurs ne soient pas standardisés (virgules, points-virgules (sous certaines localisations dont la française), etc.) rend ce format peu pratique pour une utilisation autre que des échanges de données ponctuelles. Ce format est toutefois assez populaire parce qu'il est relativement facile à générer.
Les champs texte peuvent également être délimités par des guillemets (1). Lorsqu'un champ contient lui-même des guillemets (2), ils sont doublés afin de ne pas être considérés comme début ou fin du champ. Si un champ contient le séparateur (3) (virgule, points-virgules, etc.), il est obligatoire d'ajouter des guillemets afin que le séparateur soit échappé.
Exemple, avec des champs séparés par des points-virgules et des guillemets :
Robert;Dupont;rue du Verger, 12;... (1) " Michel " ; " Durand " ; " av. de la Ferme, 89 ";... (2) " Michel ""Michele"" " ; Durand ; " av. de la Ferme, 89 ";... (3) " Michel;Michele " ; " Durand ";" av. de la Ferme, 89 ";...
Alternatives
Le format CSV présente entre autres désavantages d'être interprété par Excel, comme étant au format anglais (séparateur de colonnes : virgule ; séparateur de décimales : point) ou français de France (séparateur de colonnes : point-virgule ; séparateur de décimales : virgule) en fonction de l'origine du fichier : sur disque, par HTTP, support amovible...
Le format SYLK présente l'avantage d'être un format texte et d'être indépendant de la langue d'Excel (anglais, français, ...). Il peut intégrer des formules mathématiques simples et contrôler certaines propriétés des cellules. De plus, les cellules du tableur peuvent être remplies dans le désordre.
Un simple tableau au format HTML peut aussi être une alternative, puisque les dernières versions d'Excel acceptent depuis quelques années, ce format en entrée.
Voir aussi
- (en) RFC 4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files
- csvdiff
- CSVed
- Format TSV
Catégories : Format ouvert | Format de données numériques
Wikimedia Foundation. 2010.