- Cordial
-
Cet article concerne l'informatique. Pour les autres significations, voir Cordial (homonymie).
Cordial Développeur Synapse Développement Dernière version Cordial 2011 (25 octobre 2010) [+/−] Environnement Windows Langue Français
+ anglais, allemand, espagnol, italien, portugaisType Correcteur orthographique grammatical Licence Logiciel propriétaire Site web Synapse Développement modifier Cordial est un logiciel de correction grammaticale et d'aide à la rédaction pour la langue française pour Microsoft Windows.
Il existe en deux versions : standard et professionnelle. Les deux versions disposent du même correcteur mais la version professionnelle propose en plus le dictionnaire Littré, le Trésor de la langue française, quelques dictionnaires spécifiques (codes postaux, vrais / faux-amis, etc.) et des outils d'aide à la traduction (français, anglais, espagnol, allemand, italien, portugais).
Historique
Conçu par la société toulousaine Synapse Développement, Cordial est le fruit de l'effort d'une équipe d'une dizaine de développeurs et de linguistes. Né d'un correcteur orthographique intégré en 1988 dans le logiciel de traitement de texte Le Rédacteur (sur Atari ST), qui se mua en correcteur grammatical en 1992 dans Le Rédacteur 4, Cordial a connu sa première version sous Windows en février 1995.
En fait, le mot « Cordial » est un acronyme pour « CORrecteur D'Imprécisions et Analyseur Lexico-syntaxique » . Depuis 1995, Cordial connaît environ une nouvelle version par an. La dernière version a été commercialisée en octobre 2012.
De 1997 à 2007, le correcteur orthographique, le dictionnaire de synonymes et l'outil de césure fournis avec la suite Office de Microsoft sont des outils développés par la même société, Synapse Développement. Sur Macintosh, tous ces outils et le correcteur grammatical pour le français sont également issus de cette société.
Le logiciel Cordial
Les principales caractéristiques[1] du logiciel Cordial ont été présentées lors de la journée d'étude de l'ATALA du 3 juin 2006[2].
Interface
Cordial peut être utilisé de deux façons :
- grâce à son éditeur dédié : fluide, simple, très proche de Notepad
- intégré dans les logiciels comme Word ou Openoffice. En effet Cordial « bénéficie d'une parfaite intégration aux applications MS Office, OpenOffice, Internet Explorer, Firefox, Opera, aux messageries instantanées et aux outils de PAO »[3].
L'analyseur
Pour corriger automatiquement un texte, il faut analyser grammaticalement chaque phrase. Cette analyse ne peut s'effectuer comme une analyse grammaticale logique habituelle. En effet, pour repérer les fautes, l'analyseur est contraint d'utiliser des règles d'analyse floues. Ainsi, dans la phrase « ils sont grandes consommateurs de pâtisseries », un analyseur formaliste ne constituera jamais un groupe entre les mots « grandes » et « consommateurs », car ils sont de genres différents, donc soit il raccordera « grandes » à « pâtisseries », soit il laissera « grandes » comme un groupe à part hors contrainte grammaticale. Un analyseur flou, comme celui qu'utilise Cordial, prenant en compte la position des mots dans la phrase et les régularités statistiques, placera dans un même groupe l'adjectif « grandes » et le nom « consommateurs », ce qui lui permet de déceler la faute d'accord et de proposer de remplacer « grandes » par « grands ».
L'analyseur de Cordial peut être observé dans le logiciel, qui propose l'analyse en liste ou en arbre de chaque phrase. L'une des principales caractéristiques de Cordial est sa rapidité : Cordial peut analyser un ouvrage entier en quelques secondes (les auteurs annoncent une vitesse d'analyse de 15 000 mots/seconde sur Pentium 3 GHz).
Le correcteur
Le correcteur applique les règles de grammaire sur l'analyse effectuée par l'analyseur[4]. Lorsqu'un mot est inconnu des dictionnaires (c'est-à-dire le plus souvent lorsqu'il est fautif car les dictionnaires de Cordial sont très complets), il propose un ou plusieurs mots de remplacement, généralement un seul et presque toujours le bon. C'est ce qu'on appelle en informatique la correction orthographique. Lorsqu'un mot est dans les dictionnaires mais correspond à une faute d'accord ou, plus généralement, à une faute de grammaire, le correcteur propose de le remplacer par le bon mot.
Le correcteur corrige de très nombreux types de fautes et, en particulier, les fautes d'homophonie et d’homographie. Ainsi, si vous écrivez « La page demande de la confiture de coins. », Cordial vous proposera « Le page demande de la confiture de coings. », en repérant la faute d'homographie entre « la page » et « le page » et la faute d'homonymie entre « coin » et « coing » .
Ces fonctions de correction sont obtenues grâce à l'analyseur sémantique associé à l'analyseur grammatical. Le logiciel repère en effet le sens de chacun des mots qui peuvent avoir plusieurs sens (les sens trouvés sont présentés dans l'analyse de la phrase proposée par Cordial).
La correction orthographique est proposée pour l'anglais, l'espagnol et l'allemand. Dans la version professionnelle, les corrections grammaticales pour l'italien et le portugais s'y ajoutent.
Amélioration de la correction, grâce à Wikipédia
Synapse Développement, par l’exploitation intensive des révisions de Wikipédia (fournies par la fonctionnalité http://download.wikimedia.org/frwiki/) a amélioré son traitement de la correction[5].
Le principe a consisté à comparer automatiquement les révisions entre elles pour en extraire les différences minimes correspondant à des corrections. Ont ainsi été extraites 1,2 million de fautes d’orthographe, 1,5 million de fautes de grammaire et plus de 900 000 fautes de typographie (trait d’union et capitale). Grâce à ce corpus très important, les développeurs ont pu tester et améliorer leurs algorithmes, provoquant un véritable bond en avant du niveau de correction et, en parallèle, une réduction du taux de « fausses erreurs » (messages inappropriés).
Performances de la correction
Cordial autorise le paramétrage de la correction. Depuis sa première version, on peut régler le niveau de correction en fonction du niveau désiré. Soit le logiciel trouve la majorité des erreurs mais au prix de quelques messages non pertinents, soit il corrige un peu moins d'erreurs mais avec une meilleure probabilité.
L'imperfection de la correction s'explique par le fait que l'analyse grammaticale et le repérage des sens des mots ne sont pas des sciences exactes. Ce sont des domaines de recherche. De plus, les spécialistes de la grammaire française débattent encore de certains accords du participe passé, en particulier les accords relatifs aux verbes pronominaux figés comme « se faire fort ».
Depuis la version « Cordial 2010 », le logiciel permet la correction automatique et la correction automatisée, permettant ainsi de réduire des deux tiers le temps de correction[6].
Cette fonction de correction automatique est utilisée, par exemple, par la société Softissimo pour son traducteur « Reverso », permettant à l’utilisateur de corriger son texte avant traduction[7].
Les bases lexicales
Cordial offre plusieurs dictionnaires[1]. Dans la version Cordial 2011[8], le dictionnaire de noms communs intègre 257 177 lemmes correspondant à 1 485 693 mots, et le dictionnaire de noms propres contient 831 759 entrées. Le correcteur s'appuie aussi sur des dictionnaires de locutions contenant plus de 100 000 expressions, sur un dictionnaire de sigles de 40 584 termes et sur un dictionnaire de 5 206 abréviations. Tous ces mots, expressions, sigles et abréviations ont leur définition. Il s'agit d'une des plus grandes bases lexicales existantes pour le français, selon les informations fournies par les éditeurs[9],[10].
Cordial dico est une version pour iPhone, qui offre plusieurs dictionnaires de définitions, les plus complets du marché accessibles sur iPhone[11],[12].
Autres dictionnaires
Cordial est accompagné de 18 dictionnaires dans sa version standard et de 68 dans sa version professionnelle. Le dictionnaire de synonymes et d'antonymes comporte plus de 50 000 entrées pour un total de 4 millions de synonymes. Dans sa version professionnelle, Cordial donne accès au dictionnaire Littré ainsi qu'au Trésor de la langue française. Les deux dictionnaires ont été entièrement revus pour une lecture simplifiée. Ainsi toutes les abréviations, nombreuses dans les deux ouvrages ont été étendues. Des onglets permettent, dans le Littré, de choisir les informations désirées. Des dictionnaires de faux-amis et de traduction mot à mot ou expression à expression sont également disponibles dans la version professionnelle, pour n'importe quel couple de langues entre français, anglais, allemand, espagnol, italien et portugais. Dans la version professionnelle, Cordial indique les noms faisant l'objet d'une marque déposée et les noms de société[13].
Corpus de base
Le corpus de base est un ensemble d'œuvres et de textes utilisés par Cordial pour son développement (repérage des fautes usuelles, des mots utilisés et de leur fréquence, etc.) et pour des fonctions de comparaison entre ces textes et ceux de l'utilisateur.
Dans ses premières versions, Cordial utilisait un « petit » corpus de 2 600 œuvres et de textes de journaux, représentant environ 500 millions de mots. Dans sa version la plus récente, ce corpus a été porté à 5 000 ouvrages et plus d'1,2 milliard de mots[14]. Par comparaison avec les corpus utilisés en linguistique informatique[15],[16], ce corpus se distingue par sa taille mais également par la part importante d'œuvres récentes et très récentes (plusieurs centaines d'œuvres sont postérieures à 2000)[17].
Analyse des textes
Grâce aux dictionnaires et au corpus, Cordial propose de nombreuses options d'analyse de texte : recherche de mots-clés, de concepts-clés, de phrases-clés, analyse statistique, analyse sémantique, analyse stylistique, cooccurrences, segments répétés. Il est également possible de comparer chacun de ses textes aux 5 000 œuvres du corpus de base décrit ci-dessus ainsi qu'à de grandes catégories de texte (journalistique, commercial, juridique, technique).
Intégration dans d'autres logiciels
Cordial s'intègre dans Microsoft Office en remplaçant son correcteur. Ainsi les soulignements en rouge (orthographe) et en vert (grammaire) effectués lors de la frappe dans Word sont ceux de Cordial, une fois installé le logiciel. Par ailleurs, les fonctions de Cordial sont disponibles dans le ruban de MS Word, MS Excel, MS PowerPoint et MS Outlook.
Cordial s'intègre également dans de nombreux logiciels sous Windows comme les logiciels de messagerie, Internet Explorer, les logiciels de mise en page, etc.
Depuis la version 2010 de Cordial, l'intégration dans OpenOffice 3.1 est complète avec soulignement en rouge des fautes d'orthographe et soulignement en bleu des fautes de grammaire[18].
Protections contre la copie
- la version 6 utilisait une disquette 3"1/2 non verrouillée en écriture sur laquelle était noté le nombre d'installations. La perte de cette disquette rendait impossible la ré-installation
- en 2008 un code calculé à partir du profil materiel doit être transmis à Synapse. En retour, un code d'activation est renvoyé. Sans code, Cordial reste en mode bridé : pas de sauvegarde, pas de copié-collé.
Aides et manuels
Le logiciel est fourni avec des manuels au format PDF expliquant l'ensemble des fonctionnalités ainsi qu'un manuel de grammaire, également disponible en ligne, de plus de 1 100 articles. L'ensemble des manuels fournis dans l'édition 2009 représente 1 342 pages.
Clients
Cordial s'adresse à l'ensemble des francophones. Il dispose de mots de vocabulaires canadien, belge, suisse, africain et antillais, et plusieurs paramètres permettent de prendre en compte ou de signaler les termes issus de ces vocabulaires.
Les clients de la version professionnelle semblent être surtout des « professionnels de la langue » (journalistes, écrivains, avocats, correcteurs, traducteurs…) qui l'intègrent dans leurs applications[19] tandis que la version standard touche un public beaucoup plus large, en particulier les enseignants, les étudiants et lycéens, cette version étant commercialisée à la moitié du prix de la version professionnelle[20]. Dès 1999, Cordial était utilisé par l'Agence France-Presse, l'Encyclopedia Universalis et une dizaine d'universités[21].
Une version spécifique de Cordial, Cordial Analyseur, s'adresse aux laboratoires de traitement automatique du langage naturel. Il est commercialisé à petit prix[22] et il est très utilisé par les chercheurs en linguistique informatique[23],[24] et en lettres[25],[26]. Cette version fournit un analyseur morpho-syntaxique, outil de base des linguistes pour l'étiquetage : « Cordial étant très vraisemblablement le meilleur étiqueteur morpho-syntaxique disponible pour le français écrit »[27]. « Cet analyseur est accessible à un utilisateur totalement néophyte. De plus, il est extrêmement rapide (moins d’une seconde pour un article d’une page) »[28]. C'est ce même analyseur qui est intégré dans l'outil Qristal, logiciel de recherche en langage naturel (sur disque dur et sur le Web) de cette même société Synapse Développement[29].
Une version de démonstration de Cordial2009 est disponible gratuitement[30].
Utilisations singulières
Peu d'utilisateurs de Cordial utilisent la totalité des outils proposés[1], certains ne se servent même pas de sa fonction première de correcteur. Ainsi des traducteurs du français vers une autre langue ont mis au point une formule de calcul de devis à partir de l'analyse statistique de Cordial, du degré de lisibilité et de la complexité grammaticale des phrases. Des éditeurs et des cabinets de traduction l'utilisent pour comparer les graphies des noms propres, via l'option « occurrences » et vérifier que, pour une œuvre, la même graphie est toujours utilisée pour un même mot; les enseignants utilisent les fonctions d'analyse grammaticale et d'analyse de texte, mais également les dictionnaires de définitions et de synonymes[31].
Depuis sa version 2008, Cordial peut aussi être utilisé pour résoudre des anagrammes, des mots croisés ou de nombreux jeux de lettres.
Partage de connaissances
Dans un souci de partage de connaissances, la société Synapse Développement fournit gratuitement le manuel de grammaire en ligne[32] depuis plus de 10 ans. De même, grâce à la version spécifique Cordial analyseur, la société Synapse Développement fournit aux linguistes des données statistiques sur plusieurs milliers d'ouvrages « étiquetés », 5 000 ouvrages « étiquetés » depuis 2007[5].
Concurrents
- LanguageTool un correcteur de grammaire française libre LanguageTool (Open Source)
- Correcteur 101, de Machina Sapiens
- Antidote, de Druide informatique
- ProLexis, des Éditions Diagonal
Distinctions
Cordial a reçu plusieurs prix ou nominations de la part de revues informatiques[33] :
- 2001: nomination de Cordial 7 au "Palmarès des Meilleurs Produits Micro 2001"
- 2001: produit de l'année pour la catégorie "aide à la rédaction" par Windows News
- 1997: nomination de Cordial pour le "Prix d'excellence technique" par PC expert
Le responsable du développement, Dominique Laurent, a été élu « personnalité française de l'année » en 2001 dans le dossier annuel Excellences techniques de la revue PC Expert[34]. Dominique Laurent est toujours responsable du développement de la société, il est également membre du comité permanent du TALN (Traitement automatique des langues)[35].
Notes et références
- Présentation du logiciel CORDIAL à la journée d'étude ATALA sur site de la société Synapse Développement, 3 juin 2006. Consulté le 6 novembre 2010
- Objectifs - Thèmes - Programme - Comité de programme de la journée d'étude ATALA sur site du Limsi, 3 juin 2006. Consulté le 6 novembre 2010
- Revue SVM, no 277, janvier 2009, p. 68
- À propos de la correction grammaticale française et des correcteurs informatiques sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Nouveautés de Cordial 2011 sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- La correction automatisée et la correction sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Correcteur en ligne sur orthographe.reverso.net. Consulté le 6 novembre 2010
- Les données relatives aux dictionnaires intégrés dans le logiciel Cordial sont vérifiables par les utilisateurs, en visualisant la totalité des mots par la commande « visualiser les dictionnaires »
- Les dictionnaires d'Antidote : 122 000 mots dont 12 000 noms propres] sur www.druide.com. Consulté le 6 novembre 2010
- Correction du français : Pro Lexis détecte plus de 625 000 flexions de mots sur www.prolexis.com. Consulté le 6 novembre 2010
- Un dictionnaire adapté à l'Iphone sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Cordial Dico application 'Référence' pour iPhone sur site MonAppStore.com : l'annuaire des applications iPhone disponibles en français. Consulté le 6 novembre 2010
- Revue PC Expert, décembre 2008, p. 23
- Le corpus de base sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Corpus Frantext sur site du Centre national de ressourses textuelles et lexicales. Consulté le 6 novembre 2010
- Principes de constitution du corpus TALN sur site du laboratoire MoDyCo de l'UMR 7114 de l' Université Paris Ouest Nanterre La Défense. Consulté le 6 novembre 2010
- Les 5 000 ouvrages du corpus de Synapse Développement par auteur sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Toute la puissance de l'analyse et la correction de Cordial dans l'ensemble de la suite OpenOffice 3.2 ! sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Références pour les API sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Pro 2009: La correction revue et corrigée sur www.bluewin.ch. Consulté le 6 novembre 2010
- lire en ligne] Xavier Bihan, Les correcteurs orthographiques, janvier 2000, [
- Session "Show & Tell" Démonstration et Applications industrielles sur site de l'Association francophone de la communication parlée. Consulté le 6 novembre 2010
- lire en ligne] Nathalie Gasiglia, Faire coopérer deux concordanciers-analyseurs pour optimiser les extractions en corpus, Revue française de linguistique appliquée 1/2004 (Vol. IX), p. 45-62, [
- lire en ligne] Rachel Panckhurst, Une La glose, le document électronique et l'extraction automatisée, U.M.R. 5475 C.N.R.S. « Discours, textualité et production de sens », Praxiling, Université Paul-Valéry Montpellier 3, publié dans Langues et langages, Le mot et sa glose, A. Steucckardt et A. Niklas-Salminen, no 9, p. 271 à 294, 2004, [
- lire en ligne] Thierry Selva, Une étude quantitative du vocabulaire de Maupassant, article paru dans la revue L’Angélus no 12 daté décembre 2001, paru en janvier 2002, p. 41-48, [
- lire en ligne] Tamara This-Rogatcheva, Étude lexicométrique du conte fantastique de Ludwig Tieck : Le Runenberg, Université Paris XII, 2004, [
- lire en ligne] Sarah Leroy, Extraire sur patrons : allers et retours entre analyse linguistique et repérage automatique, Université Paris X-Nanterre / CNRS-UMR 7114 (Modèles, Dynamiques, Corpus), CAIRN, Revue Française de Linguistique Appliquée 2004-1 (Vol. IX)], [
- lire en ligne] André Valli & Jean Véronis, Étiquetage grammatical des corpus de parole : problèmes et perspectives, Université de Provence, 2000, [
- lire en ligne] Dominique Laurent, Sophie Nègre, Patrick Séguéla, QRISTAL, le QR à l'épreuve du public, TAL volume 46 no 3, 2005, p. 1 à 32, [
- Version de Cordial2009 téléchargeable gratuitement sur www.jetelecharge.com. Consulté le 6 novembre 2010
- [hhttp://www.synapse-fr.com/descr_technique/Utilisations.htm Utilisations non conventionnelles de Cordial] sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Grammaire française en ligne sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Prix et récompenses reçus par Cordial sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Excellences techniques 2001 sur site de la société Synapse Développement. Consulté le 6 novembre 2010
- Liste des membres du comité permanent du TALN sur atala.biomath.jussieu.fr. Consulté le 6 novembre 2010
Liens externes
- Portail de la langue française et de la Francophonie
- Portail de l’informatique
Catégories :- Dictionnaire de la langue française
- Logiciel de linguistique
- Correcteur orthographique
- Logiciel pour Windows
Wikimedia Foundation. 2010.