- Histoire du thésaurus
-
Les premiers thésaurus datent des lendemains de la Seconde Guerre mondiale mais les origines philosophiques et logiques de cette technique documentaire sont beaucoup plus anciens.Le mot Thésaurus est un emprunt au grec ancien θησαυρός « trésor » via le latin thesaurus. Etymologie ( 1823 ) , "trésor,, magasin "; du latin Latin thesaurus trésor et du grec thesauros, de tithenai mettre, placer .
« Le sens d'encyclopédie avec informations date de 1840 mais il existait auparavant des thesaurie (1592), utilisés comme titre par les compilateurs de dictionnaires. Le sens « collection de mots rangés selon leur sens » est attesté en 1852 dans le titre de Rodget. Thesaur est attesté au Moyen Age avec le sens de « trésor » (15e-16e siècles) »[1].
Le terme thésaurus semble donc[2] emprunté au Thesaurus de Peter Mark Rodget (en), Thesaurus of English Words and Phrases Classified and Arranged so as to Facilitate the Expression of Ideas and Assist in Literary Composition mais existait déjà auparavant en plusieurs sens différents de dictionnaire ou de recueil de savoir encyclopédique , ou encore de textes. Par exemple , le Thesaurus brevium, or a collection of approved forms of writs and pleadings to those writs and entries of those writs and pleadings, together with their special directions to all cities and boroughs,Collected and published by J. C., seconde édition 1687[3].
Sommaire
Le thésaurus contemporain
Un nouvel outil en documentation et en sciences de l'information (en anglais Information Retrieval) destiné à l'indexation automatique ou manuelle puis au repérage des documents apparait après la Seconde Guerre mondiale. Le mot thésaurus a été employé en documentation à cause du Thesaurus de Peter Mark Rodget (Roget's Thesaurus of english words and phrases - 1852) qui était un dictionnaire anglais de synonymes et de notions connexes, organisé systématiquement[4]. Après la guerre, c'est-à-dire dès 1947 le développement des sciences et techniques en documentation a nécessité de nouveaux outils de recherche et entraîné entre 1947 et 1957 un grand courant international de recherches théoriques en recherche d'information et en classifications documentaires.
Peter Luhn, et Bernier et Crâne aux Etats-Unis, revendiqueront chacun la paternité du thesaurus documentaire de mots-clefs, termes ou concepts. Ce mot, devenu à la mode pour tout ce qui concernait le contrôle du vocabulaire (langage contrôlé), fut utilisé la première fois publiquement en documentation par Hélène - Louise Brownson (secrétaire de Vannevar Bush), après dix années de recherches théoriques à la Conférence de Dorking en ces termes : « application of a mechanized thesaurus based of neetworks of related meanings » [5],[6].
Les précurseurs du thésaurus
Origines antiques et philosophiques
- Tablettes cunéiformes: listes de mots, de termes
- Bible: la sagesse comme un trésor de connaissances (métaphore)
- Livre de Daniel : termes générique et termes spécifiques
- Platon et ses Idées (mots-clefs).
- Hésiode : La langue est un trésor de mots
- Raymond Lulle et les arbres de la connaissance (graphisme)
- Leibniz et les Monades
Origines contemporaines
- Gérard Cordonnier[7] : en France, les travaux de Gérard Cordonnier, puis Jean-Pierre Pagès avec le CODOC et Jean-Claude Gardin avec le SYNTOL sur le Langage codé sont très proches de recherches effectuées aux États-Unis par Bernier et Crane et par Luhn sur le thesaurus[8]
- Calvin Mooers : aux États-Unis, avec Mooers et le Zatocoding[9] ) du Massachusetts Institute of Technology (MIT), introduit le premier les termes descripteur Descriptor (en) en recherche d'information, IRT, mot employé en 1949, mais auparavant en février 1947 dans un article fait elliptiquement allusion à un nouvel instrument lexicographique appelé thesaurus lié à la recherche mécanisée, qui comprendrait des « termes d'indexation » avec des « nuances de signification », et ainsi qu'un dictionnaire et une encyclopédie, puis abandonna l'idée de lier le thésaurus au dictionnaire (qui comprend la définition des termes). Un outil appelé thésaurus de recherche documentaire et informationnelle était donc déjà inventé avant son application pratique. C'est en 1959 seulement que date le premier thésaurus opérationnel nommé ainsi, et postérieur au concept de thésaurus, objet de recherches de chercheurs américains et européens.
- Mortimer Taube : Plus tard en 1951 Mortimer Taube invente les Uniterms à partir des intuitions de Mooers (1955, The Uniterm system of index : à chaque uniterme correspond une fiche, où sont inscrits les numéros de référence des documents sélectionnés pertinents) et la recherche se fait ensuite grâce à des cartes perforées. Les premiers thésaurus sont liés au système documentaire des cartes perforées ou punched cards. Taube s'appuie sur des mots-clefs et Mooers sur des concepts, or un concept peut - être décrit par plusieurs mots-clefs différents.
- Charles Bernier et E.J. Crane : Toujours en 1947 les ingénieurs Crane, E. J., et Bernier, Charles. L., de Chemical Abstracts aux États-Unis, travaillent sur les sémantèmes et la sémantique et développent eux aussi un concept de thésaurus adapté à la recherche d'informations cette fois de façon professionnelle : jusqu'en juillet 1957, date où il introduit la notion d'un « thésaurus technique ». Bernier poursuit ses recherches pour construire un réseau d'associations permanentes entre les concepts : « Une collection complète de rapports permanents parmi les sémantèmes pour en science définie est un enregistrement concentré de faits établis et acceptés de la science de l'époque, qui a une valeur en mettant en œuvre un rappel des faits pertinents. Une collection de rapports de cette nature ressemblerait à un thésaurus. » (Bernier et Heumann)[10].
- Ranganathan : En 1933, Ranganathan invente la classification à facettes appelée aussi Colon classification (qui entraîne plus tard, Cf Jean Aitchison, la création du thésaurus à facettes, thesaurofacettes ou Thesaurofacet).
- Hans Peter Luhn : ingénieur suisse chez IBM, fécond en idées, Luhn est le créateur des « codes-notions » et « familles de notions » pense lui dès 1952 comme Mooers mais sans utiliser le terme de thésaurus, dont pourtant on le crut être l'inventeur mais il n'utilise ce terme qu'en 1957 au sujet d'un « dictionnaire de notions » c'est-à-dire de termes autorisés pour l'indexation, avec classes (segments) de sous - classes, coordination des termes, recherches destinées à l'informatique. En 1959 Luhn invente les index permutés KWIC (Key Word in Context) qui complèteront ensuite les thésaurus. En 1957, J-P Wadington introduit un système d'IR dans lequel les mots sont organisés par classes avec un rapport générique / spécifique[11].
- Le Cambridge Langage Recherch Unit (CLRU)[12] : En Angleterre, le Cambridge Langage Recherch Unit (Needham, Joyce, Whiley , K. Sparck Jones, M. Masterman[13]) étudie le thésaurus sous un modèle mathématique (Algorithmique). En 1955, des travaux expérimentaux ont lieu avec un thésaurus documentaire de recherche au Royal Radar Establishement, Malven.
Les premiers thesauri
Le premier thésaurus opérationnel est celui des termes de la chimie en 1959, Thesaurus of Engineering Terms (E.I.DuPont de Nemours and Co. de l'Engeneering Information Center. Le Thesaurus of ASTIA descriptors en mai 1960 créé par l’Armed Services Technical Information Agency (devenue le Defense Documentation Center) avec des concepts selon la méthode de Calvin Mooers, c'est-à-dire des « descripteurs », mots ou groupe de mots proposés pour l'indexation et qui fusionnera avec le thesaurus of Engineering Terms, construit par l’Engineers Joint Council, en 1964 pour former le Thesaurus TEST en 1967. En 1961 parait le Chemical Engineering Thesaurus, élaboré par l'American Institute of Chemical Engineers (AIChE). On appela donc aussi le thésaurus documentaire « thésaurus de descripteurs » (G.Van Slype). Le Bureau Van Dijk se spécialisa dans le thésaurus à schémas fléchés, à représentation graphique, avec des terminogrammes tel le Thesaurus Euratom , le premier thésaurus européen, et on inventa aussi des thésaurus à arborescences à polygones ou à schémas circulaires (ou cercles concentriques) tel celui de l'armée néerlandaise en 1964, le TDCK Circular Thesaurus System[14]. Le premier thésaurus français portant ce nom serait le thésaurus l'armement du CEDOCAR. La floraison de thesauri date des années 1970 en sciences et techniques. Dès les années 1960 apparaissent des symposiums sur la construction de thesauri (Symposium on Thesaurus Building, Oslo, Norway (1965) appelés aujourd'hui workshop (Building Taxonomies for Information Retrieval: A Hands-On Workshop, 2005, ASIS). Selon Brian Vickery ce mot regroupe alors au moins quatre sens différents sous un même mot. Apparaissent des bibliographies et des annuaires de thesauri nationaux et internationaux, recensés soit par l'ASLIB ou par le Bulletin des bibliothèques de France (BBF) en France[15]. Les thésaurus sont inventoriés dans différents répertoires dont :
- http://dmoz.org/World/Français/Références/Thésaurus/ Répertoire DMOZ, rubrique Thésaurus
- clearing house, à Varsovie
- au Canada à Toronto (« The Thesaurus clearinghouse », pour la langue anglaise).
Le thésaurus fut inventé en vue de l'indexation puis de la recherche de documents, en anglais Information Retrieval. En 1971, l'UNESCO a établi des principes directeurs pour les thésaurus multilingues. Bien vite, en 1972/74, le thésaurus est normalisé (normes nationales AFNOR Z 47 - 100 et internationales ISO 2788), après un symposium à Berlin-Ouest en 1973 avec l'UNISIST, l'ISO et l'UNESCO puis une conférence à Helsinki en mai 1976 qui conduit au Projet de guide d'établissement de thésaurus multilingues. Suite à la publication de nouvelles normes anglo-saxonnes en 2005 (ANSI/NISO Z39.19 et BS 8723), une nouvelle version de cette norme ISO, fusionnant les versions mono- et multilingue, est apparue sous forme de projet en octobre 2009.
Articles connexes
Liens externes
- Page de Mickaël Buckland
- |Pionniers des Sciences de l'information
- Sylvie Fayet Scribe, Chronologie des supports, des dispositifs spatiaux, des outils de repérage de l'information Journal SOLARIS
Notes et références
- http://www.wordinfo.info/ article Thésaurus et racine thesaur-
- Cf. Bernier.
- Référence du Catalogue BNF Opale
- Cf. Charles Bernier[réf. incomplète].
- 1957 http://www.bbf.enssib.fr/consulter/bbf-1958-01-0040-008] Journée d'études de Dorking, « International Study Conference on Classification for Information Retrieval »,
- Sylvie Dalbin, Informatique et Thésaurus documentaire, des Noces d'Or, Documentaliste Sciences de l'Information 2007, vol.4, n° 1.
- cf. Mémoire de maîtrise en sciences de l'information , Université de Panthéon Sorbonne, 1997-1998 : Gaëlle MILLET : HISTOIRE DES PREMIERS THESAURI EN FRANCE A TRAVERS TROIS PERSONNES CLEFS : ROBERT PAGES, JEAN CLAUDE GARDIN, ET DANIELE DEGEZ sous le direction de Sylvie Fayet Scribe
- [1]. Cf. Vers des précurseurs :
- Calvin Mooers [2] cf.
- Bernier et Crane, Correlative Index , Semantics and semantems...
- H-P Luhn, " A statistical approach to mechanized encoding and searching of literature information", publié dans l'IBM Journal of Research and Development. Cet article expose les bases de l'indexation automatisée des textes, fondée sur l'analyse statistique de la fréquence des termes et ouvre la voie à tous les travaux sur l'analyse des occurrences et des co-occurrences. Luhn utilise également dans cet article le terme de thésaurus. (Source Urfist d'après CHAUMIER).
- [3]
- Margaret Masterman, Language, Cohesion and Form, Cambridge University Press, decembre 2005.
- http://bbf.enssib.fr/.../bbf-1969-05-0181-001
- [4] Marie-Thérèse Laureilhe Essai de bibliographie et index par matières parus depuis 1960 (au 1er mars 1969): etc... voir aussi [16] Marie-Thérèse Laureilhe, De quelques thesauri, Bbf 1970 - Paris, t. 15, n° 1
Bibliographie
Sources clefs :
- Roberts, THE PRE-HISTORY OF THE INFORMATION RETRIEVAL THESAURUS , Journal of Documentation, Volume 40, Number 4, 1984 , pp. 271-285(15)
- Brian Vickery, THESAURUS — A NEW WORD IN DOCUMENTATION Journal of Documentation, Volume 16, Number 4 , 1960 , pp . 181 - 189 .
Divers :
- International Classification and indexing bibliography 1 Classification systems ans thesauri, 1950-1982, Francfort, indek Verlag, 1982
- D'après une source internet, l'appendice de la thèse de Karen Spark Jones, Synonymy and. Semantic Classification ( Université de Cambridge, 1968) , contiendrait une longue histoire du thesaurus .
- Alan GILCHRIST : The Thesaurus in retrieval , 1973.
- H. P. Luhn: Pioneer of Information Science: Seleeted Works. 1968. Edited by Claire. K. Schultz. Spar- tan Press, New York, N.Y International Classification and Indexing
- Bibliography, 1950-1982: Classification Systems and Thesauri v. 1 - sous la direction de Ingetraut Dahlberg
- VAN SLYPE Georges Définition des caractéristiques essentielles des thesauri Bruxelles : Bureau Marcel van Dijk, 1976
- La recherche d'informations : du texte intégral au thésaurus - LEFEVRE Philippe, Hermés, 09-2000
Lire aussi : Historical studies in information science - Par Trudi Bellardo Hahn, Michael Keeble Buckland sur Google Books
Articles
- Sur le site de JASIS Gerard Salton The past thirty years in information retrieval Journal of the American Society for Information Science Volume 38, Issue 5, Date: September 1987, Pages: 375-380 Gerard Salton
- Jacques Chaumier - La saga IBM de l’informatique documentaire. Quelques jalons.
- Sylvie Dalbin :
- Thésaurus et informatique documentaires Des Noces d'Or
- Thésaurus et informatique documentaires Partenaires de toujours?Documentaliste Sciences de l'Information, 2007, Vol 44, N°1
- Paul-Dominique Pomart - Perspectives pour un nouveau siècle Documentaliste, Sciences de l'Information Volume 40 2003/2 p. 127 à 131
- Hubert Fondin - La Science de l'information et le poids de l'histoire
Wikimedia Foundation. 2010.