Indexé

Indexé

Indexation

Sommaire

En gestion documentaire

En bibliographie

L'indexation d'un texte consiste à repérer dans celui-ci certains mots ou expressions particulièrement significatifs (appelés termes) dans un contexte donné, et à créer un lien entre ces termes et le texte original. Par exemple, les pages d'index d'un livre reprennent (parfois) les termes significatifs apparaissant dans le livre, et les relient aux pages du livre où ces termes (ou leurs synonymes) apparaissent. Ceci facilite pour le lecteur la localisation des pages ou sections où l'on mentionne un sujet particulier. De même, la table des matières d'un livre est une forme (assez grossière) d'indexation.

Pour donner un exemple concret, cette page-même de Wikipedia est indexée par le terme « Indexation », ce qui vous a sans doute permis de la trouver sans lire auparavant toutes les pages de « A » à « I ».

D'autre part, on peut indexer des objets qui ne soient pas nécessairement du texte : un catalogue de musée indexe les objets du musée, et pourrait comprendre un index de termes reliés à ces objets.

Indexation automatique

L'indexation peut être manuelle (faite par un humain), ou automatique. La méthode souvent la plus efficace pour l'utilisation de fichiers séquentiels est l'indexation (elle est également utilisable pour les autres types de données, stockées en mémoire). Les composantes sont stockées dans le fichier dans l'ordre de leur création. On utilise alors un tableau d'index, donnant en première position le numéro de la première composante, puis de la seconde,... L'avantage de cette méthode est que l'ajout de composantes est optimal : on rajoute la valeur en fin de fichier, on met à jour le tableau d'index. Tout déplacement d'une composante sera donc remplacé par une modification du tableau d'index, sans déplacement réel de la valeur dans le fichier. En général, ce tableau peut tenir en mémoire, ce qui permet une modification rapide, en général on préfère le sauver également sur support magnétique avant de quitter le programme, ce qui évitera de le recréer (par exemple refaire un tri) à la prochaine utilisation. On peut également utiliser une liste d'index si les déplacements sont fréquents (mais alors l'accès devient séquentiel). Le second avantage de cette méthode est que l'on peut utiliser simultanément plusieurs index : par exemple pour une liste de personnes, on peut créer un index pour le classement alphabétique des noms, un autre sur les villes, on accédera donc plus rapidement à tous les champs indexés, alors que les champs non indexés devront se satisfaire d'une recherche séquentielle, et ce sans modification dans le fichier (un tri par nom puis par ville auraient été nécessaires sans indexation). Par contre toute modification nécessitera la mise à jour de tous les tableaux d'index. La suppression, par contre, pose problème. En général, toujours pour éviter les décalages dans les fichiers, on préfère marquer d'un signe distinctif les champs supprimés (par exemple un nom non alphabétique ou vide), puis remettre à jour les index qui ne pointeront plus sur ce champ. Le retassage, assez long, n'est effectuée que sur ordre de l'utilisateur ou lorsqu'il quitte le programme. On peut aussi (comme dans la méthode du super-tableau) créer une liste des champs vides, ce qui permettra d'y accéder, plus rapidement que par une recherche séquentielle, lors de la prochaine insertion.

Sur un fichier indexé, on peut à nouveau se permettre des algorithmes utilisant l'insertion, puisque celle-ci n'affecte que l'index (à accès rapide). Pour un tri par exemple, on pourra utiliser le tri par insertion, à condition d'optimiser la recherche de la position d'insertion (par dichotomie pondérée par exemple), puisque celle-ci nécessite des lectures de champs dans le fichier alors que l'insertion n'entraîne que des décalages dans un tableau, d'une durée généralement négligeable devant le temps pris par la recherche. On peut également utiliser une liste d'index plutôt qu'un tableau si nécessaire. (créée par un programme informatique), ou à divers degrés intermédiaires « assistée » ou semi-automatique (par exemple créée par un humain assisté d'un programme proposant des termes). L'indexation manuelle d'informations est généralement coûteuse : pour indexer correctement un texte scientifique d'un certain niveau, il faut faire intervenir des personnes qui soient elles-mêmes capables de comprendre le contenu du texte, ce qui impose un coût non négligeable.

Bien que l'indexation se base sur des techniques relativement établies, il peut y avoir plusieurs indexations différentes d'un même texte, aussi valables les unes que les autres, en fonction de l'usage qui doit en être fait et du public auquel elles s'adressent. À titre d'exemple, imaginez un texte qui soit une description de jardins choisis en Angleterre ; son indexation sera très différente selon que le public sera constitué de jardiniers, de touristes, ou de géomètres.

Importance de l'indexation des documents électroniques

Un des grands problèmes, dans l'économie de l'immatériel, est la croissance exponentielle de la quantité d'information brute, sans que pour autant il existe de procédés vraiment correspondants pour permettre une indexation correcte de cette information qui permettrait d'en tirer le meilleur parti.

Termes associés : indexer, index, thesaurus, mot-clé, sommaire, synonyme

En économie et finance

L'indexation est l'ajustement d'une valeur sur un indice (indice d'inflation, indice boursier) ou un taux de référence. En finance, cette technique est aussi appelée gestion passive dont le but est de répliquer la performance d'un indice de référence sur une certaine période en assurant une déviation minimale à l'aide d'outils d'optimisation ou de réplication.

Voir aussi

  • Portail des sciences de l’information et des bibliothèques Portail des sciences de l’information et des bibliothèques
  • Portail de l’informatique Portail de l’informatique
Ce document provient de « Indexation ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Indexé de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • indexé — ● pp. ● 1. ►USENET►NET Se dit d un forum lorsqu il est disponible depuis une hiérarchie de newsgroups qui n est pas la sienne. ● 2. ►BASDON Un fichier indexé est un fichier pour lequel on a calculé un index en fonction d une clé, qui permet de… …   Dictionnaire d'informatique francophone

  • Fichier indexé — Un fichier indexé est un fichier qui possède un index en fonction d une clé. C est grâce à cette clé qu il est possible de retrouver de l information sur le système de fichier indexé. Donc dans le système de fichiers indexés on a toujours un… …   Wikipédia en Français

  • accès séquentiel indexé — ● loc. m. ►GESTFICH L accès séquentiel, c est lorsqu on doit parcourir, lors d une recherche, tout ou partie des informations d un fichier pour obtenir ce que l on souhaite. Pour aller plus vite, on peut indexer le fichier et cela donne un Accès… …   Dictionnaire d'informatique francophone

  • adressage indexé — indeksinis adresavimas statusas T sritis automatika atitikmenys: angl. indexed addressing vok. indizierte Adressierung, f rus. индексная адресация, f pranc. adressage indexé, m …   Automatikos terminų žodynas

  • Séquentiel indexé — Organisation séquentielle indexée L organisation séquentielle indexée, ou Indexed Sequential Access Method (ISAM) en anglais, est un mode d organisation des fichiers qui permet un accès séquentiel et un accès aléatoire aux enregistrements du… …   Wikipédia en Français

  • adressage indexé — ● loc. m. ►MEM Syn. d adressage relatif …   Dictionnaire d'informatique francophone

  • séquentiel indexé — ● n. m. ►GESTFICH►BASDON Méthode d accès rapide à un enregistrement dans une grosse base de données via une clé unique, stockée dans un fichier d index à part contenant des pointeurs vers la BD principale. ISAM en anglais …   Dictionnaire d'informatique francophone

  • indexer — [ ɛ̃dɛkse ] v. tr. <conjug. : 1> • 1948; autre sens 1845; de index 1 ♦ Dr., écon. Lier les variations de (une valeur) à celle d un élément de référence, d un indice déterminé. Indexer un emprunt sur le cours de l or. Indexer des obligations …   Encyclopédie Universelle

  • 2008 Iwate-Miyagi Nairiku earthquake — Earthquake title=Iwate Miyagi Nairiku Earthquake in 2008 date= June 14 2008 (JST) magnitude = Mj 7.2 (JMA scale), Mw 6.9 (by USGS) depth=convert|8|km|mi|0 (JMA), convert|10|km|mi|0 (USGS) aftershocks=483 felt aftershocks by July 1 (JMA) Laragest …   Wikipedia

  • Earthquake Early Warning (Japan) — The Nihongo|Earthquake Early Warning (EEW)|緊急地震速報|Kinkyū Jishin Sokuhō is a warning which is issued just after an earthquake in Japan is detected.cite news url=http://www.jma.go.jp/jma/en/Activities/eew1.html title=What is the Earthquake Early… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”