Précision et rappel (recherche d'information)

Précision et rappel (recherche d'information)

Précision et rappel

Lorsqu’une personne interroge une base de données (que ce soit un logiciel documentaire ou un moteur de recherche), elle attend un ensemble de réponses (sous forme de documents) égal ou supérieur à un. À partir de l'ensemble de réponses obtenus mis en regard de l’attente de l’utilisateur, on peut mesurer les performances de l'algorithme de recherche mis en œuvre pour retrouver un document. Les critères de mesure des performances sont le rappel et la précision.

Sommaire

Le rappel

Le rappel est défini par le nombre de documents pertinents retrouvés au regard du nombre de documents pertinents que possède la base de données. Cela signifie que lorsque l’utilisateur interroge la base il souhaite voir apparaître tous les documents qui pourraient répondre à son besoin d'information. Si cette adéquation entre le questionnement de l’utilisateur et le nombre de documents présentés est importante alors le taux de rappel est élevé. A l’inverse si le système possède de nombreux documents intéressants mais que ceux-ci n’apparaissent pas on parle de silence. Le silence s’oppose au rappel.


Rappel_i = \frac{documents~correctement~attribues~a~la~classe~i}{nombre~de~documents~appartenants~a~la~classe~i}

La précision

La précision est le nombre de documents pertinents retrouvés rapporté au nombre de documents total proposé par le moteur de recherche pour une requête donnée.

Le principe est le suivant: quand un utilisateur interroge une base de données, il souhaite que les documents proposées en réponse à son interrogation correspondent à son attente. Tous les documents retournés superflus ou non pertinents constituent du bruit. La précision s’oppose à ce bruit documentaire. Si elle est élevée, cela signifie que peu de documents inutiles sont proposés par le système et que ce dernier peut être considéré comme "précis". On calcule la précision avec la formule suivante:


Precision_i = \frac{documents~correctement~attribues~a~la~classe~i}{nombre~de~documents~attribues~a~la~classe~i}

La précision et le rappel dans un cadre multi-classe

Dans le cadre multi-classes (ou i est supérieur à 1), les moyennes globales de la précision et du rappel sur l'ensemble des classes i peuvent être évaluées par la macro-moyenne qui calcule d'abord la précision et le rappel sur chaque classe i suivie d'un calcul de la moyenne des précisions sur les n classes :


Precision = \frac{\sum_{i=1}^{n} precision_i }{n}


Rappel = \frac{\sum_{i=1}^{n} rappel_i }{n}

Interprétation des résultats de précision et rappel

Un système de recherche documentaire parfait fournira des réponses dont la précision et le rappel sont égaux à 1 (l'algorithme trouve la totalité des documents pertinents - rappel - et ne fait aucune erreur - précision). Dans la réalité, les algorithmes de recherche sont plus ou moins précis, et plus ou moins pertinents. Il sera possible d'obtenir un système très précis (par exemple un score de précision de 0,99), mais peu performant (par exemple avec un rappel de 0.10, qui signifiera qu'il n'a trouvé que 10% des réponses possibles). Dans le même ordre d'idée, un algorithme dont le rappel est fort ( par exemple 0.99 soit la quasi totalité des documents pertinents), mais la précision faible (par exemple 0.10) fournira en guise de réponse de nombreux documents erronés en plus de ceux pertinents: il sera donc difficilement exploitable.

Par exemple, un système de recherche documentaire qui renvoie la totalité des documents de sa base aura un rappel de 1 (mais une mauvaise précision). Tandis qu'un système de recherche qui renvoie uniquement la requête de l'utilisateur aura une précision de 1 pour un rappel très faible. La valeur d'un classifieur ne se réduit donc pas à un bon score en précision ou en rappel.

F-mesure

Une mesure populaire qui combine la précision et le rappel est leur pondération, nommée F-mesure (soit F-measure en anglais) ou F-score :

F = 2 \cdot (\mathrm{precision} \cdot \mathrm{rappel}) / (\mathrm{precision} + \mathrm{rappel}).\,

Ceci est connu comme mesure F1, car précision et rappel sont pondérés de façon égale. Il s'agit d'un cas particulier de la mesure générale Fβ (pour des valeurs réelles positives de β):

F_\beta = (1 + \beta^2) \cdot (\mathrm{precision} \cdot \mathrm{rappel}) / (\beta^2 \cdot \mathrm{precision} + \mathrm{rappel}).\,

Exemples

Si une personne s’intéresse aux chats siamois et que dans une barre de recherche d’une interface de base de données elle tape « chat siamois », les documents qui ont été indexés avec pour seul terme le mot « chat » n’apparaîtront pas. Or certains de ces documents pourraient être pertinents. Cela va donc produire un silence documentaire et la valeur du rappel diminuera d’autant. Inversement si pour pallier ce risque la personne tape seulement « chat », alors qu’elle s’intéresse seulement aux chats siamois, le système lui présentera des documents dans lesquels les chats siamois ne sont pas mentionnés (ce pourra être les momies de chat en Égypte, voire la vie du poisson-chat). La précision sera faible et le bruit important.

Voir aussi

  • Portail des sciences de l’information et des bibliothèques Portail des sciences de l’information et des bibliothèques
  • Portail de l’informatique Portail de l’informatique
Ce document provient de « Pr%C3%A9cision et rappel ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Précision et rappel (recherche d'information) de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

  • Precision et rappel — Précision et rappel Lorsqu’une personne interroge une base de données (que ce soit un logiciel documentaire ou un moteur de recherche), elle attend un ensemble de réponses (sous forme de documents) égal ou supérieur à un. À partir de l ensemble… …   Wikipédia en Français

  • Recherche d’information — Recherche d information Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d information est la science qui consiste à rechercher l information dans des documents les documents eux mêmes ou les métadonnées qui décrivent les… …   Wikipédia en Français

  • Précision et rappel — Lorsqu’une personne interroge une base de données (que ce soit un logiciel documentaire ou un moteur de recherche), elle attend un ensemble de réponses (sous forme de documents) égal ou supérieur à un. À partir de l ensemble de réponses obtenus… …   Wikipédia en Français

  • Recherche d'information — Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d information est la science qui étudie la manière de répondre pertinemment à une requête en retrouvant de l information dans un corpus. Celui ci est composés de documents d une …   Wikipédia en Français

  • Information retrieval — Recherche d information Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d information est la science qui consiste à rechercher l information dans des documents les documents eux mêmes ou les métadonnées qui décrivent les… …   Wikipédia en Français

  • Recherche documentaire — Recherche d information Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d information est la science qui consiste à rechercher l information dans des documents les documents eux mêmes ou les métadonnées qui décrivent les… …   Wikipédia en Français

  • Recherches d'information — Recherche d information Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d information est la science qui consiste à rechercher l information dans des documents les documents eux mêmes ou les métadonnées qui décrivent les… …   Wikipédia en Français

  • Centre Européen pour la Recherche Nucléaire — Organisation européenne pour la recherche nucléaire Organisation européenne pour la recherche nucléaire Création 29 septembre 1954 Siège …   Wikipédia en Français

  • Centre européen pour la recherche nucléaire — Organisation européenne pour la recherche nucléaire Organisation européenne pour la recherche nucléaire Création 29 septembre 1954 Siège …   Wikipédia en Français

  • Conseil européen pour la recherche nucléaire — Organisation européenne pour la recherche nucléaire Organisation européenne pour la recherche nucléaire Création 29 septembre 1954 Siège …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”