Word recognition rate

Word recognition rate: Taux d'erreur de mots

Pour les articles homonymes, voir WER.

Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance vocale.

Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Au plus le taux est faible (minimum 0.0) au plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions.

Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par:

$WER = \frac{S+D+I}{N}$

Néanmoins, il est fréquent de rapporter plutôt le taux de reconnaissance de mots, ou word recognition rate (WRR) en anglais, et souvent en pourcentage. Il indique le taux de mots corrects par rapport à un texte de référence. Au plus le taux est élevé, au plus la reconnaissance est de bonne qualité (maximum 100%). Le taux minimum n'est pas borné et peut être négatif.

$WRR = 1 - WER = \frac{N-S-D-I}{N} = \frac{H-I}{N}$

Où :

$N$ est le nombre de mots de référence,

$S$ est le nombre de substitutions (mots incorrectement reconnus),

$D$ est le nombre de suppressions (mots omis),

$I$ est le nombre d'insertions (mots ajoutés),

$H$ est le nombre de mots correctement reconnus.

Références

McCowan et al. 2005: On the Use of Information Retrieval Measures for Speech Recognition Evaluation

Ce document provient de « Taux d%27erreur de mots ».

Catégories : Traitement de la parole | Traitement automatique du langage naturel

Contenu soumis à la licence CC-BY-SA. Source : Article Word recognition rate de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

Word error rate — (WER) is a common metric of the performance of a speech recognition system.The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence (supposedly … Wikipedia
Word error rate — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… … Wikipédia en Français
Speech recognition — For the human linguistic concept, see Speech perception. The display of the Speech Recognition screensaver on a PC, in which the character responds to questions, e.g. Where are you? or statements, e.g. Hello. Speech recognition (also known as… … Wikipedia
Automatic Speech Recognition — Reconnaissance vocale Pour les articles homonymes, voir ASR. La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d analyser un mot ou une phrase captée … Wikipédia en Français
Optical character recognition — Optical character recognition, usually abbreviated to OCR, is the mechanical or electronic translation of scanned images of handwritten, typewritten or printed text into machine encoded text. It is widely used to convert books and documents into… … Wikipedia
Optical mark recognition — (also called Optical Mark Reading and OMR) is the process of capturing human marked data from document forms such as surveys and tests. Contents 1 OMR background 2 OMR software 2.1 Open Source … Wikipedia
Discount rate — For the interest rate charged to banks for borrowing short term funds directly from the Federal Reserve, see discount window. For the fees charged to merchants for accepting credit cards, see Discount Rate under Merchant Account. For discount… … Wikipedia
Named entity recognition — (NER) (also known as entity identification (EI) and entity extraction) is a subtask of information extraction that seeks to locate and classify atomic elements in text into predefined categories such as the names of persons, organizations,… … Wikipedia
Named-entity recognition — (NER) (also known as entity identification and entity extraction) is a subtask of information extraction that seeks to locate and classify atomic elements in text into predefined categories such as the names of persons, organizations, locations,… … Wikipedia
Taux de reconnaissance de mots — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Word recognition rate

Taux d'erreur de mots

Références

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Word recognition rate

Taux d'erreur de mots

Références

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link