ReCaptcha

ReCaptcha: reCAPTCHA

Logo du reCAPTCHA.

Un exemple de reCAPTCHA : les mots à reconnaître sont « following » et « finding ».

reCAPTCHA est un système mettant à profit les capacités de reconnaissance des utilisateurs humains mobilisées par les tests Captcha, pour améliorer par la même occasion le processus de numérisation de livres, là où échouent les systèmes de reconnaissance optique de caractères (OCR). Le système a été mis au point par des chercheurs de l'Université Carnegie-Mellon^[1]^,^[2].

Sommaire

1 Description

2 Histoire

3 Notes et références

4 Voir aussi

4.1 Articles connexes

Description

L'idée est de rendre utile une tâche qui peut sembler rébarbative. La technique tient du crowdsourcing.

Concrètement, par rapport à un processus habituel d'authentification par Captcha, ce ne sont pas un mais deux mots qui sont présentés à l'utilisateur. L'un d'eux est un Captcha habituel, dont la solution est par conséquent connue de manière certaine ; seul l'autre est issu de la numérisation d'un livre : c'est celui dont la solution est incertaine voire inconnue et que l'utilisateur va aider à résoudre.

Le système part du principe que si les utilisateurs résolvent correctement le Captcha habituel, alors ils ont aussi déchiffré correctement le mot inconnu. Néanmoins, un mot n'est considéré comme vraiment reconnu que si plusieurs utilisateurs l'ont vérifié en obtenant le même résultat.

Les mots à reconnaître sont issus de numérisations opérées par Internet Archive sur des ouvrages anciens appartenant au domaine public. Ils sont fournis lors des requêtes par le site Web du projet reCAPTCHA^[3], issu du projet CAPTCHA originel, tous deux mis en place par l'école d'informatique de l'Université Carnegie Mellon, dans la ville américaine de Pittsburgh. Ceci est réalisé au moyen d'une API écrite en JavaScript, dans laquelle le serveur rappelle reCAPTCHA après que la requête a été soumise. Le projet reCAPTCHA propose des bibliothèques pour différents langages de programmation afin de faciliter le processus. Le service est gratuit, à l'exception des utilisateurs qui auraient besoin d'une bande passante trop élevée.

Le but de reCAPTCHA est le même que celui poursuivi par Distributed Proofreaders, un autre projet visant également à valider l'OCR par des opérateurs humains, mais de manière conventionnelle, sans avoir recours aux Captchas.

Histoire

Cette section est vide, pas assez détaillée ou incomplète. Votre aide est la bienvenue !

En 2009, le projet reCAPTCHA est à même de numériser les archives du New York Times^[4]. En date de septembre 2009, environ 20 ans d'archives ont été numérisés et les responsables du projet espèrent avoir complètement numérisé les 110 autres années avant la fin de 2010. ^[5] Le 17 Septembre 2009, Google annonce l'acquisition de la société ReCAPTCHA. Celle-ci sera notamment utilisée dans le processus de numérisation d'ouvrage Google Books.

Notes et références

↑ (en) Luis von Ahn, Ben Maurer, Colin McMillen, David Abraham and Manuel Blum, « reCAPTCHA: Human-Based Character Recognition via Web Security Measures », dans Science, vol. 321, 2008, p. 1465-1468 [[pdf] texte intégral lien DOI]

↑ (en) The reCAPTCHA project, partie du Carnegie Mellon School of Computer Science de l'Université Carnegie-Mellon

↑ (en) recaptcha.net, site du projet reCAPTCHA.

↑ (en) Learn more, reCAPTCHA.net. Consulté le 2008-11-23

↑ (en) Luis von Ahn. NOVA ScienceNow s04e01 [Television production]. Retrieved on 2009-07-06. Scene occurs at 46:58. “The New York Times has this huge archive, over 130 years of newspaper archive there. And we've done maybe about 20 years so far of The New York Times in the last few months and I believe we're going to be done next year by just having people do a word at a time.”

Voir aussi

Articles connexes

Captcha

Reconnaissance optique de caractères

Portail de la sécurité informatique

Ce document provient de « ReCAPTCHA ».

Catégories : Vision artificielle | Technologie web | Sécurité informatique | Spam | Sigle de 9 caractères ou plus

Contenu soumis à la licence CC-BY-SA. Source : Article ReCaptcha de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

ReCAPTCHA — is a system developed at Carnegie Mellon University which utilizes CAPTCHA to assist in the process of digitizing the text of books, while protecting websites from bots attempting to access restricted areas. reCAPTCHA supplies subscribing… … Wikipedia
Recaptcha — Saltar a navegación, búsqueda El logo de reCAPTCHA reCAPTCHA es una extensión de la prueba CAPTCHA que se utiliza para reconocer texto presente en imágenes. reCAPTCHA se basa en el hecho de que para un ser humano puede ser simple determinar el… … Wikipedia Español
ReCAPTCHA — Logo du reCAPTCHA … Wikipédia en Français
ReCAPTCHA — Логотип reCAPTCHA reCAPTCHA это система для защиты веб сайтов от интернет ботов (спам ботов), основанная на тесте Тьюринга и призванная оградить веб ресурсы от автоматических алгоритмов и программ путём генерации случайного текста и вывода… … Википедия
reCAPTCHA — The reCAPTCHA logo reCAPTCHA is a system originally developed at Carnegie Mellon University s main Pittsburgh campus. It uses CAPTCHA to help digitize the text of books while protecting websites from bots attempting to access restricted areas.[ … Wikipedia
reCAPTCHA — Логотип reCAPTCHA. reCAPTCHA система, разработанная в университете Карнеги Меллон для защиты веб сайтов от интернет ботов, и одновременной помощи в оцифровке текстов книг. Является продолжением проекта … Википедия
reCAPTCHA — Logo du reCAPTCHA. Un exemple de reCAPTCHA : les mots à reconnaître sont « … Wikipédia en Français
reCAPTCHA — Beispiel einer reCAPTCHA Eingabebox reCAPTCHA ist ein CAPTCHA Dienst, also ein Verfahren, um sicherzustellen, dass eine bestimmte Handlung im Internet von einem Menschen und nicht von einem Bot vorgenommen wird. Das Besondere ist die Tatsache,… … Deutsch Wikipedia
ReCAPTCHA — CAPTCHA [ kæptʃə] ist ein Akronym für Completely Automated Public Turing test to tell Computers and Humans Apart. Wörtlich übersetzt bedeutet das „Vollautomatischer öffentlicher Turing Test, um Computer und Menschen zu unterscheiden“. CAPTCHAs… … Deutsch Wikipedia
Captcha — [ kæptʃə] ist ein Akronym für Completely Automated Public Turing test to tell Computers and Humans Apart. Wörtlich übersetzt bedeutet das „Vollautomatischer öffentlicher Turing Test, um Computer und Menschen zu unterscheiden“. CAPTCHAs werden… … Deutsch Wikipedia

Dictionnaires et Encyclopédies sur 'Academic'

ReCaptcha

reCAPTCHA

Sommaire

Description

Histoire

Notes et références

Voir aussi

Articles connexes

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

ReCaptcha

reCAPTCHA

Sommaire

Description

Histoire

Notes et références

Voir aussi

Articles connexes

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link