Standard d'exclusion de robots

Standard d'exclusion de robots: Robots.txt

Robots.txt, ou le fichier d'exclusion des robots, est une ressource de format texte qui peut être placée la racine d'un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d'indexation des moteurs de recherche. Par convention, les robots consultent robots.txt avant d'indexer un site Web. Sur le serveur Web, cette ressource est fréquemment enregistrée dans un fichier texte appelé robots.txt.

Sommaire

1 Usages

2 Exemples

3 Voir aussi

3.1 Articles connexes

3.2 Liens externes

Usages

L'usage de robots.txt permet d'éviter que des ressources sans intérêt public se retrouvent dans la page de résultats d'un moteur de recherche. En outre, le fait que les robots n'accèdent pas à ces ressources allège le travail du serveur HTTP et le trafic sur le réseau informatique.

Il est important de comprendre qu’il ne s’agit là que d’une indication sur ce que doivent faire les robots bienveillants, ce n’est en aucun cas un élément de sécurité. En effet, certains robots ignorent ce fichier, soit délibérément parce qu’ils cherchent des informations privées (des adresses électroniques par exemple, pour y envoyer du courrier indésirable), soit parce que le robot est trop simple pour gérer ce standard.

Exemples

Autoriser tous les robots à accéder à tout le site :

User-agent: * Disallow:

Empêcher tous les robots d'accéder au site :

User-agent: * Disallow: /

Pour empêcher tous les robots sauf Googlebot d'accéder à un dossier en particulier, par exemple http://example.org/forum/

User-agent: * Disallow: /forum User-agent: googlebot Disallow:

Voir aussi

Articles connexes

Robot d'indexation

Liens externes

(en) Robotstxt.org, site dédié (avec les spécifications du standards)

(en) Yellowpipe.com, générateur en ligne de fichier robots.txt

(fr) Protocole d'exclusion des robots (annuaire-info.com) : la norme et les particularités propres à Google, Yahoo et MSN Search

(fr) Créer un fichier robots.txt (Tutoriel) : Informations pour apprendre à rédiger un fichier robots.txt

Portail de l’informatique

Ce document provient de « Robots.txt ».

Catégories : Moteur de recherche | Référencement

Contenu soumis à la licence CC-BY-SA. Source : Article Standard d'exclusion de robots de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

Fichier D'exclusion Des Robots — Robots.txt Robots.txt, ou le fichier d exclusion des robots, est une ressource de format texte qui peut être placée la racine d un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d… … Wikipédia en Français
Fichier d'exclusion des robots — Robots.txt Robots.txt, ou le fichier d exclusion des robots, est une ressource de format texte qui peut être placée la racine d un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d… … Wikipédia en Français
Fichier d exclusion des robots — Robots.txt Robots.txt, ou le fichier d exclusion des robots, est une ressource de format texte qui peut être placée la racine d un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d… … Wikipédia en Français
Protocole d'exclusion des robots — est une ressource de format texte qui peut être placée à la racine d un site web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d indexation des moteurs de recherche. Par convention, les… … Wikipédia en Français
Robots.txt — Robots.txt, ou le fichier d exclusion des robots, est une ressource de format texte qui peut être placée la racine d un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d indexation… … Wikipédia en Français
Robots exclusion standard — selfref| For restricting Wikipedia bots, see .|The robot exclusion standard, also known as the Robots Exclusion Protocol or robots.txt protocol, is a convention to prevent cooperating web spiders and other web robots from accessing all or part of … Wikipedia
Robots.txt — robots.txt файл ограничения доступа к содержимому роботам на http сервере. Файл должен находиться в корне сайта (то есть иметь путь относительно имени сайта /robots.txt). При наличии нескольких субдоменов файл должен располагаться в… … Википедия
Robots.txt — Nach der Übereinkunft des Robots Exclusion Standard Protokolls liest ein Webcrawler (Robot) beim Auffinden einer Webseite zuerst die Datei robots.txt (kleingeschrieben) im Stammverzeichnis (Root) einer Domain. In dieser Datei kann festgelegt… … Deutsch Wikipedia
Robots Exclusion Standard — Nach der Übereinkunft des Robots Exclusion Standard Protokolls liest ein Webcrawler (Robot) beim Auffinden einer Webseite zuerst die Datei robots.txt (kleingeschrieben) im Stammverzeichnis (Root) einer Domain. In dieser Datei kann festgelegt… … Deutsch Wikipedia
Robot Exclusion Standard — [Abk. RES, dt. »Standard zum Ausschluss automatischer Suchmaschinen«], ein 1994 erstmals formulierter Standard im Internet, der bestimmte automatische Suchmaschinen (Web Robots; Roboter) vom Zugriff auf einen Server ausschließt. Dazu wird eine… … Universal-Lexikon

Dictionnaires et Encyclopédies sur 'Academic'

Standard d'exclusion de robots

Robots.txt

Sommaire

Usages

Exemples

Voir aussi

Articles connexes

Liens externes

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Standard d'exclusion de robots

Robots.txt

Sommaire

Usages

Exemples

Voir aussi

Articles connexes

Liens externes

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link