Robot.txt

Robot.txt

Robots.txt

Robots.txt, ou le fichier d'exclusion des robots, est une ressource de format texte qui peut être placée la racine d'un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d'indexation des moteurs de recherche. Par convention, les robots consultent robots.txt avant d'indexer un site Web. Sur le serveur Web, cette ressource est fréquemment enregistrée dans un fichier texte appelé robots.txt.

Sommaire

Usages

L'usage de robots.txt permet d'éviter que des ressources sans intérêt public se retrouvent dans la page de résultats d'un moteur de recherche. En outre, le fait que les robots n'accèdent pas à ces ressources allège le travail du serveur HTTP et le trafic sur le réseau informatique.

Il est important de comprendre qu’il ne s’agit là que d’une indication sur ce que doivent faire les robots bienveillants, ce n’est en aucun cas un élément de sécurité. En effet, certains robots ignorent ce fichier, soit délibérément parce qu’ils cherchent des informations privées (des adresses électroniques par exemple, pour y envoyer du courrier indésirable), soit parce que le robot est trop simple pour gérer ce standard.

Exemples

Autoriser tous les robots à accéder à tout le site :

User-agent: *
Disallow:

Empêcher tous les robots d'accéder au site :

User-agent: *
Disallow: /

Pour empêcher tous les robots sauf Googlebot d'accéder à un dossier en particulier, par exemple http://example.org/forum/

User-agent: *
Disallow: /forum
 
User-agent: googlebot
Disallow:

Voir aussi

Articles connexes

Liens externes

  • Portail de l’informatique Portail de l’informatique
Ce document provient de « Robots.txt ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Robot.txt de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Robot d indexation — Pour les articles homonymes, voir Spider. Un robot d indexation (ou littéralement araignée du Web ; en anglais web crawler ou web spider) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les… …   Wikipédia en Français

  • Robot Exclusion Standard —   [Abk. RES, dt. »Standard zum Ausschluss automatischer Suchmaschinen«], ein 1994 erstmals formulierter Standard im Internet, der bestimmte automatische Suchmaschinen (Web Robots; Roboter) vom Zugriff auf einen Server ausschließt. Dazu wird eine… …   Universal-Lexikon

  • Robot d'indexation — Pour les articles homonymes, voir Spider. Un robot d indexation (ou littéralement araignée du Web ; en anglais web crawler ou web spider) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les… …   Wikipédia en Français

  • Robot (disambiguation) — A robot is an electro mechanical device.Robot may refer to: * Endhiran , a forthcoming Indian science fiction film previously known as Robot * Robots (computer game), a computer game originally developed for the unix operating system. * Robot… …   Wikipedia

  • Robots.txt — Robots.txt, ou le fichier d exclusion des robots, est une ressource de format texte qui peut être placée la racine d un site Web, et qui contient une liste des ressources du site qui ne sont pas censées être indexées par les robots d indexation… …   Wikipédia en Français

  • Robots.txt — robots.txt  файл ограничения доступа к содержимому роботам на http сервере. Файл должен находиться в корне сайта (то есть иметь путь относительно имени сайта /robots.txt). При наличии нескольких субдоменов файл должен располагаться в… …   Википедия

  • Robots.txt — Nach der Übereinkunft des Robots Exclusion Standard Protokolls liest ein Webcrawler (Robot) beim Auffinden einer Webseite zuerst die Datei robots.txt (kleingeschrieben) im Stammverzeichnis (Root) einer Domain. In dieser Datei kann festgelegt… …   Deutsch Wikipedia

  • Tamiya TXT-1 — The Tamiya TXT 1, which stands for Tamiya eXtreme Truck, is Tamiya s current and most advanced 1/10 scale radio controlled Monster Truck. The TXT 1 has a cantilever suspension design which allows for large amount of suspension articulation. This… …   Wikipedia

  • robots.txt — robots.txt,   Datei, die von Suchmaschinen beauftragte automatische Rechercheprogramme (Roboter) daran hindert, bestimmte Teile eines Webservers zu untersuchen. Man nennt diese Technik auch Robot Exclusion (dt. »Roboterausschluss«).   Die Datei… …   Universal-Lexikon

  • Archive.org — Internet Archive Photo prise à la Bibliotheca Alexandrina : elle est contient une copie des documents de l Internet Archive. L Internet Archive (IA) est une organisation à but non lucratif consacrée à l archivage du Web, située dans le… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”