Rang De Page

Rang De Page

PageRank

Illustration du PageRank.

Le PageRank ou PR est l'algorithme d'analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l'ordre dans les résultats de recherche qu'il fournit. De nos jours le PageRank ne fournit qu'un indice parmi tant d'autres dans l'algorithme qui permet de classer les pages du Web dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google. Ce mot est une marque déposée.

Sommaire

Fonctionnement

Google affecte un score à chaque page Web. Cette note est attribuée en fonction de nombreux critères et principalement en fonction des liens externes (popularité de liens) pointant vers la page web, ainsi que des liens que cette dernière fait vers elle-même (liens internes).

L'algorithme du PageRank basé sur les liens était à l'origine le moyen utilisé par Google pour donner une note aux pages. Mais, comme cela est décrit dans le brevet [1]déposé le 17 avril 2007, de nombreux autres critères sont maintenant pris en compte. Aussi, la valeur du PageRank n'offre désormais qu'une indication peu significative sur son importance.

Le vecteur de Google utilisé lors du calcul des pagerank de google est un vecteur de Perron-Frobenius[2] [3].

Le PageRank réel d'une page n'est connu que de Google, même si l'on peut penser qu'il suit les principes du brevet. Les internautes peuvent obtenir une approximation du classement de la page en consultant la zone PageRank de la Google Toolbar, qui indique sa valeur sur une échelle de 0 à 10 (Échelle logarithmique). Il existe aussi de nombreux outils pour l'obtenir sans afficher la toolbar.

Propriété intellectuelle

Le premier brevet (intitulé Method for Node Ranking in a Linked Database)[4], déposé en janvier 1997 et enregistré le 9 janvier 1998, est la propriété de l'Université Stanford[5], qui a octroyé la licence de cette technologie à Google en 1998 (amendée en 2000 et 2003), deux mois après sa fondation. Il s'agit d'une licence exclusive jusqu'en 2011, l'exclusivité prenant fin à cette date[6].

Les recherches qui ont abouti au développement de la technologie du PageRank ont été financées en partie par la National Science Foundation[7]. Il est donc précisé dans le brevet que le gouvernement a certains droits sur cette invention[8].

La course aux liens

Les référenceurs et les webmestres créent quelquefois massivement des liens retour, par échanges de liens ou en inscrivant un site sur une quantité d'annuaires. Google avait autrefois une vision quantitative de la popularité d'une page, cette technique permettait donc de gonfler artificiellement son indice de popularité. Mais Google a réagi : d'une part en instaurant des filtres, tels que la Sandbox. Il détecte et sanctionne les campagnes massives de liens artificiels ; par ailleurs il intègre des critères qualitatifs à l'analyse des liens (sémantique, confiance : indice TrustRank, comportement des utilisateurs).

Principaux critères du score d'une page

Selon le brevet Google, ces critères sont :

  • les liens entrants et sortants ;
  • les ancres ;
  • le trafic associé à la page ;
  • le comportement de lecteurs : le choix de la page dans les résultats ;
  • le nom de domaine ;
  • l'hébergement.

Le TrustRank

C'est un critère d'autorité accordé aux pages, du fait que l'auteur dispose d'une qualité de sérieux et de compétence reconnue. Ce critère est associé aux sites gouvernementaux, et aux sites de référence tels le W3C.

nofollow

La valeur nofollow de l'attribut HTML rel a été définie par Google en 2005, hors des processus normatifs du W3C. Selon Google, un lien ainsi qualifié dans une page Web n'entre pas en compte dans l'algorithme de calcul de pageRank [9] [3].

Futur PageRank

Beaucoup d'outils proposent de calculer le futur classement d'une page après le prochain passage du googlebot. Ces outils ne sont pas fiables car ils se basent uniquement sur la valeur RK du checksum de Google. L'utilité de cette donnée n'est connue que de Google et n'a rien à voir avec un futur Page Rank.

Anecdote

L'algorithme du PageRank a fait l'objet d'un sujet de Maths au concours BCE 2008 (voie ECE - ESSEC Epreuve 2).

Articles connexes

Sources

Notes et références

  1. Comment Google attribue un score à une page Web
  2. [pdf] Le théorème de Perron-Frobenius, document pour l'agrégation de mathématiques par B. Bekka, Université de Rennes 1
  3. a  et b [pdf] Comment fonctionne Google ?, explication mathématique de l'algorithme PageRank par M. Eisermann, Université Grenoble 1
  4. US 6.285.999 B1
  5. Le texte du brevet est accessible sur le site du bureau des brevets des Etats-Unis (l'USPTO)
  6. Le texte du contrat de licence, dans sa version amendée de 2003, est accessible à cette adresse
  7. (Grant NSF - IRI-9411306-4)
  8. « The Government has certain rights in the invention. » Voir le texte du brevet.
  9. « From now on, when Google sees the attribute (rel="nofollow") on hyperlinks, those links won't get any credit when we rank websites in our search results. This isn't a negative vote for the site where the comment was posted; it's just a way to make sure that spammers get no benefit from abusing public areas like blog comments, trackbacks, and referrer lists », source.
  • Portail sur Internet Portail sur Internet
Ce document provient de « PageRank ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Rang De Page de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Rang de page — PageRank Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il… …   Wikipédia en Français

  • Rang (Mathématiques) — Pour les articles homonymes, voir Rang. En algèbre linéaire, le rang d une famille de vecteurs est la dimension du sous espace vectoriel engendré par cette famille. On peut étendre la notion de rang aux matrices et aux endomorphismes. Sommaire …   Wikipédia en Français

  • Rang (Matrice) — Rang (mathématiques) Pour les articles homonymes, voir Rang. En algèbre linéaire, le rang d une famille de vecteurs est la dimension du sous espace vectoriel engendré par cette famille. On peut étendre la notion de rang aux matrices et aux… …   Wikipédia en Français

  • Rang (matrice) — Rang (mathématiques) Pour les articles homonymes, voir Rang. En algèbre linéaire, le rang d une famille de vecteurs est la dimension du sous espace vectoriel engendré par cette famille. On peut étendre la notion de rang aux matrices et aux… …   Wikipédia en Français

  • Rang D'une Matrice — Rang (mathématiques) Pour les articles homonymes, voir Rang. En algèbre linéaire, le rang d une famille de vecteurs est la dimension du sous espace vectoriel engendré par cette famille. On peut étendre la notion de rang aux matrices et aux… …   Wikipédia en Français

  • Rang d'une matrice — Rang (mathématiques) Pour les articles homonymes, voir Rang. En algèbre linéaire, le rang d une famille de vecteurs est la dimension du sous espace vectoriel engendré par cette famille. On peut étendre la notion de rang aux matrices et aux… …   Wikipédia en Français

  • Rang (Botanique) — Pour les articles homonymes, voir Rang taxinomique. En nomenclature botanique, un taxon est habituellement affecté à un rang taxinomique dans la hiérarchie systématique. Le rang de base est l espèce. Le second en importance est le genre… …   Wikipédia en Français

  • Rang (Zoologique) — Pour les articles homonymes, voir Rang (taxinomie). En nomenclature zoologique, un taxon est habituellement assigné à un rang dans une hiérarchie. Le rang plus important est l espèce (species). Le second en importance est le genre (genus) :… …   Wikipédia en Français

  • Rang (Agriculture) — Pour les articles homonymes, voir rang. Exemple d organisation du rang …   Wikipédia en Français

  • Rang (Bactérien) — Pour les articles homonymes, voir Rang (taxinomie). En nomenclature bactérienne, un taxon est habituellement assigné à un rang dans une hiérarchie. Le rang plus important est l espèce (species). Selon Art 5b 5c du « International Code of… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”