- Google (moteur de recherche)
-
Logo de GoogleURL www.google.com Commercial Oui Publicité Oui (texte) Type de site Moteur de recherche Langue(s) Multilingue Inscription Facultatif Propriétaire Google Inc. Créé par Lawrence E. Page & Sergueï Brin Lancement 15 septembre 1997[1] Revenus 16 000 000 000 $ État actuel En activité Le moteur de recherche Google, qui a donné le nom à la société Google, est le moteur de recherche sur le Web le plus utilisé au monde. En 2009, 67 % des internautes l'utilisent[2]. Le nom Google vient du mot Gogol, nom donné au nombre 10100. Ce nombre a été choisi pour évoquer la capacité de Google à traiter une très grande quantité de données.
Sommaire
Principes et caractéristiques
Le système de classement PageRank
Le principe de fonctionnement de Google, qui a fait son succès, est fondé sur une invention de ses créateurs, le PageRank : lorsqu'un document est pointé par de nombreux hyperliens (popularité de liens), son PageRank augmente. Plus son PageRank est élevé, plus il aura de chance d'être affiché dans les premiers résultats d'une recherche. Ce système donne une indication de la « popularité » du document parmi les autres documents du web.
Ce principe a immédiatement été un succès, car il a permis des résultats plus pertinents que les autres moteurs de recherche qui se contentaient de comptabiliser les mots-clés insérés dans les pages des sites. Il a également permis ce que l'on appelle le bombardement Google.
Sobriété et valorisation des mots
En outre, ce moteur de recherche est aussi apprécié pour sa rapidité de recherche et sa sobriété : pas de Flash, pas de bandeau publicitaire clignotant, etc. Son interface a inspiré celle d'autres moteurs, comme Yahoo!.
Cette sobriété, loin d'être anecdotique, est au moins en partie à l'origine du succès du site. À l'époque de son lancement en effet, la mode était aux moteurs de recherche insérés sur des pages très chargées en contenu et en publicité. Ces pages étaient souvent longues à s'afficher et difficiles à lire.
Il utilise tout de même un système d'AdWords (« publicité de mots ») pour se rémunérer. Ce système est fondé sur une valeur par mot selon sa demande. Plus le mot sera demandé, plus il sera payé cher par clic. Mais il est toujours possible pour l'utilisateur de bloquer l'affichage de ces publicités grâce à des plugins.
Selon Optify, 94 % des clics vont aux dix premiers résultats et Google génère à lui seul 36,4 % des clics[3].
Infrastructure
Vers 2002, Google affirmait distribuer la charge sur plus de 10 000 PC fonctionnant avec un noyau Linux modifié. Le chiffre de 1 000 requêtes simultanées en pointe a aussi été souvent évoqué. Les chiffres réels semblent 10 fois plus élevés. Ils sont cependant secrets, notamment pour ne pas permettre de calculer facilement l'investissement nécessaire pour concurrencer Google[4].
Google utilise des robots nommés Googlebot qui visitent à intervalle régulier l'ensemble des sites web ayant demandé à être référencés afin de maintenir à jour la base de données qui fournit les réponses aux requêtes des internautes.
Article détaillé : Plateforme Google.Logos
Hormis le logo officiel[5], le site adopte des logos particuliers pour certaines fêtes et évènements : les Google Doodles. Réalisés par Dennis Hwang, un designer américain d'origine coréenne de 23 ans, ils apparaissent régulièrement dès qu'une fête locale ou internationale (nouvelle année, fêtes nationales, etc.) ou un évènement marquant (Jeux Olympiques, commémoration d'une personne illustre, etc.) le permet.
Tous les logos de fêtes et d'évènements de www.google.com mis en ligne depuis 1999 sont disponibles en ligne[6] et, également, ceux qui sont apparus en France[7].
Version bêta
Une version bêta est habituellement une mention signifiant qu'un programme est en phase de finition. Chez Google c'est devenu une marque de fabrique apposée sur la plupart des services et logiciels à l'exception du moteur de recherche et des services publicitaires.
L'intérêt qui réside dans l'appellation « version bêta » est que, du point de vue de la qualité du service, elle n'engage à aucune obligation de résultat, étant donné que c'est une phase de développement. Cela peut également signifier que les services Google sont en perpétuelle phase d'amélioration.
Cette particularité propre à Google devient une mode qui se traduit chez ses concurrents par un usage plus ostensible de cette mention.
Services
Ce moteur de recherche est disponible en 35 langues[8] et propose son interface en plus de 100 langues.
Google est à la base un moteur de recherche de pages web, il s'est étendu progressivement à divers types de documents (PDF, Word, Flash...), aux images. Ainsi qu'aux forums Usenet depuis le rachat de Deja News.
Il possède une section répertoire qui permet de trouver des sites par catégorie (répertoire dmoz classé par PageRank), et un portail d'actualités (Google Actualités) regroupant les sites des journaux à grand tirage et des plus grandes agences de presse.
Depuis septembre 2010, l'entreprise a lancé Google Instant. Ce service est pour l'instant seulement disponible dans un nombre restreint de pays (dont la France) et uniquement pour les utilisateurs identifiés par un Compte Google. Dès la première lettre tapée dans la barre de saisie, Google envoi un résultat qui s'affine au fur et à mesure de la saisie. Cette fonction propose des résultats qui sont susceptibles de convenir car habituellement recherchés. Le moteur de recherche anticipe donc les requêtes des internautes. Cette fonctionnalité est désactivable. Les ingénieurs de l'entreprise annoncent qu'elle permettrait de faire gagner du temps de l'ordre de 40%.
Le 2 octobre 2010, un petit triangle bleu de sélection à gauche du premier résultat proposé par la version américaine du moteur de recherche est apparu. Il est possible de sélectionner le résultat de son choix par les touches ↑ et ↓ du clavier, et d'appuyer sur la touche Entrée pour accéder au site.
le 9 octobre 2010, la pré-visualisation des pages web est disponible (en cliquant sur la loupe, une image du site voulu apparaît à la droite de l'écran) et le pointage du curseur sur un résultat colorise le fond de celui-ci en bleu.
Utilisation du moteur de recherche Google
Google propose un formulaire simple et un formulaire de recherche avancée permettant d'exclure des mots ou de rechercher des expressions complètes[9]
Termes à chercher
La documentation de Google sur son interprétation des requêtes est assez spartiate. L’évolution du fonctionnement observé montre que ceci est sans doute à dessein pour garder une liberté de changement maximale. Ce qui suit doit être continuellement validé et remanié pour suivre les modifications.
- H2O est cherché comme un seul mot et Google ne trouve alors pas les documents avec H 2 O ou H2O dans leur texte. Ceux-ci sont retrouvés en demandant "H 2 O". H-2-O (voir plus loin le rôle du tiret) trouve aussi bien H2O que H 2 O et H2O. Malheureusement, l’opérateur « tiret » ne cherche que les deux combinaisons extrêmes (tous les mots collés ou tous les mots séparés: il ne trouve pas H2 O).
- mot : Un mot et ses variantes singulier/pluriel - masculin/féminin – avec/sans accents. Par exemple, chevaux d’arçon retrouve cheval d’arçon : cet algorithme fonctionne en français et en anglais mais pas en néerlandais (il ne connaît pas les pluriels en "en"). Attention : la variante que vous spécifiez est favorisée dans le tri des documents présentés.
- ~mot : Un mot et ses synonymes. Fonctionne avec un dictionnaire anglais même sur les recherches en français et néerlandais ! Essayer la requête ~automobile -automobile pour voir les mots trouvés en dehors du terme strict automobile. ~arabic retourne Egypt, Lebanon, Arab et … Hindu ! On ne connaît pas la source des synonymes.
- "mot" : Un mot exact. Google ne tient pas compte de l’accentuation pour la recherche mais favorise la forme spécifiée lors du tri des documents présentés.
- "mot … mot" : une suite de mots spécifiques, une expression
- "mot * mot" : dans une suite de mots entre guillemets (et seulement là), une étoile peut être mise à la place d’un ou plusieurs mots complets qu’on ne désire pas spécifier. Par exemple : "ministère du * et du commerce"
- site:www… : un domaine d’origine. On peut être plus ou moins général et même indiquer des domaines de premier niveau. Par exemple :
site:org OR site:com
- intitle:"mot … mot" : une suite de mots spécifiquement dans le titre du document (balise
<title>…</title>
et/ou première balise<h1>…</h1>
) - +mot : chercher ce mot même si c’est un mot vide dans la langue de l’utilisateur ( +de en français par exemple) et le chercher en tenant compte des accents ( +dés par exemple). Un « + » est assumé si un seul mot est cherché : thé seul est cherché comme si on avait tapé +thé (Cette forme a donc une signification très différente de celle de Altavista où le "+" indiquait des mots obligatoires). Lors du tri des documents, Google donne la préférence à la forme tapée : l’opérateur « + » n’a donc plus beaucoup d’intérêt.
- mot-mot : chercher un terme composé de plusieurs mots, qu’il soit écrit avec des tirets, des espaces ou même sans espace du tout : gratte-ciel trouve gratte ciel, gratte-ciel et gratteciel . gratte-ciel ne signifie pas du tout la même chose que gratte -ciel (voir l’opérateur "-"). Attention : va-nu-pied trouve va nu pied et vanupied mais pas vas nupied.
- define:mot : donne des définitions du mot trouvées sur internet.
Opérateurs logiques (booléens)
- espace : les documents doivent contenir ce qui est à droite ET ce qui est à gauche. Le tri de Google favorise les documents où les différents mots spécifiés sont proches l’un de l’autre (voir plus bas).
- OR ou | : les documents peuvent contenir ce qui est à droite OU ce qui est à gauche. Attention : OR doit être écrit en majuscules !
- espace- (signe moins) : exclure les documents contenant le mot qui suit (SAUF)
- ( … ) : sous-expression à évaluer avant de faire les opérations avoisinantes
Limites
- Les requêtes sont limitées à 32 mots.
- Seuls les 1000 premiers résultats pertinents pour une requête sont accessibles, et ce même si les correspondances sont plus nombreuses. Les résultats peuvent même parfois être moins de 1000 en raison de la suppression des pages provenant d’un même site. D’après Google, obtenir plus de 1000 résultats entraînerait une lourde charge supplémentaire pour une demande finalement assez rare.
En théorie, le tri assure que les références les plus utiles sont en premier (difficile à valider).
Dates
- Lors d’une recherche par dates, la date est celle de l’indexation dans la banque de données (i.e. la visite du « spider » Google) et non celle de la publication effective de la page (telle que fournie par le serveur http://)
- Dans le formulaire de recherche avancée, vous pouvez faire une recherche sur les derniers 3, 6 et 12 mois.
- L’opérateur daterange:date julienne-date julienne permet de spécifier un autre intervalle de dates. Une date julienne est une date dans le calendrier julien.
Tri du résultat
La qualité de Google vient de sa capacité à montrer en premier les pages jugées les plus pertinentes en général et les plus pertinentes à une recherche en particulier. Google trie les documents trouvés en fonction :
- de mesures de qualité du site en général et aussi de chacune des pages (cohérence des méta-informations avec le texte visible de la page par exemple). Ces mesures ne sont pas ou peu documentées.
- une mesure du poids de chacune des pages indexées : Il s’agit de l’algorithme PageRank dont voici un extrait cité de Google :
- d’un calcul de la pertinence de la page vis-à-vis de la recherche effectuée. Ceci se fait en tenant compte :
- de la présence dans la page des mots de la recherche (éventuellement élargis à leurs synonymes ou à leurs variantes singulier/pluriel)
- de l’emplacement de ces mots dans la page (titre, méta-données, texte) ou dans les liens vers cette page : ce dernier point cause parfois des problèmes éthiques car une page se retrouve indexée par les mots que d’autres personnes que ses auteurs utilisent pour la désigner.
- Du tf-idf de chaque mot, formule qui prend en compte le nombre d’occurrences du mot dans la page pondéré par l’inverse de la fréquence relative de ce mot dans la partie du web indexée par Google:
- tfi = fréquence du terme i dans la page
- dfi = nombre de pages dans le web contenant le terme i
- D = nombre de documents dans le Web
- Cette formule a été mise au point par Gerard Salton (1927-1995), Université Cornell, sur base de la Théorie de l'information de Claude Shannon.
- de la distance dans la page entre les mots cherchés : plus ils sont proches l’un de l’autre, plus la page est jugée pertinente vis-à-vis de la recherche effectuée[10].
- du pays indiqué par l’URL d’accès à Google : google.be accorde une nette préférence aux sites belges, google.fr aux sites français, google.com aux sites américains et google.co.uk aux sites anglais, etc. Il est réellement important de choisir la « localisation » de ses recherches. La page suivante devrait plus souvent servir de page de démarrage d’une recherche : Outils linguistiques
- de la langue de l’utilisateur qui est aussi celle des mots cherchés : le seul formulaire permettant de la spécifier est sur Outils linguistiques . Le seul autre moyen de changer la langue de l’utilisateur est de modifier « à la main » l’URL de Google (http://www.google.be/search?hl=fr&q=...) en changeant le paramètre &hl=xx (xx étant le code en deux lettres de la langue désirée).
Il est essentiel de faire ses recherches en changeant sa langue d’utilisateur en fonction de la langue des mots cherchés. Google trie alors les documents en favorisant cette langue (et utilisera peut-être un jour le bon dictionnaire de synonymes). Il utilise alors l’algorithme adéquat pour rendre équivalents le singulier et le pluriel, le féminin et le masculin (rappel : le néerlandais semble mal supporté pour l’instant).
Fonctions complémentaires
Google propose également des fonctions complémentaires[11] :
- À la une de l’actualité : certains mots clés liées à l'actualité renvoient en tête des résultats 3 titres d'articles de Google Actualités. Un bouton permet de rechercher dans la une de l’actualité.
- Extraits de photos (provenant de Google Images) ayant rapport avec les mots-clé tapés
- Extraits de vidéos (provenant de Google Vidéo) ayant rapport avec les mots-clé tapés
- Extraits de cartes (provenant de Google Maps) si on tape un lieu géographique
- Conversion de devises : ex. : dans le champ recherche, taper : 3 euros en dollars, Google affichera : 3 euros = x,xxxxx dollars américain (taux fournis par Citybank non garantis).
- Calculatrice Google : dans le champ recherche, taper une formule mathématique
- Traduction automatique par Google Traduction[8]
- Fichiers PDF
- Pages en cache : permet d'afficher la page stockée dans la base de Google, utile si la page n'existe plus
- Pages similaires
- Pages liées : dans le champ recherche taper link:site.com pour afficher les pages extérieures qui poinent vers l'URL spécifiée
- Opérateurs de ciblage : permet de faire sa recherche exclusivement sur une seule adresse web. Syntaxe : « site:votre requête ».
- J'ai de la chance : permet de visiter directement le premier site trouvé sans voir tous les autres résultats.
- Définitions : permet d'obtenir une ou plusieurs (ou aucune) définition(s) de mots, extraites de divers sites web (Wikipédia et Wiktionaire principalement, ainsi que d'autres sites). Cette fonction est désormais disponible en anglais, français, espagnol, allemand, chinois, italien et russe. Syntaxe : « define:mot à définir »
- Google Movies : Taper film:titre pour afficher des critiques du film dont on a tapé le titre (movies:titre pour des critiques en anglais). Sur Google Movies , on a le choix entre la recherche web et la recherche des films qui indique les critiques du film recherché[12]. Cette fonction permet de donner des horaires des séances de cinéma proche de l'utilisateur (par utilisation de l'adresse IP) si l'on tape un nom de film
Easter eggs
Fonctions amusantes (Easter eggs)
- Si vous tapez « answer to life the universe and everything= », la fonction calculatrice de Google retourne « 42 ».
- Si vous tapez « do a barrel roll » la page s'anime en faisant un 360°, en hommage à Nintendo et surtout à la licence Star Fox [13].
SearchWiki
Depuis le 21 novembre 2008, la fonctionnalité SearchWiki permet de personnaliser la page de résultats Google sur sa version anglaise. La nouveauté a fait son apparition sur la version française de Google le 28 avril 2009[14].
Caractères spéciaux
Google gère les accents écrits sous forme d'entités, mais pas les caractères Unicode. Par conséquent, rechercher « alcene » et « alcène » ne donne pas le même résultat (car un mot seul est cherché en donnant une préférence à la forme dans laquelle il a été écrit) tandis que rechercher « encyclopédie » ou « ENCYCLOPÉDIE » ne change rien.
Si vous tapez « recette de la soupe au * et à la tomate », Google vous proposera le basilic ou le potiron à la place de l'étoile. On peut élargir ses recherches aux synonymes d'un mot, en le précédant du symbole « ~ ». Le « + » permet de forcer le mot à être interprété tel quel par Google (ceci est notamment utile pour les accents en français).
Utilisations détournées de Google et mèmes
Les nombreuses fonctionnalités de Google ont donné naissance à différentes utilisations ludiques par les internautes.
Concours de positionnement
De nombreux concours de positionnement ont vu le jour sur Google, puis sur d'autres moteurs. Le but est de placer une page sur un mot-clé plus ou moins fictif en première position des résultats de recherche sur celui-ci. Le premier concours important concernait la requête SERPS. En 2004, un concours francophone sur l'expression mangeur de cigogne a rassemblé 170 candidats et atteint 420 000 requêtes sur Google pour cette expression. Des controverses ont eu lieu sur les motivations de ces concours, qui sont pour les uns des outils d'expérience utiles au référencement, mais qui n'ont selon les autres que des motivations uniquement ludiques, faisant de Google un simple terrain de jeu.
Bombardement Google
Article détaillé : Bombardement Google.Le bombardement Google (Google bombing) consiste à associer sur le plus de pages web possible une expression à un site web donné, de sorte qu'une recherche Google sur cette expression remonte le site en question dans les premiers résultats. Les campagnes de bombardement Google se font à travers les forums ou les blogs, en incitant les internautes à participer. Il suffit au participant d'ajouter sur un site web ou un blog un lien vers le site visé en l'associant à l'expression.
L'un des premiers sites à avoir été visé par un bombardement est celui de la biographie du président des États-Unis George Walker Bush sur le site de la Maison Blanche. Une recherche google sur l'expression « failure » ou « miserable failure » donnait encore ce site comme premier résultat, jusqu'à ce que la firme de Mountain View ait effectué quelques corrections sur leur système, lesquelles réduiraient sensiblement le nombre de bombardements Google (voir plus bas).
Au cours de l'automne 2005, et faisant suite à une campagne massive de courriels lancée par le parti politique de Nicolas Sarkozy, et en représailles, les Webmestres ont appelé à faire du Google Bombing sur le nom du ministre de l'Intérieur. Ainsi, quand vous tapiez Nicolas Sarkozy dans Google, vous obteniez en deuxième position un lien pointant vers Iznogoud, le personnage de bande dessinée qui veut être calife à la place du calife. Le Google Bombing consiste à mettre sur la page d'un site web un lien (Iznogoud ou George Bush) et de l'associer à un texte (Nicolas Sarkozy ou miserable failure). Si l'opération est effectuée par un nombre certain de webmasters, le résultat est rapide : les liens fallacieux remontent dans les premiers résultats de Google.
Fin janvier 2007, Google annonce avoir mis au point un algorithme permettant de résoudre le problème du « google bombing » et ce dans n'importe quelle langue[réf. nécessaire].
Google fight
Le Google Fight consiste à comparer le nombre de résultats renvoyé par Google sur plusieurs expressions : est déclarée vainqueur l'expression ayant obtenu le plus de résultat. Les internautes s'amusent ainsi à comparer des noms, des idées politiques, etc. Un site web a même été créé pour offrir une interface à ce type de « combat » [15]. Le mot renvoyant le plus de résultats sur google étant « http »
Depuis janvier 2006, l'équipe de Google intercepte les requêtes de Google Fight et renvoie des résultats fantaisistes. Vous pouvez le vérifier en interrogeant le site plusieurs fois de suite sur le même couple de noms.
Google Whacks
Le Google Whacks est un jeu qui consiste à trouver deux mots qui associés dans une recherche sur Google donnent un unique résultat. Les termes employés doivent exister dans le dictionnaire, et le site trouvé ne doit pas être une simple liste de mots. Les guillemets et tous signes de ponctuation ne doivent pas être utilisés. Le score est souvent calculé en multipliant le nombre de résultats du premier terme par le nombre de résultats du second mot. [1]
« Faux Google »
Certains sites imitent la page d'accueil de google, dans un but humoristique[16]
Dans un autre style, certains sites utilisent les résultats du moteur de recherche Google, mais en les mettant en scène d'une façon particulière. Par exemple afin d'économiser l'électricité des écrans cathodiques[17] sur la page d'accueil de nombreux utilisateurs, un écran noir est proposé[18]. Afin de montrer à un internaute sur un forum par exemple, qu'il peut trouver seul la réponse à sa question en faisant une recherche Google, l'expression Google est ton ami (Geta en argot internet) on le renvoie vers les sites googleesttonami en français ou lmgtfy pour Let Me Google That For You en anglais qui accompagnent la recherche d'une petite animation.
Jumeaux Google
Google a généré la notion de Google twins (littéralement « jumeaux Google ») qui renvoie à des personnes homonymes (portant les mêmes prénom et nom de famille) et qui de ce fait peuvent apparaître au sein d'une même page de résultats lors d'une recherche effectuée au sujet de ce nom sur Google (ou tout autre moteur de recherche)[19],[20]. Ceci peut créer du bruit pour trouver des informations sur une personne, si l'un de ces « jumeaux Google » jouit d'une notoriété plus élevée.
Limites et erreurs de Google
La principale limite de Google est que le moteur ne parcourt que le web visible, laissant de côté toutes les bases de données professionnelles, parfois énormes, et souvent pertinentes, mais dont l’accès est limité (mais parfois gratuit). Exemple : Dialog (15 000 Go).
Des études montrent des limites internes de Google, comme par exemple de fortes variations dans le nombre de résultats annoncés à des recherches identiques lors de certaines périodes[21], ou des résultats incohérents quand on compare les résultats de certaines recherches, dues à des limitations techniques[22],[23] [24].
La taille de la base
Plusieurs recherches ont montré que le nombre de pages réellement indexées ne serait que la moitié du nombre annoncé ; l’autre moitié serait des pages visitées par le robot de Google, mais dont seule une partie (l’en-tête, sans le corps de la page) serait indexée. Ces pages seraient essentiellement des pages non-anglophones, à cause de la technologie Adword, qui est utilisable seulement pour l’anglais, et qui est la principale source de financement de Google.
Cette notion de taille de l'index a été et reste un élément marketing majeur des moteurs de recherche. Fin 2005, suite à une analyse critique[23], démarrée en janvier 2005, de la taille de son index, initiée par Jean Véronis, la firme Google a décidé de ne plus mettre cet argument en avant.[réf. nécessaire]
À titre d'exemple sur cette approche marketing, Google avait annoncé un doublement de la taille de son index annoncé, le lendemain du lancement de MSN Search[réf. nécessaire].
L’efficacité des recherches
Lors d’une recherche d’une complexité moyenne (utilisation d’un opérateur booléen, c'est-à-dire d’un espace [opérateur ET]), les résultats varient du simple au triple dans la même journée ; dans certains cas, selon un ordre de grandeur allant de un à dix.
Quelquefois, le moteur de recherche ne tient pas compte des opérateurs demandés.
Cette variabilité dans le nombre de réponses apportées s’explique par l’architecture de Google. Il existe en effet plusieurs serveurs dispersés dans le monde, hébergeant l’index des pages visitées par Google. Selon l’endroit où se trouve un internaute (ou selon le site local de Google interrogé), sa requête est dirigée vers l’un ou l’autre de ces serveurs. Normalement, chaque index est identique aux autres ; mais comme ils ne sont pas synchronisés en temps réel (mais à des intervalles pouvant dépasser le mois), seul l’index principal, situé en Californie, est constamment à jour, et donne un maximum de réponses correctes. Le serveur principal peut donner ainsi dix fois plus de réponses qu’un serveur secondaire.
Les résultats récents
De par la conception de son algorithme de recherche qui favorise les sites Web avec beaucoup de liens entrants, l'efficacité de Google est limitée dans la recherche d'évènements reliés à l'actualité et aux nouveaux sites Web. Google prévoit toutefois corriger cette faille dès 2010 en intégrant des évènements en temps réel dans ses résultats et en offrant la possibilité de les classer en ordre de publication[25].
Évaluation du moteur
Une étude comparative de 2006[26], aurait montré que Yahoo! et Google sont les deux meilleurs moteurs (parmi six des principaux moteurs francophones). Pour l'auteur, ces deux moteurs ayant des performances équivalentes, la raison de la préférence massive des internautes pour Google n'est pas la pertinence des résultats.
Mais, selon Trent, il pourrait être inférieur à Windows Live Search [réf. nécessaire]. Remplacé par Bing depuis.
Controverses
Controverse sur l'influence du contenu des résultats affichés
En devenant le premier moteur de recherche en termes d'utilisation, Google est devenu le premier véhicule d'information sur Internet. Ce rôle, véhiculer l'information, est inhérent au métier des moteurs de recherche, et les problèmes qui en découlent ne sont donc pas tous imputables à Google, qui n'est pas l'auteur du contenu des pages.
Au-delà des difficultés posées par l'importance stratégique du classement de Google dans le domaine économique, le véritable problème réside dans la forte influence idéologique que possèdent les pages qui apparaissent dans les premiers résultats et qui font figure de parole d'évangile. La popularité d'un moteur de recherche tel que Google peut être utilisée comme vecteur de désinformation, où l'influence d'un site est d'autant plus importante que le mot-clef est populaire et qu'il se trouve en tête de liste.
Les dirigeants de Google avouent[27] être impuissants face aux phénomènes d'intoxication et de diffamation qui s'affichent dans les premiers résultats de Google parce que la technique ne pouvant juger la sincérité de l'information.
Censure cartographique
Sur Google Maps, la carte de Corée du Nord est tout simplement censurée. Ce n'est pas un problème de censure par la Corée du Nord, puisque celle-ci est très détaillée sur d'autres cartes numériques (OpenStreetMap) ou au moins sommairement (ViaMichelin, Mappy, etc.).
Collusion avec la National Security Agency
La National Security Agency, services secrets des États-Unis d'Amérique, semble avoir accès à toutes les statistiques et informations regroupées par Google[28].
Affaire Tiananmen
Les dirigeants de la Chine, gênés qu'une recherche sur Tiananmen dans Google Images renvoie des photos de chars réprimant la révolte étudiante, ont obtenu en 2006 de Google que la requête « Tiananmen » sur le portail chinois de Google ne renvoie plus ces images[29].
Affaire BMW Allemagne
Suite à des tentatives de BMW Allemagne et de son référenceur d'augmenter son PageRank (et donc son positionnement des liens vers BMW sur des requêtes comme voiture dans Google), la firme automobile a été blacklistée par Google, qui l'a éliminée de son index en janvier 2006, durant deux jours. Les recherches sur "BMW" retournaient uniquement des références sur son site mondial[30].
Affaire des mots-clefs en France
En 2005, l'UMP et plus particulièrement Nicolas Sarkozy ont été critiqués pour avoir acheté des dizaines de mots-clefs comme « émeute », « CPE », « Jack Lang »… renvoyant sur le site de l'UMP.
Controverse sur le nombre de résultats affichés
Lorsque le nombre de pages est trop important, seules les 1 000 premières pages sont affichables, ce qui est une limite raisonnable et adoptée par la plupart des moteurs de recherche. Cependant, on a des raisons de croire que le nombre de pages trouvées soit artificiellement gonflé lorsque l'on dépasse cette limite en raison de deux faits :
- il affiche parfois un nombre de pages plus important que le nombre de pages de la toile répertoriées par Google (par exemple avec une requête sur un mot utilisé dans la totalité des pages anglophones comme « the », l'article défini) anglais;
- lorsque l'on fait plusieurs recherches successives sur le même mot-clef, le résultat varie. Ce résultat s'explique par le nombre de serveurs utilisés par Google, chaque serveur n'ayant pas le même nombre de pages enregistrées pour un même résultat.
Notes et références
- WHOIS - google.com
- Challenges, no 180, 17 septembre 2009, p. 49 « Qui a peur du Google », G.F.,
- Le Nouvel Économiste n°1566 Cahier n°2 du 12 au 18 mai 2011.
- Google and Akamai: Cult of Secrecy vs. Kingdom of Openness
- logo officiel de Google
- logos d'évènements
- logos destinés à la France
- (fr)Outils linguistiques sur www.google.fr. Consulté le 6 novembre 2010.
- formulaire de recherche avancée
- How does Google collect and rank results?
- fonctions complémentaires
- Google Movies
- http://geeko.lesoir.be/2011/11/04/google-cest-renversant/
- Nouveauté Google : personnalisation des résultats
- Google Fight
- ch'ti : Gogole, Google en wallon : Gôgueule, Google en flamand occidental : Hoegel, Google version boulet : Taggle, Google développé par la société Google en version "s3a|2ch : Google Hacker Google en
- Blackle : utiliser le moteur Google et économiser des watts » sur génération nouvelle technologie Audrey C., «
- Blackle ou gllgle en français. Par exemple les sites
- (en) Marc Ramirez, « He thought he was singularly special until he found his Google twin », dans The Seattle Times, 1er avril 2007 [texte intégral].
- (en) Lisa Heyamoto, « Me, myself and my google twin: Love 'em or be annoyed by 'em, someone — likely many someones — shares your name », dans The Sacramento Bee, 12 mars 2007, p. E1 ..
- un article de bases-publications
- (en) Mark Liberman, « Google recall (They stole his mind,now he wants it back.) », 24 janvier 2005
- Comptes bidons chez google », 26 janvier 2005 Jean Véronis, «
- Web: Le mystère des pages manquantes de Google résolu », 8 février 2005 Jean Véronis, «
- Essai du nouveau Google: meilleur pour le temps réel sur www.maximejohnson.com
- Étude comparative de six moteurs de recherche », février 2006 « [PDF]
- Eric Schmidt, documentaire télévisé Defining Google diffusé par CBSNews (janvier 2005) Interview de
- (en)"Don't Be Evil", Meet "Spy on Everyone": How the NSA Deal Could Kill Google sur wired.com
- requêtes Tiananmen sur Google China
- Google delists BMW Germany for foul play
Voir aussi
Articles connexes
- Google, l'entreprise.
- ElgooG, un site miroir humoristique de Google.
- Ferme de liens, une méthode de détournement du moteur de recherches de Google
- Searchmash, moteur « expérimental » de Google (arrêté depuis novembre 2008)
- PageRank.
Liens externes
Wikimedia Foundation. 2010.