Filtrage collaboratif

Filtrage collaboratif

Le filtrage collaboratif est la traduction proposée du terme anglais collaborative filtering. Le filtrage collaboratif regroupe l'ensemble des méthodes qui visent à construire des systèmes de recommandation utilisant les opinions et évaluations d'un groupe pour aider l'individu.

Il existe deux principaux axes de recherche dans le domaine:

  • le filtrage collaboratif actif : qui repose sur du déclaratif (notes, commentaires) explicite de la part des utilisateurs. Cet axe de recherche se subdivise en deux autres catégories.
    • le filtrage collaboratif utilisateurs
    • le filtrage collaboratif objets
  • le filtrage collaboratif passif : qui repose sur une analyse des comportements utilisateurs faite en "arrière-plan" de manière implicite
  • le filtrage basé sur le contenu qui consiste à définir des caractéristiques "objectives" aux objets afin de procéder au filtrage.

Sommaire

Description

Systèmes de Filtrage Actifs

  • Description :
  • Avantages : capacité à reconstruire l'historique d'un individu et capacité à éviter d'agréger une information qui ne correspond pas à un unique utilisateur (plusieurs personnes sur un même poste ou une personne agissant pour le compte d'autrui)
  • Inconvénients: les informations recueillies peuvent contenir un biais dit de déclaration

Systèmes de Filtrage Passifs

  • Description :
  • Avantages :
    • Aucune information n'est demandée aux utilisateurs.
    • Les données récupérées sont justes et ne contiennent pas de biais de déclaration
  • Inconvénients :
    • Les données récupérées sont plus difficilement attribuables et contiennent des biais d'attribution. Un exemple typique est la multi-utilisation d'un compte par plusieurs utilisateurs.

Systèmes de Filtrage basé sur le contenu

L'approche de filtrage basé sur le contenu est notamment mise en œuvre dans les systèmes de recherche d'image ou de documents multimédia ou le contenu texte est souvent pauvre ou mal adapté à la recherche (voir la page Recherche d'information par le contenu). Dans ce cas, on utilise le plus souvent des descripteurs mathématiques calculés sur le contenu brut du document pour permettre le filtrage.

  • Description :

Le filtrage basé sur le contenu est un type de filtrage dont la décision de sélection ou non d'un document se base uniquement sur le contenu de celui-ci. Les techniques de filtrage basées sur le contenu fonctionnent par la caractérisation du contenu de l’information (document) à filtrer. Les représentations des documents et des profils dans ce type de filtrage exploitent seulement les informations qui peuvent être dérivées de leur thème respectif. Autrement dit, la sélection de documents se base sur une comparaison des thèmes abordés dans les documents par rapport aux thèmes intéressant l’utilisateur.

Filtrages Collaboratifs

Ils sont composés en général de trois étapes.

  • Récupérer une sélection d'informations sur laquelle va se baser le système de filtrage
  • La première consiste à recueillir de l'information
  • La seconde consiste à bâtir une matrice contenant l'information.
  • La troisième à extraire à partir de cette matrice une liste de suggestions

Systèmes de Filtrage collaboratifs utilisateurs

Méthodologie :

  1. Chercher des utilisateurs qui ont les mêmes comportements avec l'utilisateur à qui l'on souhaite faire des recommandations
  2. Utiliser les notes des utilisateurs similaires pour calculer une liste de recommandations pour cet utilisateur.

Un exemple pour mieux comprendre

En guide de bonne application des principes du filtrage collaboratif, on peut penser à un logiciel de location de films. Lorsque les clients rendent les DVD, ils sont invités à donner une note entre 0 et 10, indiquant leur satisfaction vis-à-vis du film loué. L’ensemble des notations des utilisateurs permet d’établir leurs profils et de les comparer aux autres clients. Ainsi, si Monsieur Dupont a aimé les films Matrix, Superman et Harry Potter, on va chercher dans la Base de Données les clients qui semblent avoir les mêmes goûts. Pour illustrer cet exemple, supposons que ces clients ont également adoré le film Titanic. Dans ce cas, le logiciel est en droit de supposer que M. Dupont va lui aussi apprécier Titanic et va donc le lui proposer à la location.

Systèmes de Filtrage collaboratifs objets

Le système de filtrage collaboratif a été popularisé par Amazon avec la fonctionnalité "les gens qui ont acheté x ont aussi acheté y". Le système d'Amazon était un système passif qui se basait sur les achats des gens pour construire la matrice de relation entre les objets.

  1. Bâtir une matrice "item-item matrix" determinant des relations entre des objets "pairs"
  2. Utiliser cette matrice pour proposer des objets.

Systèmes de Filtrage Collaboratif Commerciaux

  • En Français
    • dismoioù - restaurants, bars coiffeurs, salons de thé (aussi disponible en anglais)
    • ulike - livres, films, personnalités, musique
    • Criteo - films, vidéos (aussi disponible en anglais)
    • Sailendra - Produits, documents, articles (indépendant de la langue et du format)
    • Babelio - livres, écrivains


Voir aussi

Références


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Filtrage collaboratif de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Filtrage Collaboratif — Le filtrage collaboratif est la traduction proposée du terme anglais collaborative filtering. Le filtrage collaboratif regroupe l ensemble des méthodes qui visent à construire des systèmes de recommandation utilisant les opinions et évaluations d …   Wikipédia en Français

  • filtrage collaboratif — ● loc. m. ►SOC►DECI filtrage des informations disponibles en fonction des avis des autres utilisateurs de l information à disposition. C est classiquement l avis des lecteurs (le meilleur) et la confession d utilisateurs satisfaits (le pire: j ai …   Dictionnaire d'informatique francophone

  • Filtrage Bayésien Du Spam — Le filtrage bayésien du pourriel (en référence à Thomas Bayes), est une technique de détection du pourriel utilisant les réseaux bayésiens. C est une forme de filtrage statistique du courrier électronique. Elle s appuie sur la classification… …   Wikipédia en Français

  • Filtrage bayesien du spam — Filtrage bayésien du spam Le filtrage bayésien du pourriel (en référence à Thomas Bayes), est une technique de détection du pourriel utilisant les réseaux bayésiens. C est une forme de filtrage statistique du courrier électronique. Elle s appuie… …   Wikipédia en Français

  • Collaboratif — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sur les autres projets Wikimedia : « Collaboratif », sur le Wiktionnaire (dictionnaire universel) Collaboratif (de l anglais collaborative) …   Wikipédia en Français

  • Filtrage bayésien du spam — Le filtrage bayésien du spam (en référence à Thomas Bayes) est une technique statistique de détection de spam. Elle s appuie sur la classification naïve bayésienne pour identifier les messages électroniques non désirés. Les filtres bayésiens… …   Wikipédia en Français

  • Système de recommandation — Les systèmes de recommandation sont une forme spécifique de filtrage de l information (SI) visant à présenter les éléments d information (films, musique, livres, news, images, pages Web, etc) qui sont susceptibles d intéresser l utilisateur.… …   Wikipédia en Français

  • Système de recommendation — Système de recommandation Les systèmes de recommandation sont une forme spécifique de filtrage de l information (SI) visant à présenter les éléments d information (films, musique, livres, news, images, pages Web, etc) qui sont susceptibles d… …   Wikipédia en Français

  • Ulike — Ulike.net Logo de ulike URL http://www.ulike.net/ Description Communauté de catalogage culturel …   Wikipédia en Français

  • Ulike.net — Logo de ulike URL http://www.ulike.net/ Description Communauté de catalogage culturel …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”