Similarité (informatique)

Similarité (informatique)

En mathématique et en informatique la similarité est un critère important pour l'identification de sous-groupe dans un groupe d'objets, de valeurs (numériques ou non), de données (connus ou reconnus) dans un « espace » ou système...
Du point de vue mathématique, c'est par les différences de distance mathématique entre deux données qu'on mesure leur degré de similarité.

Sommaire

Vocabulaire

  • En classification, on parle de clusterisation (ou Clustering) pour décrire le partitionnement de données, et un cluster est alors un ensemble de données ou d'éléments présentant des similarités. Le langage de description des objets d'une base de données doit permettre de définir la distance de cet objet par rapport aux autres. Une donnée et par suite la mesure de sa distance à d'autres objets peut être surpondérée ou sous-pondérée dans le système de calcul de distance entre objet, quand la donnée parait plus importante (ou moins) pour le problème considéré. La pondération se fait à dire d'expert ou au moyen d'un système expert. Ceci devient difficile quand le nombre d'attributs qui décrivent une donnée est important. D'autres systèmes de réduction de la complexité peuvent alors être utilisés.
  • Dans le champ de l'intelligence artificielle, la similarité est un des critères pour l'analyse informatique de clusters et pour le partitionnement de données (data clustering en anglais). Cette étape de classification automatique est nécessaire pour la mise en œuvre des méthodes d'apprentissage automatique. Les logiciels experts cherchent aussi à prendre en compte le contexte, selon lequel la similarité peut varier (ex  : dans trois contextes différent de température, l'eau, tout en restant H20 peut être présente sous forme de vapeur, de liquide ou de glace, neige ou givre et avoir un impact climatique très différent). Le logiciel fera un travail d'autant plus pertinent que les attributs des données seront utiles et pertinent dans le contexte.

Algorithmes utilisant la similarité

Il en existe plusieurs, visant le partitionnement des données, dont :

Voir aussi

Articles connexes

Liens externes

Bibliographie

Notes et références



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Similarité (informatique) de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Similarité sémantique — La similarité sémantique est une notion définie entre deux concepts soit au sein d une même hiérarchie conceptuelle, soit dans le cas d alignement d ontologies entre deux concepts appartenant respectivement à deux hiérarchies conceptuelles… …   Wikipédia en Français

  • RADIUS (informatique) — Remote Authentication Dial In User Service Pour les articles homonymes, voir Radius. RADIUS (Remote Authentication Dial In User Service) est un protocole client serveur permettant de centraliser des données d authentification. Sommaire 1 Normalis …   Wikipédia en Français

  • Radius (Informatique) — Remote Authentication Dial In User Service Pour les articles homonymes, voir Radius. RADIUS (Remote Authentication Dial In User Service) est un protocole client serveur permettant de centraliser des données d authentification. Sommaire 1 Normalis …   Wikipédia en Français

  • Radius (informatique) — Remote Authentication Dial In User Service Pour les articles homonymes, voir Radius. RADIUS (Remote Authentication Dial In User Service) est un protocole client serveur permettant de centraliser des données d authentification. Sommaire 1 Normalis …   Wikipédia en Français

  • Partitionnement de données — Exemple de clustering hiérarchique Le partitionnement de données (data clustering en anglais) est une des méthodes Statistiques d analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • Modèle des croyances transférables — Le MCT ou Modèle des croyances transférables est un modèle non probabiliste de « raisonnement incertain » reposant sur la théorie des fonctions de croyance. Il a été proposé et développé par Philippe Smets au début des années 90 Quand… …   Wikipédia en Français

  • Regroupement hiérarchique — Dans le domaine informatique, et plus précisément dans le domaine de l analyse et de la classification automatique de données, la notion de regroupement hiérarchique recouvre différentes méthodes de clustering, c est à dire de classification par… …   Wikipédia en Français

  • Alignement de séquences — Pour les articles homonymes, voir Alignement. En bio informatique, l alignement de séquences (ou alignement séquentiel) est une manière de disposer les composantes (nucléotides ou acides aminés) des ADN, des ARN, ou des séquences primaires de… …   Wikipédia en Français

  • Proximité sémantique — La proximité sémantique est une notion définie entre deux concepts soit au sein d une même hiérarchie conceptuelle, soit dans le cas d alignement d ontologies entre deux concepts appartenant respectivement à deux hiérarchies conceptuelles… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”