Partitionnement de donnees

Partitionnement de donnees

Partitionnement de données

Le partitionnement de données (data clustering en anglais) est une méthode statistique d'analyse des données qui a pour but de regrouper un ensemble de données en différents paquets homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité que l'on définit en introduisant des mesures de distance.

Pour obtenir un bon partitionnement, il convient de :

  • minimiser l'inertie intra-classe pour obtenir des grappes (cluster en anglais) les plus homogènes possibles.
  • maximiser l'inertie inter-classe afin d'obtenir des sous-ensembles bien différenciés.

Vocabulaire

La communauté scientifique francophone utilise différents termes pour désigner cette technique. Le mot anglais clustering est communément employé. On parle également souvent des méthodes de regroupement.

Le partitionnement de données est une méthode de classification non supervisée (différenciée de la classification supervisée où les données d'apprentissage sont déjà étiquetées), et donc parfois dénommée comme telle.

Algorithmes

Il existe de multiples méthodes de partitionnement des données, parmi lesquelles :

Voir aussi

Ce document provient de « Partitionnement de donn%C3%A9es ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Partitionnement de donnees de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Partitionnement de données — Exemple de clustering hiérarchique Le partitionnement de données (data clustering en anglais) est une des méthodes Statistiques d analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce …   Wikipédia en Français

  • Partitionnement (Oracle) — Le partitionnement de la base de données Oracle est un module de division des données d Oracle, payant et fréquemment utilisé sur des tables de volumétrie importante. Sommaire 1 Le partitionnement 2 Types de partitionnements 3 Partitionnement… …   Wikipédia en Français

  • Partitionnement — Partition Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom …   Wikipédia en Français

  • Partition (base de données) — Pour les articles homonymes, voir Partition. Dans une base de données, une partition est une division logique d une table stockée en plusieurs parties indépendantes. Le partitionnement de tables est généralement effectué pour améliorer la gestion …   Wikipédia en Français

  • Exploration de données — Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Analyse des données — L’analyse des données est un domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique …   Wikipédia en Français

  • Oracle (base de donnees) — Oracle Database Pour les articles homonymes, voir oracle. Oracle …   Wikipédia en Français

  • Oracle (base de données) — Oracle Database Pour les articles homonymes, voir oracle. Oracle …   Wikipédia en Français

  • Fouille de données spatiales — Exploration de données Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Administrateur de bases de données — L administrateur de bases de données (DBA : DataBase Administrator) est une personne responsable du bon fonctionnement de serveurs de bases de données, essentiellement relationnelles (OLTP) ou décisionnelles (OLAP), tant au niveau de la… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”