- Gestion des donnees de reference
-
Gestion des données de référence
La gestion des données de référence (GDR ; en anglais Reference Data Management, ou Master Data Management, dont le sigle est MDM), est la discipline des technologies de l'information qui s'applique aux données de référence partagées par plusieurs systèmes informatiques ou groupes distincts.
Cette discipline est la combinaison des techniques, processus et organisations nécessaires en vue de créer et maintenir une vue complète, fiable et à jour des données de référence, indépendamment des canaux de communications, du secteur d'activité ou des subdivisions métiers ou géographiques et dans un contexte de coexistence de plusieurs sources d’acquisition des données de référence au sein du SI de l'entreprise.
La GDR est nécessaire pour garantir la cohérence des données entre processus et fonctions métiers, et diverses architectures de systèmes, et améliorer leur qualité au bénéfices des processus opérationnels et décisionnels, et des applications sous-jacentes consommatrices d'informations.
Sommaire
Présentation
Les systèmes informatiques des grandes entreprises sont utilisés par différentes fonctions métier (par exemple le marketing, la recherche et développement, les ventes, les finances, etc.), à différents endroits, dans différents pays.
Ces systèmes divers ont besoin de partager des données clés qui sont utiles à tous ou à la société mère (par exemple les produits, les clients ou les fournisseurs). Il est donc critique pour une entreprise d'utiliser ces données partagées d'une façon cohérente à travers différents systèmes informatiques. La GDR vise donc à améliorer de façon durable la qualité des données partagées, à destination des systèmes et processus consommateurs.
D'un point de vue gestion de l'information, la GDR est la discipline de la gestion d'information d'entreprise (ou en anglais EIM, Enterprise Information Management). En se concentrant sur les données de référence (données structurées ayant une signification métier, et partagées par plusieurs processus métiers et/ou partagés par plusieurs systèmes applicatifs), la GDR s'inscrit dans la politique de gouvernance des données de l'entreprise.
Dans un modèle classique de système d'information, la gestion des données de référence est nécessaire pour coordonner différents systèmes ERP entre eux et avec les systèmes décisionnels.
La gestion des données de référence prend une grande importance quand plusieurs entreprises veulent partager des données au-delà de leur propre périmètre. La GDR devient alors un sujet industriel, comme c'est le cas de l'industrie de la finance et du Straight Through Processing.
Application
Dans le Y computing model, trois types de programmation s'étendent du reporting opérationnel aux Executive Information Systems :
- la gestion des transactions en temps réel (ou Online transaction processing, OLTP) [1], typiquement les ERP
- l'informatique décisionnelle (Decision Support Systems, DSS)
- la gestion des données de références (MDM)
Dans un modèle moins structuré du type ingénierie des connaissances, la gestion des données de référence est aussi nécessaire pour fournir des métadonnées en vue d'agréger et d'intégrer des données transactionnelles, contenues dans des ressources informatiques, souvent des ressources web.
Dans les deux cas, la gestion des données de référence est nécessaire pour les projets d'entrepôts de données qui sont typiquement intégrés dans les systèmes d'ingénierie décisionnelle. Pour cette raison, les systèmes MDM fournissent quelquefois une couche virtuelle de métadonnées.
Principaux domaines d'application
Gestion de données Produits
La GDR dans la gestion des produits (produit, articles, fiches techniques) permet de centraliser au sein d'un référentiel les données intervenant dans les processus de référencement (grande distribution) et de développement de produit (industrie).
La principale problématique concerne la gestion collaborative d'enrichissement, puisquil s'agira de coordonner la complétion de la fiche produit par différents intervenants et différents métiers avant consommation (intégration avec un système PLM, diffusion à des partenaires externes).
Gestion de données Tiers
La GDR dans la gestion de Tiers (Clients, Fournisseurs, Employés, etc.) intervient pour consolider différents canaux d'acquisition d'informations relatives à des personnes physiques et/ou morales.
La principale problématique concerne la consolidation, et par conséquent la capacité de rapprochement d'informations provenant de sources diverses, leur enrichissement et le contrôle de leur validité (cohérence avec le monde réel pour une adresse), avant mise à disposition d'applications type CRM, logistique ou comptable.
Gestion de données financières
La GDR dans la gestion des données financières (instruments financiers, opérations sur titres, cours boursier, notations, émetteurs) intervient pour consolider l'acquisition d'informations provenant de plusieurs fournisseurs d'informations financières (Bloomberg, Thomson Reuters, Telekurs, etc.) à destination des systèmes BackOffice. L'équivalent anglais de la GDR est alors Reference Data Management.
Le but est de rationaliser les coûts d'acquisition de donnés externes en centralisant les demandes de données nécessaires aux métiers des différents départements de l'entreprise.
Les principales problématiques concernent:
- l'optimisation de logique d'acquisition, pour minimiser les coûts d'acquisition des données auprès des fournisseurs externes et constituer d'une vue complète, fiable et à jour d'un instrument (puisque la couverture des informations varie en fonction de chaque fournisseur),
- la rapidité d'exécution de traitements (Straight Through Processing, nettoyage et sélection de prix - ou Price Scrubbing) en minimisant les traitement manuels en faveur de l'automatisation (technologies d'exécution de règles métiers: moteur embarqué, ou combiné à un BRMS ou une architecture CEP - Complex Event Processing[2]) pour la mise à disposition rapide des informations aux systèmes back-office consommateurs (évaluation de portefeuille, calcul de risques).
- la complétude et fiabilité de l'information - étendu du modèle de données, gestion relations entre instruments et entre émetteurs - pour améliorer la pertinence et la rapidité des calculs de risques.
Différentes façons de gérer les données de référence
Les Données Métier de Référence permettent d’identifier et de classifier les données d’un système et idéalement de l’ensemble du système d’information. La gestion des données de référence se décline en termes de méthode, d’organisation, de moyens pour décrire, pour référencer, pour utiliser de façon synchronisée des données métier à travers l’entreprise.
La gestion et la synchronisation des données métier de référence peut se faire de différente façon :
- de façon « traditionnelle » : synchronisation de chaque système via des scripts ou des saisies manuelles,
- via une application dédiée : mise en place d’une application centrale dédiée (une seule ou une par sujet – client/cdi, produit/pim, …),
- dans l’entrepôt de données : le MDM est intégré à l’entrepôt de données actif,
- via une solution mixte : combinaison des approches ci-dessus en fonction des données et des systèmes.
- par des métadonnées lorsqu'il y a des besoins sémantiques ou terminologiques importants.
Architectures de mise en oeuvre
Notes et références
- ↑ (en) OLTP transactional computing
- ↑ (en) Complex Event Processing
Voir aussi
Articles connexes
- Modèle de données
- Métadonnée
- Gouvernance des données
- Qualité des données
- Architecte de données
- Procédure d'entreprise
- Système de gestion de données techniques (en anglais Product Data Management)
- (en) GJXDM, données de référence utilisées par la justice aux États-Unis.
Bibliographie
- « MDM - Enjeux et méthodes de la gestion des données » de Franck Régnier-Pécastaing, Michel Gabassi et Jacques Finet, Collection InfoPro - Management des Systèmes d'Information, éditions Dunod (2008).
- « Data Management : qualité des données et compétitivité » de Christophe Brasseur, Collection Management et informatique, éditions Hermès Science - Lavoisier (2005).
- « "Les apports de la méthode MDM dans la performance du SI des entreprises » de Axel KAMALAK, mémoire de fin d'études (2008)
Liens externes
- MAG (MDM Alliance Group), communauté d'origine francophone composée d'acteurs du MDM (édition, intégration et conseil), développant et publiant un ensemble de bonnes pratiques.
- Open Directory: Master Data Management Category
- In data veritas, blog sur l'actualité francophone du MDM (indépendant)
- Buzz.MDM, blog sur l'actualité francophone du MDM (Logica)
- Data Channel, blog sur l'actualité francophone du MDM (indépendant)
Catégorie : Gestion des données
Wikimedia Foundation. 2010.