- Extract Transform Load
-
Pour les articles homonymes, voir ETL.
« Extract-Transform-Load » est connu sous le terme ETL, ou Extracto-Chargeur, (ou parfois : datapumping). Il s'agit d'une technologie informatique intergicielle (comprendre middleware) permettant d'effectuer des synchronisations massives d'information d'une base de données vers une autre. Selon le contexte, on est amené à exploiter différentes fonctions, souvent combinées entre elles : « extraction », « transformation », « constitution » ou « conversion », « alimentation ».
Elle repose sur des connecteurs servant à exporter ou importer les données dans les applications (Ex : connecteur Oracle ou SAP...), des transformateurs qui manipulent les données (agrégations, filtres, conversions...), et des mises en correspondance (mappages). L'objectif est l'intégration ou la réexploitation de données d'un réservoir source dans un réservoir cible.
À l'origine, les solutions d'ETL sont apparues pour le chargement régulier de données agrégées dans les entrepôts de données (ou datawarehouse), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilisées dans le monde bancaire et financier, ainsi que dans l'industrie, au vu de la multiplication des nombreuses interfaces.
Des technologies complémentaires sont apparues par la suite : l'Intégration d'applications d'entreprise (EAI), puis l'ESB (Enterprise Service Bus).
Comparaison générale ETL/EAI [1] ETL EAI Mode principal Batch Fil de l'eau (pseudo temps-réel) Orientation Données Métier Volumétrie potentiellement forte (ex 15 000 000 de lignes) relativement faible (ex. 100 000 lignes) Sources / Cibles <->SGBD, <-ODS, <->Datawarehouse, ->Datamart, <-Progiciel de gestion intégré, <-Gestion de la relation client <->inter-application au sens large
Il existe également des solutions d'ETL de contenu permettant de manipuler des données non structurées ou faiblement structurées, tels que les dossiers ou les documents. Ces solutions sont utilisées pour des projets de migration de documents. Par exemple, lors de migration de documents d'une application GED vers une autre. Leur champ d'application peut également s'étendre à des projets d'archivage électronique.Ces outils d'ETL sont également exploitables pour la manipulation de données non ou faiblement structurées dans le cadre de la fouille de textes.
Sommaire
Les Outils d'ETL
Open-source
Freeware
- Benetl
Propriétaire
- Hurence avec un ETL natif Hadoop
- IBM InfoSphere DataStage
- Informatica PowerCenter
- Microsoft SQL Server Integration Services (SSIS)
- Oxio Data Intelligence solution ETL
- OpenText Genio
- Oracle Data Integrator (Sunopsis)
- STATISTICA ETL (StatSoft)
- Stambia
- DataStudio (Data)
Voir aussi
Liens externes
Notes et références
Catégories :- Architecture logicielle
- Progiciel
- Ingénierie décisionnelle
Wikimedia Foundation. 2010.