Extract Transform Load

Extract Transform Load
Page d'aide sur l'homonymie Pour les articles homonymes, voir ETL.

« Extract-Transform-Load » est connu sous le terme ETL, ou Extracto-Chargeur, (ou parfois : datapumping). Il s'agit d'une technologie informatique intergicielle (comprendre middleware) permettant d'effectuer des synchronisations massives d'information d'une base de données vers une autre. Selon le contexte, on est amené à exploiter différentes fonctions, souvent combinées entre elles : « extraction », « transformation », « constitution » ou « conversion », « alimentation ».

Elle repose sur des connecteurs servant à exporter ou importer les données dans les applications (Ex : connecteur Oracle ou SAP...), des transformateurs qui manipulent les données (agrégations, filtres, conversions...), et des mises en correspondance (mappages). L'objectif est l'intégration ou la réexploitation de données d'un réservoir source dans un réservoir cible.

À l'origine, les solutions d'ETL sont apparues pour le chargement régulier de données agrégées dans les entrepôts de données (ou datawarehouse), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilisées dans le monde bancaire et financier, ainsi que dans l'industrie, au vu de la multiplication des nombreuses interfaces.

Des technologies complémentaires sont apparues par la suite : l'Intégration d'applications d'entreprise (EAI), puis l'ESB (Enterprise Service Bus).

Comparaison générale ETL/EAI [1]
ETL EAI
Mode principal Batch Fil de l'eau (pseudo temps-réel)
Orientation Données Métier
Volumétrie potentiellement forte (ex 15 000 000 de lignes) relativement faible (ex. 100 000 lignes)
Sources / Cibles <->SGBD, <-ODS, <->Datawarehouse, ->Datamart, <-Progiciel de gestion intégré, <-Gestion de la relation client <->inter-application au sens large


Il existe également des solutions d'ETL de contenu permettant de manipuler des données non structurées ou faiblement structurées, tels que les dossiers ou les documents. Ces solutions sont utilisées pour des projets de migration de documents. Par exemple, lors de migration de documents d'une application GED vers une autre. Leur champ d'application peut également s'étendre à des projets d'archivage électronique.

Ces outils d'ETL sont également exploitables pour la manipulation de données non ou faiblement structurées dans le cadre de la fouille de textes.

Sommaire

Les Outils d'ETL

Open-source

  • Apatar (en)
  • CloverETL
  • GeoKettle
  • Pentaho Data Integration
  • Scriptella
  • Talend Open Studio (en)

Freeware

  • Benetl

Propriétaire

  • Hurence avec un ETL natif Hadoop
  • IBM InfoSphere DataStage
  • Informatica PowerCenter
  • Microsoft SQL Server Integration Services (SSIS)
  • Oxio Data Intelligence solution ETL
  • OpenText Genio
  • Oracle Data Integrator (Sunopsis)
  • STATISTICA ETL (StatSoft)
  • Stambia
  • DataStudio (Data)

Voir aussi

Liens externes

Notes et références


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Extract Transform Load de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • Extract, transform, load — Extract, transform and load (ETL) is a process in database usage and especially in data warehousing that involves: Extracting data from outside sources Transforming it to fit operational needs (which can include quality levels) Loading it into… …   Wikipedia

  • Extract Load Transform — Un Extract Load Transform (ELT ou E LT ou ET LT) est un outil d’ETL (intégration de données) particulier. La finalité est la même qu’une solution d’ETL mais la manière d’arriver au résultat est différente. L’ELT tire parti des technologies… …   Wikipédia en Français

  • Load — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sur les autres projets Wikimedia : « Load », sur le Wiktionnaire (dictionnaire universel) Load, un album de Metallica sorti en 1996 ;… …   Wikipédia en Français

  • Data Transform Process — Dieser Artikel wurde aufgrund von inhaltlichen Mängeln auf der Qualitätssicherungsseite der Redaktion Informatik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Informatik auf ein akzeptables Niveau zu bringen. Hilf… …   Deutsch Wikipedia

  • ETL — Extract Transform Load (Computing » General) *** Extraction Transformation And Loading (Computing » Databases) ** Environmental Technology Laboratory (Academic & Science » Ocean Science) ** Environmental Technology Laboratory (Academic & Science… …   Abbreviations dictionary

  • Data warehouse — Overview In computing, a data warehouse (DW) is a database used for reporting and analysis. The data stored in the warehouse is uploaded from the operational systems. The data may pass through an operational data store for additional operations… …   Wikipedia

  • Data transformation — Data transformation/Source transformation Concepts metadata · data mapping data transformation · model transf …   Wikipedia

  • IBM WebSphere Information Integration — WebSphere Information Integration is a suite of business software for data management tasks such as retrieving, profiling, cleansing, transformation and metadata management. The suite of tools has evolved over the last few years and was formerly… …   Wikipedia

  • List of free and open source software packages — This article is about software free to be modified and distributed. For examples of software free in the monetary sense, see List of freeware. This is a list of free and open source software packages: computer software licensed under free… …   Wikipedia

  • Data Vault Modeling — is a database modeling method that is designed to provide historical storage of data coming in from multiple operational systems. It is also a method of looking at historical data that, apart from the modeling aspect, deals with issues such as… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”