- Open Source Business Intelligence
-
L'OSBI, acronyme de Open Source Business Intelligence, regroupe l'ensemble des solutions et techniques liées au décisionnel et dont le modèle s'appuie sur l'Open Source.
Ce concept, malgré la ressemblance, n'a aucun rapport avec l'Open Source Intelligence (OSINT) qui désigne l'intelligence économique à sources ouvertes.
La quasi totalité des domaines de la Business Intelligence du monde propriétaire sont couverts par l'OSBI. On trouve ainsi des solutions OSBI dans les catégories suivantes :
Les bases de données
Le monde du logiciel libre propose des alternatives face aux systèmes de bases de données propriétaires Oracle ou Microsoft SQL Server. Les solutions les plus réputées sont :
Les ETL
Les ETL (Extract - Transform - Load) sont les outils les plus couramment utilisés pour la construction et l'alimentation des datawarehouse (entrepôts de données).
Les ETL Open Source permettent d'effectuer un grand nombre de traitements pour l'Extraction, la Transformation et le chargement (Loading) de données, ceci depuis/vers un grand nombre de systèmes:
- Extraction et chargement de données en provenance de nombreux SGBD via les drivers JDBC: Oracle, PostgreSQL, MySql, MS SqlServer, IBM DB2, Sybase, Teradata...
- Extraction et alimentation de fichiers plats: CSV, Excel, XML, fichier de longueur fixe,...
- Transtypage, ajouts de champs calculés et de constantes, mapping, normalisation et dénormalisation
- Dédoublonnage de lignes, contrôles et routages de flux
- Validation et nettoyage de données
- Fonction de recherche ("Lookup") d'informations additionnelles permettant par exemple la jointure entre 2 SGBD différents
- Extraction et chargement dans des progiciels spécifiques (SAP, SugarCRM...) ou des annuaires LDAP
- Fonctions décisionnelles: Slowly Changing Dimension, lecture de cubes OLAP (Mondrian, Palo), agrégations
- Fonctionnalités orientées EAI: récupération et envoi de fichiers par FTP, SSH, Mail, Scripting, Messages orientés services, Web Services
Il existe plusieurs ETL Open Source, avec des versions de base entièrement libres (gratuites) et des versions professionnelles (payantes). Ces dernières sont dotées de fonctionnalités avancées et permettant d'obtenir un support direct auprès de l'éditeur.
Les ETL open source les plus complets et reconnus sont les suivants :
- Talend Open Studio
Actuellement en version 4.0, Talend Open Studio (TOS) est édité par la société Talend. Talend est un ETL dont l'interface graphique s'appuie sur Eclipse RCP et est de type "générateur de code" : un code spécifique est généré (et visible) pour chaque traitement d'intégration de données. Talend Integration Suite (TIS) désigne la version professionnelle, dont l'essentiel des fonctionnalités supplémentaires a pour but de fournir des fonctionnalités avancées d'entreprise : développement collaboratif, gestion des déploiements, console d'administration et de planification des jobs en production.
- Pentaho Data Integration (PDI) également connu sous le nom de Kettle
Actuellement en version 4.0, PDI est un ETL qui présente à peu de choses près les mêmes fonctionnalités que Talend, la différence principale étant son interface basée sur Java SWT et son mécanisme de "méta moteur". PDI embarque en effet la totalité du code nécessaire dans son noyau et ne traite ainsi que les flux de données. Ainsi, un traitement Kettle peut être stocké sous forme de fichier plat (XML) ou bien dans un SGBD ("Kettle repository"), ce dernier servant également de référentiel de travail partagé. Un des attraits de PDI est son niveau d'intégration avec la plate-forme OSBI Pentaho : Kettle peut ainsi servir de source de données au moteur de reporting de Pentaho et même permettre l'élaboration de vues d'analyses multidimensionnelles avec le concept "Agile BI" et l'outil Pentaho Analyzer
- CloverETL
Actuellement en version 3.0, CloverETL est édité par la société Javlin.
Les Outils de Reporting
- Jasper (iReport)
- Eclipse Birt (Actuate)
- JFreeReport / JFreeChart
Les Outils d'analyse multidimensionnelle (OLAP)
- Mondrian
- Palo (OLAP database) (en)
Les SGBD relationnels d'analyse
Les plates-formes OSBI WEB
- JasperServer
- Pentaho
- SpagoBI
- Vanilla
Moteurs d'analyses statistiques
Datamining et Textmining
Moteurs sémantiques
Reporting
Gestion documentaire
ERP
CRM
PDM
Groupware
Knowledge Management
OLAP
DATAMART
Les normes
Notes et références
Voir aussi
Articles connexes
Bibliographie
Liens externes
osbi.fr - Blog (en français) sur les solutions décisionnelles open source
Catégories :- Décision
- Ingénierie décisionnelle
- Management du système d'information
Wikimedia Foundation. 2010.