ETL (Extraire, Transformer, Charger) désigne le processus en trois étapes par lequel les données sont extraites des systèmes sources, transformées selon des règles métier définies (nettoyage, standardisation, enrichissement et agrégation) et chargées dans un système de destination tel qu’un entrepôt de données ou un data mart. L’ETL est la technique fondamentale pour construire et maintenir les entrepôts de données analytiques qui alimentent les systèmes de reporting de gestion, la business intelligence et l’analyse financière. La qualité, la fiabilité et la maintenabilité des processus ETL sont des déterminants critiques de la qualité des données dans les systèmes de reporting en aval.
Pourquoi c’est important
L’ETL est le moteur qui transforme les données opérationnelles brutes, dispersées dans plusieurs systèmes sources, en informations analytiques cohérentes et structurées dans les systèmes de reporting. Sans des processus ETL fiables, les données de reporting sont soit périmées (mises à jour peu fréquemment), incohérentes (transformées différemment selon les sources) ou peu fiables (sujettes à des problèmes de qualité non détectés). L’investissement dans une infrastructure ETL bien conçue est l’investissement dans la fiabilité fondamentale de toute l’architecture de reporting.
Termes connexes
- Pipeline de Données
- Modèle de Données
- Entrepôt de Données
- Cycle de Rafraîchissement des Données
- Qualité des Données
Contenus connexes
À ajouter lorsque des articles pertinents du Knowledge Hub seront publiés