5. Correction : nettoyage des données
5.1 Extension des langages de manipulation des données pour l’extraction et la transformation
Le nettoyage de données par transformation ou ETL (Extraction- Transformation-Loading) fait partie des stratégies d’amélioration de la qualité des données [29, 8]. Elle consiste à choisir et appliquer des transformations sur des jeux de données pour résoudre différents problèmes de format et d’incohérences, soit au sein d’une source, soit entre deux sources de données à intégrer. Comme a pu l’illustrer notre exemple précédent, les principales opérations de transformation sont énumérées dans la figure 7 d’après [30]
...
La suite de cet article est réservée aux abonnés
Vous n'êtes pas abonné ?
Consultez gratuitement cet article.
votre période de consultation gratuite
Découvrez le plus important corpus scientifique et technique francophone
Plus de 8 000 articles, 13 univers, 400 bases documentaires, les plus grands auteurs, un enrichissement permanent et un éventail de services associés.
