Objectif

Maitriser les processus et techniques de base pour identifier et résoudre des problèmes de qualité des données.

Contenu

Connaissance des données (entre autres : complexité, qualité, quantité, actualisation, types, formats, sources). Identification et résolution des problèmes de qualité des données. Préparation et prétraitement des données (entre autres : profilage, filtrage, nettoyage, standardisation et normalisation, transformation, ingénierie des caractéristiques, réduction de dimension). Exigences, critères, et métriques de qualité des données.

Formules pédagogiques

Leçons magistrales, travaux pratiques, exercices, étude de cas.