Gestion et traitement de mégadonnées
Objectif
Introduire aux concepts, techniques, et outils de stockage, de recherche et d’analyse de mégadonnées.
Contenu
Bases de données (entre autres : relationnelles, objet, objet-relationnel, NoSQL). Caractéristiques et propriétés des mégadonnées et des bases de données pour mégadonnées. Paradigmes pour la distribution de calculs et d’apprentissages automatique à partir de mégadonnées (entre autres : Map-Reduce, ensembles de données distribués résilients). Pipelines de gestion et d’analyse de données diffusées en continu. Conception d’algorithmes pour la résolution de problèmes de mégadonnées. Ressources technologiques (logiciels, cadres, librairies, solutions infonuagiques) pour le stockage, la gestion et l’analyse des mégadonnées (entre autres : Hive, Flume, HDFS, Kafka, Pig, HDFS, Sqoop, Spark). Solutions infonuagiques pour les mégadonnées.
Formules pédagogiques
Leçons magistrales, travaux pratiques, exercices, étude de cas.