Programmation pour la science des données
Objectif
Couvrir les principaux concepts, outils et langages de programmation utilisés pour résoudre des problèmes en science des données.
Contenu
Langages de programmation utilisés en science de données (entre autres : Python, R, Julia). Concepts clé pour la conception de programmes pour l'exploration et l'analyse des données : structures de données, structures de contrôle, récurrence, procédures, fonctions. Apprentissage du développement de programmes pour : nettoyer, filtrer, transformer, agréger et arranger des données. Interaction par programmes avec des bases de données. Systèmes de contrôle de versions tels que Git. Environnements de développement pour la science des données (entre autres : Jupyter et JupyterLab, Google Colab). Manipulation de grands jeux de données. Évaluation des performances d’un programme.
Formules pédagogiques
Leçons magistrales, travaux pratiques, exercices, étude de cas.