Mathématiques et statistiques pour la science des données
Objectif
Comprendre les concepts mathématiques et statistiques utilisés en science des données.
Contenu
Statistiques descriptives et théorie des probabilités : introduction, variable, population et échantillonnage, processus stochastique, mesure du centre (moyenne, médiane, mode), asymétrie, écart interquartile, variance, analyse de la variance et déviation standard, estimateurs, normalisation, calcul des probabilités, théorème de Bayes, loi des grands nombres, théorème de la limite centrale. Distributions de probabilités : discrètes (entre autres : Binomiale, Géométrique, Poisson), continues (entre autres : Exponentielle, Normale). Régression et métriques : coefficient de corrélation, R-Squared, MSE, MAE, RMSE. Estimation statistique. Test d’hypothèse.
Formules pédagogiques
Leçons magistrales, travaux pratiques, pratiques et utilisation de statistiques descriptives et inférence statistiques avec un langage de programmation (exemple : R), étude de cas.