Objectif

Comprendre les concepts mathématiques et statistiques utilisés en science des données.

Contenu

Statistiques descriptives et théorie des probabilités : introduction, variable, population et échantillonnage, processus stochastique, mesure du centre (moyenne, médiane, mode), asymétrie, écart interquartile, variance, analyse de la variance et déviation standard, estimateurs, normalisation, calcul des probabilités, théorème de Bayes, loi des grands nombres, théorème de la limite centrale. Distributions de probabilités : discrètes (entre autres : Binomiale, Géométrique, Poisson), continues (entre autres : Exponentielle, Normale). Régression et métriques : coefficient de corrélation, R-Squared, MSE, MAE, RMSE. Estimation statistique. Test d’hypothèse.

Formules pédagogiques

Leçons magistrales, travaux pratiques, pratiques et utilisation de statistiques descriptives et inférence statistiques avec un langage de programmation (exemple : R), étude de cas.