Objectif

Développer une compréhension approfondie des techniques et algorithmes utilisés pour le traitement automatique d’information linguistique et le langage naturel.

Contenu

Fondamentaux du traitement de la langue naturelle (entre autres : tokenisation, stemming, lemmatisation, stop words, reconnaissance d’entités nommées, plongements de mots, similarité entre phrases, analyse de graphes, Tf-IdF, extraction de relations, extraction d’événements). Techniques d’étiquetage grammatical (entre autres : tables de correspondance, n-grams, modèles de Markov cachés). Traitement automatique de la langue naturelle (entre autres : extraction de mots clé, analyse d’opinions/sentiments, modélisation de sujets, agents conversationnels, correction orthographique, traduction automatique). Modèles d’apprentissage automatique avancés pour le traitement de la langue naturelle (entre autres : réseaux de neurones denses et récurrents, modèles transformationnels, modèles d’attention).

Formules pédagogiques

Leçons magistrales, travaux pratiques, exercices, étude de cas.