Analyse sémantique et traitement automatique de la langue naturelle
Objectif
Développer une compréhension approfondie des techniques et algorithmes utilisés pour le traitement automatique d’information linguistique et le langage naturel.
Contenu
Fondamentaux du traitement de la langue naturelle (entre autres : tokenisation, stemming, lemmatisation, stop words, reconnaissance d’entités nommées, plongements de mots, similarité entre phrases, analyse de graphes, Tf-IdF, extraction de relations, extraction d’événements). Techniques d’étiquetage grammatical (entre autres : tables de correspondance, n-grams, modèles de Markov cachés). Traitement automatique de la langue naturelle (entre autres : extraction de mots clé, analyse d’opinions/sentiments, modélisation de sujets, agents conversationnels, correction orthographique, traduction automatique). Modèles d’apprentissage automatique avancés pour le traitement de la langue naturelle (entre autres : réseaux de neurones denses et récurrents, modèles transformationnels, modèles d’attention).
Formules pédagogiques
Leçons magistrales, travaux pratiques, exercices, étude de cas.