Science des données pour l'actuariat 2

  • Cours (CM) -
  • Cours intégrés (CI) 36h
  • Travaux dirigés (TD) -
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Niveau de l'enseignement : B2-Avancé ou Indépendant

Description du contenu de l'enseignement

Après un rappel des principales méthodes d’analyse factorielle (ACP, AFC, ACM) et des méthodes de classification automatique (CAH et techniques de partitionnement direct), des méthodes d’analyse de données avancées sont présentées :

• Analyse de tableaux multiples (AFM)
• Analyse factorielle discriminante
• Méthodes de segmentation

Ce cours procure les principaux fondements théoriques de chacune des méthodes. L’accent est mis sur les aspects méthodologiques ainsi que sur la mise en œuvre des méthodes dans le logiciel R à partir d’exemples réels.

Programme :

* arbres de décision : régression et classification.
* forêt aléatoire et ensembles de modèles : voting, bootstrap, adaboost
* Deep learning (classification regression). Technique pour éviter le sur-apprentissage: pénalisation lasso-ridge, dimensionnement des couches de neurones, drop-out.
* En guise de synthèse: un projet complet se basant sur des données kaggle

Pré-requis obligatoires

Statistique univariée et bivariée usuelle (corrélation, régression, analyse de la variance à un facteur, tableau de contingence), principes de base de la théorie des test, bases du calcul matriciel

Contact

UFR de Mathématique et Informatique

7 RUE RENE DESCARTES
67084 STRASBOURG
0368855000


MASTER - Actuariat