Science des données pour l'actuariat 2

Science des données pour l'actuariat 2
DU - Mathématiques & InformatiqueParcours Mathématiques et applications : recherche et interactions

Description

Après un rappel des principales méthodes d’analyse factorielle (ACP, AFC, ACM) et des méthodes de classification automatique (CAH et techniques de partitionnement direct), des méthodes d’analyse de données avancées sont présentées :

• Analyse de tableaux multiples (AFM)
• Analyse factorielle discriminante
• Méthodes de segmentation

Ce cours procure les principaux fondements théoriques de chacune des méthodes. L’accent est mis sur les aspects méthodologiques ainsi que sur la mise en œuvre des méthodes dans le logiciel R à partir d’exemples réels.

Programme :

* arbres de décision : régression et classification.
* forêt aléatoire et ensembles de modèles : voting, bootstrap, adaboost
* Deep learning (classification regression). Technique pour éviter le sur-apprentissage: pénalisation lasso-ridge, dimensionnement des couches de neurones, drop-out.
* En guise de synthèse: un projet complet se basant sur des données kaggle