Master Informatique

Science des données et apprentissage
Master InformatiqueParcours Sciences des données et systèmes complexes (SDSC)

ComposanteUFR de mathématique et d'informatique

Catalogue2025-2026

Composante	UFR de mathématique et d'informatique
Langue(s) d'enseignement	Français
Niveau de l'enseignement (pour les langues uniquement)	B2 - Avancé - Utilisateur indépendant
Heures d'enseignement	CI : 36 TP : 24
Campus	Campus Illkirch-Graffenstaden
Ouvert aux étudiants d'autres disciplines
Ouvert aux étudiants en échange	6 ECTS suggérés
Code Apogée	MI1KGMBF

Description

Cet enseignement porte sur la méthodologie et les méthodes d’apprentissage en science des données. Il est divisée en quatre modules :

Introduction à la science des données
Apprentissage supervisé : concepts, méthodes et applications
Apprentissage non-supervisé : concepts, méthodes et applications
Introduction à l’apprentissage profond.

Compétences requises

À l'entrée de cette UE, un étudiant devrait savoir :

Écrire des programmes simples en Python

Compétences visées

À l'issue de cet enseignement un étudiant saura :

Mettre en forme les données en vue de les utiliser sur une tâche d’apprentissage
Expliquer les fondements de l’apprentissage des principales méthodes supervisées et non-supervisées, dont les réseaux de neurones
Identifier et choisir parmi ces méthodes les plus pertinentes à utiliser en fonction de la tâche d’apprentissage visée et de la nature des données à disposition
Mettre en œuvre et utiliser ces méthodes
Evaluer un résultat d’apprentissage avec les bons outils en fonction de l’objectif visé
Mettre en place un pipeline d’entraînement afin de comparer et sélectionner un ensemble de méthodes avec différents hyperparamètres.

Disciplines

Informatique

Syllabus

Les principaux thèmes étudiés sont :

Concepts et définition de la science des données
Les différents métiers : Scientifique des données (cœur de l’IA), Ingénieur des données (Intégration de l’IA dans des processus métiers), Utilisateur (Processus métiers ou usage personnel)
Défis et enjeux méthodologiques, éthiques, sociétaux ...
La préparation des données : formatage des données, normalisation, split des jeux de données et validation croisée, …
Les principales méthodes d’évaluation supervisées (F1-score, IoU, AUC, matrice de confusion, ...) et non-supervisée (ARI, NMI, score de silhouette, …) et de comparaison (ranking, p-value, graphique de win-loss, ...)
Stratégie d’entrainement : pipeline d’entrainement et random ou grid seach
Le clustering : un problème mal défini et mal posé
Principales méthodes supervisées : arbres de décision, modèles bayésien, apprentissage à base d'instances, SVM, apprentissage d'ensemble de règles
Principales méthodes non-supervisées : partitionnement, mélange de lois, hiérarchiques, formation de concepts
Recherche de motifs fréquents
Réseaux de neurones artificiels : rappels et approfondissements
Vers l’apprentissage profond : intérêt des réseaux de neurones convolutifs
Optimisation de l’apprentissage des réseaux de neurones
Différents types d'apprentissage : apprentissage par renforcement et apprentissage adversarial

Bibliographie

Russell, S. J., & Norvig, P. (2016). Artificial intelligence: a modern approach. Pearson.
Barra, V., Cornuéjols, A., & Miclet, L. (2021). Apprentissage artificiel: Concepts et algorithmes-De Baye et Hume au Deep learning. Editions Eyrolles.
Beyerer, J., Hagmanns, R., & Stadler, D. (2024). Pattern recognition: introduction, features, classifiers and principles. Walter de Gruyter GmbH & Co KG.
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. MIT press.

Contacts

Responsable(s) de l'enseignement

Baptiste Lafabregue

MCC

Les épreuves indiquées respectent et appliquent le règlement de votre formation, disponible dans l'onglet Documents de la description de la formation.

Régime d'évaluation: ECI (Évaluation continue intégrale)

Évaluation initiale / Session principale - Épreuves

Libellé	Type d'évaluation	Nature de l'épreuve	Durée (en minutes)	Coéfficient de l'épreuve
Note 1 : Quizz en CILa durée du quizz peut varier entre 5 et 15 minutes	SC	ET	15	3
Note 2 : Epreuve écrite	SC	ET	90	3
Note 3 : TP noté	SC	A	90	2
Note 4 : Epreuve rendue	SC	PR		4