Gestion et extraction de connaissances pour les masses de données

  • Cours (CM) -
  • Cours intégrés (CI) 20h
  • Travaux dirigés (TD) -
  • Travaux pratiques (TP) 10h
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

Cette UE vise à faire comprendre et appréhender les grands défis liés au phénomène “Big Data” et en particulier les enjeux techniques et scientifiques en rapport avec les caractéristiques propres aux masses de données (volume, vélocité, variabilité, ..) mais aussi les enjeux éthiques et sociétaux induits. Les enseignements pourront prendre la forme de séminaires ou d'étude d'articles.
 

Compétences à acquérir

À l'issue de cette UE un étudiant saura :
- Définir les principales caractéristiques des masses de données et les défis scientifiques, techniques et sociétaux associés.
- Manipuler des données non structurées hétérogènes.
- Évaluer à l'aide des critères statistiques la qualité des données et des résultats.
- Visualiser des masses de données.
- Comprendre et utiliser des approches collaboratives, semi-supervisées ou guidées.

Bibliographie, lectures recommandées

Références :
- M. Bouzeghoub, R. Mosseri, Les Big Data à découvert, CNRS Edition, 2017
- J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets. Cambridge University Press.
- Karau, H., A. Konwinski, P. Wendell et M. Zaharia. Learning Spark - Lightning-Fast Big Data Analysis. O’Reilly, 2015.
- Ryza, S., U. Laserson, S. Owen and J. Wills. Advanced Analytics with Spark - Patterns for Learning from Data at Scale. O’Reilly, 2015.
- Fry, B. Visualizing Data. O’Reilly. 2008.
- Spence, R. Information Visualization: Design for Interaction. Prentice Hall. 2007.
 

Pré-requis obligatoires

À l'entrée de cette UE, un étudiant devrait savoir :
- Capacité à mettre en œuvre les méthodes et techniques statistiques de classification et clustering
- Être capable de mettre en place une architecture distribuée pour les calculs et les données
- Connaître et savoir mettre en oeuvre l’extraction de connaissances à partir de données
- Manipuler les principaux outils d'exploration et valorisation des données (WEKA, R, JCL, ..)

Contact

UFR de Mathématique et Informatique

7 RUE RENE DESCARTES
67084 STRASBOURG
0368850123


MASTER - Informatique