Bioinformatique
Master InformatiqueParcours Sciences des données et systèmes complexes (SDSC)

Description

Cette UE est un cours avancé sur des structures et données informatiques. Les concepts définis sur un alphabet fini quelconque seront principalement présentés sur l'alphabet bioinformatique à 4 lettres.
Les thèmes étudiés sont :
- Codes génétiques. Codes circulaires. Codes comma-free. Codes forts.
- Mots de Fibonacci. Mots de de Bruijn. Mots de code circulaire : nombres, classes, propriétés sur les préfixes et suffixes, structure.
- Graphes associés aux codes circulaires : cycle, propriétés des sommets, degré des arêtes.
- Modèles d'évolution de données. Distances évolutives entre les données.
- Fonctions de corrélation sur les mots et algorithmes pour la recherche de périodicité dans les textes.

Compétences visées

À l'issue de cette UE un étudiant saura :
- Comprendre les concepts de codes et de mots.
- Construire et analyser des graphes associés aux mots.
- Déterminer une distance évolutive entre des données bruitées (binaire, génétique, linguistique, etc.).
- Implémenter des algorithmes de fonctions de corrélation pour la recherche de périodicité dans des données textuelles bruitées.
L'étudiant possédera des connaissances approfondies sur des structures et données informatiques textuelles et également des compétences théoriques et appliquées en bio-informatique.