Français Anglais
Accueil Annuaire Plan du site
Accueil > Production scientifique > Thèses et habilitations
Production scientifique
Doctorat de

Doctorat
Equipe : Bioinformatique

Algorithmes pour l'étude de la structure secondaire des ARN et l'alignement de séquences

Début le 01/09/2008
Direction : DENISE, Alain

Ecole doctorale :
Etablissement d'inscription : Université Paris-Saclay

Lieu de déroulement : LRI

Soutenue le 30/01/2012 devant le jury composé de :
Pascal Ferraro, maître de conférence, Université Bordeaux I
François Major, professeur, Université de Montréal
Abdel Lisser, professeur, Université Paris-Sud XI
Jean-Marc Steyaert, professeur, École Polytechnique
Alain Denise, professeur, Université Paris-Sud XI
Peter Clote, professeur, Boston College

Activités de recherche :

Résumé :
Ces travaux de thèse concernent la conception et l'étude d'algorithmes, d'une part pour prédire les quantités thermodynamiques et la structure secondaire des ARN, d'autre part pour l'alignement de séquences.

Dans une première partie, nous appliquons un algorithme de Monte-Carlo pour approximer la densité d'états d'énergie des structures secondaires d'une séquence d'ARN, ou d'une hybridation de deux molécules d'ARN données. Nous montrons d'abord que la densité estimée par notre programme est aussi bonne que la densité exacte, et le temps d'exécution de notre programme est beaucoup plus rapide. Nous calculons ensuite la température de dénaturation d'une hybridation de deux molécules d'ARN. Nous montrons que nos températures de dénaturation sont plus proches des valeurs expérimentales que celles des deux autres programmes existants.

Puis, dans une deuxième partie, nous implémentons un algorithme de programmation dynamique qui engendre des structures sous-optimales, dédié principalement à la prédiction des deux structures fonctionnelles des riboswitchs. Nous appliquons d'abord notre programme sur un riboswitch TPP dans lequel nous avons réussi à détecter les deux structures fonctionnelles. Nous montrons ensuite que les structures prédites par notre programme sont plus proches de la structure réelle par rapport aux cinq autres programmes existants, sur un échantillon de riboswitch purine.

Enfin, dans une troisième partie, nous présentons un algorithme de recherche des alignements sous-optimaux de séquences pour améliorer la qualité d'alignement des séquences. Nous comparons d'abord nos alignement à ceux produits par l'algorithme de Needdleman-Wunsch. Nous prédissons plus d'alignements de référrence par rapport l'algorithme de Needdleman-Wunsch. Nous calculons ensuite les fréquences des paires de bases alignées et les entropies de position spécifique dans nos alignements sous-optimaux. Nous montrons que les entropies calculées à partir de notre programme sont plus corrélées que celles des autres programmes avec les positions des paires de résidus fiablement alignées selon BAliBASE.