Blast et la recherche dans les bases de donnée
SOMMAIRE
1. Recherches par similitudes 2 1.1. LES ALIGNEMENTS DE SEQUENCES. NOTIONS GENERALES. 2 1.1.1. QUANTIFICATION DE LA SIMILITUDE. 3 1.1.2. MATRICES DE SUBSTITUTION. 3 1.1.3. FILTRES. 4 1.1.4. CONCLUSION. 4 1.2. UTILISATION DE BLAST (BASIC LOCAL ALIGNMENT SEARCH TOOL) 4 1.2.1. ALGORITHME 4 1.2.2. LES « PARFUMS» DE BLAST. 5 1.2.3. LES OPTIONS DE BLAST 6 1.2.4. CONCLUSIONS 7 1.3. PROBLEMES ET LIMITES DE LA RECHERCHE DE SIMILARITES POUR INFERER UNE FONCTION 8 1.4. LECTURE ET ANALYSE DES RESULTATS. 9 1.4.1. L'ANALYSE DE LA SECTION 3 10 1.4.2. L'ANALYSE DE LA SECTION 4 11 1.4.3. LES BASES DE DONNEES ACCESSIBLES PAR BLAST 11 1.4.4. CONCLUSIONS. 11
BLAST et la Recherche dans les bases de données
Recherches par similitudes
Quand on a cloné et séquencé un ou plusieurs gènes/cDNA, la première étape est souvent une recherche dans les bases de données publiques pour savoir : • Si les séquences sont déjà connues (mutations éventuelles). • Si des séquences proches existent • Quelles sont les informations déjà connues sur ces séquences similaires
On voudra également : • Trouver toutes les séquences d'une même famille • Rechercher toutes les séquences qui contiennent un motif donné
Pour cela on utilise des programmes d'alignement de séquences. Le programme d'alignement le plus utilisé par les biologistes est Blast (c'est peut être LE programme le plus utilisé par les biologistes !)
1 LES ALIGNEMENTS DE SEQUENCES. NOTIONS GENERALES.
On peut débuter la recherche à partir d'une séquence de quelques dizaines de nucléotides (voire moins) ou à partir d'une séquence de plusieurs milliers de nucléotides. En fait pour cette recherche les outils qui sont mis à votre disposition vont tenter d'aligner votre séquence avec toutes les séquences connues. Si des alignements sont possible, le programme vous en renverra la