Tp analyse de séquence genscan augustus
Rapport de TP analyse de séquence
Durant ce TP nous avons étudié une séquence résultant d'un fragment d'ADN génomique humain impliqué dans une maladie génétique, la phénylcétonurie. Pour cela nous avons utilisé plusieurs logiciels permettant d'analyser cette séquence tels que Genscan, Augustus, BLAST, KEGG. I – Prédiction de gènes Dans un premier temps, on utilise les logiciels Genscan et Augustus pour caractériser la structure exon-intron du gène étudié. Genscan est un programme de détection de gènes ab initio c'est-à-dire qu'il n'utilise que la séquence ADN pour travailler, tandis que Augustus permet d'intégrer des données supplémentaires cependant on l'utilise comme un programme ab initio. Augustus et Genscan fonctionnent en recherchant des bases mais Augustus à la faculté de comparer la séquence avec des protéines connues. Ces deux logiciels fonctionnent avec des modèles probabilistes c'est-à-dire qu'à partir d'informations telles que la longueur moyenne des introns et des exons, la structure des codons stop, ils déterminent la probabilité d'avoir un exon ou un intron à un endroit précis de la séquence. Augustus peut utiliser le format FASTA qui est un format texte utilisé pour des séquences nucléotidique ou peptidique. Le format GFF ( General Feature Format) est un format utilisé pour décrire les coordonnées d'éléments du génome. Néanmoins, les résultats obtenus peuvent être discutés notamment en matière de sensibilité et de spécificité. La sensibilité est la fraction des exons présents dans la séquence qui sont retrouvés par le logiciel, c'est la probabilité de trouver tous les exons dans la séquence. Sensibilité = Vrais positifs / (Vrais positifs + Faux négatifs) La spécificité c'est la fraction de vrais exons parmi tous ceux prédits, c'est la probabilité de trouver des exons justes. Spécificité = Vrais positifs / (Vrais positifs + Faux positifs) De plus pour Augustus, qui lui peut traduire la séquence en protéine, il existe six