Phrap

From Wikipedia, the free encyclopedia

Phrap
Informations
Développé par Phil Green
Dernière version 0.990319 ()
Environnement UNIX, Linux, Windows, Mac OS X
Type Bioinformatique
Licence Propriétaire
Site web ,

Phrap est un programme informatique spécialisé dans l'assemblage de séquences d'ADN. Il est généralement utilisé en concomitance avec Phred et Consed.

Phrap fut à l'origine développé par Phil Green pour l'assemblage de cosmides issus du séquençage à grande échelle par la méthode shotgun réalisé dans le cadre du Projet Génome Humain. Phrap a été largement utilisé dans d'autres projets d'assemblage de séquences, incluant l'assemblage de génomes bactériens et de banques d'EST.

Phrap est un programme en ligne de commande afin d'être facilement intégré dans des scripts de traitement de données automatisés des grands centres de séquençage. Pour les utilisateurs désirant utiliser Phrap via une interface graphique, des programmes commerciaux tels que MacVector (pour Mac OS X uniquement) et CodonCode Aligner (pour Mac OS X et Microsoft Windows) sont disponibles.

Méthode

Une description détaillée (quoique partiellement obsolète) des algorithmes de Phrap peut être consultée dans la documentation de Phrap. Un trait récurrent des algorithmes de Phrap est l'utilisation des scores de qualité phred. Phrap utilise ces scores pour contourner un problème que d'autres programmes d'assemblage n'arrivaient pas à résoudre au commencement du Projet Génome Humain : assembler correctement des séquences répétées imparfaites fréquemment rencontrées, en particulier les séquences Alu. Phrap utilise ces scores afin de déterminer si les différences dans les régions répétées sont dues à une erreur de séquençage ou proviennent de deux copies ayant des séquences proches. Ainsi, Phrap n'a aucun problème pour différencier deux copies Alu différentes au sein d'un cosmide et ainsi assembler correctement ces cosmides (ou plus tard les BAC). La logique utilisée est relativement simple : une base identifiée avec un score phred élevé (faible probabilité d'erreur) ne doit jamais être aligné avec une autre base présentant un score élevé si cette dernière est différente. Néanmoins, dans certains cas, Phrap peut générer de tels alignements car les gaps d'alignement de cross_match ainsi que les pénalités d'alignement lors d'alignements locaux ne sont pas toujours optimaux pour ce type d'erreur. Phrap tente également de trier les séquences chimériques, les séquences de vecteurs ainsi que les régions terminales de basse qualité, le tout en une seule étape d'alignement, entraînant parfois quelques erreurs. Par ailleurs, Phrap aligne plusieurs fois une même région en interne, les alignements suivants étant moins astringent.

Le traitement des données de séquençage par cette méthode fut d'un grand secours dans les années 1990 lors la création du programme mais celui-ci a perdu petit à petit de son efficacité face à l'émergence d'autres programmes. À l'heure actuelle, Phrap semble générer plus d'erreurs que les nouveaux assembleurs tel que Euler, ne pouvant utiliser les informations de séquences couplés pour faciliter l'assemblage et n'assemblant pas aussi bien les séquences répétés. Phrap n'étant pas un logiciel libre, ceci a empêché sa diffusion et son amélioration par la communauté des bioinformaticiens contrairement à d'autres logiciels libres d'assemblage tels quel Bowtie ou SAMtools.

Génération de séquences consensus

Références

Voir aussi

Related Articles

Wikiwand AI