Contig
From Wikipedia, the free encyclopedia
Un contig est une séquence génomique continue et ordonnée (contigüe) générée par l'assemblage de séquences plus courtes qui se chevauchent, généralement des reads. En bioinformatique génomique, l'élongation des reads en contigs est le fait d'un assemblage (assemblage de novo ou à partir d'un génome de référence). En général, un génome de bonne qualité est constitué d'un faible nombre de longs contigs, séparés donc par un faible nombre d'intervalles non couverts. Lorsque la distance d'intervalle entre deux contigs est connue, on peut créer un scaffold (échafaudage) en le remplissant avec des bases nucléotidiques inconnues ('N' dans le format FASTA).