Couverture (génétique)

From Wikipedia, the free encyclopedia

Un chevauchement du produit de trois analyses de séquençage, avec la profondeur de lecture à chaque point indiquée.

La couverture (ou la profondeur), en séquençage de l'ADN ou de l'ARN, est le nombre de lectures uniques qui incluent un nucléotide donné dans la séquence reconstruite. Elle est exprimée en X, représentant le nombre de lectures uniques pour une base nucléique. Le séquençage profond fait référence au concept général consistant à viser un nombre élevé de lectures uniques de chaque région d'une séquence.

Séquençage ultra-profond

Malgré les améliorations de précision des nouvelles techniques de séquençage à haut débit et que le pourcentage de fiabilité d'une séquence est de plus en plus élevé, il est toujours possible que des erreurs techniques de séquençage se produisent. Le très grand nombre de nucléotides dans le génome (3,4 milliards de paires de bases pour Homo sapiens) signifie que si un génome individuel n'est séquencé qu'une seule fois, il y aura tout de même un nombre important d'erreurs de séquençage. De plus, de nombreuses positions dans un génome contiennent de rares polymorphismes mononucléotidiques (SNP). Par conséquent, pour faire la distinction entre les erreurs de séquençage et les vrais SNP, il est nécessaire d'augmenter encore plus la précision du séquençage en séquençant des génomes individuels un grand nombre de fois de manière que chaque base soit lue le nombre de fois nécessaire pour que son identité soit fiable.

Ce nombre de lecture s'appelle donc la couverture (ou la profondeur) et représente le nombre de lectures uniques concernant un nucléotide donné dans la séquence reconstruite[1],[2]. Si une base est couverte par 30 séquences, elle aura donc une couverture (ou profondeur) de 30X.

Le séquençage profond (Deep Sequencing en anglais) fait référence au concept consistant à viser une couverture élevée pour obtenir une réponse fiable sur l'exactitude d'une séquence, d'une mutation ou d'un polymorphisme par exemple[3].

Le terme « ultra-profond » peut parfois également désigner une couverture plus élevée (> 100 fois), ce qui permet la détection de variants de séquence dans des populations mixtes[4],[5],[6] ou d'identifier des variants somatiques et les distinguer des variants germinaux[7]. À l'extrême, les approches de séquençage à erreur corrigée telles que le séquençage à profondeur maximale peuvent faire en sorte que la couverture d'une région donnée se rapproche du débit d'une machine de séquençage, permettant des couvertures de >10^8[8].

Séquençage du transcriptome

Le séquençage en profondeur des transcriptomes, également connu sous le nom de RNA-Seq, fournit à la fois la séquence et la fréquence des molécules d'ARN présentes à un moment donné dans un type de cellule, un tissu ou un organe spécifique[9]. Le comptage du nombre d'ARNm codés par des gènes individuels fournit une indication sur le niveau d'expression du gène donné. Ce niveau d'expression des transcrits est un indicateur du potentiel de codage des protéines, un contributeur majeur au phénotype[10]. L'amélioration des méthodes de séquençage de l'ARN est un domaine de recherche actif à la fois en termes de méthodes expérimentales et informatiques[11].

Calcul

Couverture physique

Références

Related Articles

Wikiwand AI