Répétitions dispersées

From Wikipedia, the free encyclopedia

Mécanisme général de duplication des séquences répétées. Les éléments autonomes (à gauche) codent une ou plusieurs enzymes permettant la réplication et l'intégration à un nouveau site dans l'ADN génomique. Les éléments non-autonomes (à droite) utilisent en trans les enzymes codées par des éléments autonomes situés ailleurs dans le génome.

Les répétitions dispersées sont des séquences d'ADN présentes dans le génome des organismes vivants et qui sont répétées à plusieurs endroits différents sur les chromosomes. Ces séquences, dont la longueur peut varier de plusieurs centaines à plusieurs milliers de nucléotides, correspondent à des éléments mobiles, capables de réplication autonome ou semi-autonome et qui sont donc susceptibles de produire des copies additionnelles qui vont s'intégrer à d'autres endroits dans le génome[1].

Les séquences répétées dispersées peuvent être rangées en plusieurs catégories, en fonction du mécanisme moléculaire qui conduit à leur duplication. Certaines répétitions sont répliquées par un mécanisme qui fait intervenir un intermédiaire ADN, c'est en particulier le cas des transposons à ADN. D'autres répétitions sont dupliquées par un mécanisme faisant intervenir un intermédiaire ARN qui est ensuite recopié en ADN. C'est le cas des rétrotransposons, des rétrovirus endogènes, des LINE et des SINE (éléments dispersés long et courts).

Certaines de ces séquences ou éléments répétés codent en leur sein les protéines qui sont nécessaires au processus de réplication et interviennent dans la synthèse de l'ADN et son insertion à un nouveau site. Ils sont qualifiés d'autonomes. D'autres sont partiellement ou totalement défectifs et soit dépendent des protéines fonctionnelles codées par les éléments autonomes, soit ont perdu toute capacité à se répliquer. On parle alors d'éléments répétés non-autonomes ou fossiles.

Rétroéléments sans LTR

Il en existe trois principales classes

Les rétroéléments sans LTR sont des séquences répétées qui se répliquent par transcription inverse d'un intermédiaire ARN. Dans le génome, ils sont précédés d'un promoteur qui permet la transcription de cet ARN qui est polyadénylé en 3' par la machinerie cellulaire, comme un ARN messager.

L'ARN ainsi transcrit code en général pour deux activités, une endonucléase à ADN, qui va cliver un seul des deux brins du duplex d'ADN de la séquence cible où le rétrotransposon va s'insérer, et une transcriptase inverse qui effectue la copie de l'ARN en ADN. Dans le cas des séquences LINE L1 des mammifères, les deux activités, endonucléase et transcriptase inverse, sont codées par le même polypeptide[2]. Les sites reconnus par l'endonucléase se situent préférentiellement dans des régions riches en A et T, au niveau de séquences de type :

5'TTAAAA3'
3'AATTTT5'

Elle clive l'ADN dans le brin du bas, entre les A et les T en libérant une extrémité 3'-hydroxyle[2]. La série de T peut alors s'apparier avec la queue poly(A) de l'ARN, ce qui permet à une transcriptase inverse également codée par le LINE de l'utiliser comme amorce pour synthétiser une copie ADN qui sera finalement insérée au site de clivage de l'endonucléase.

Rétroéléments à LTR

Transposons à ADN


Répétitions dispersées dans le génome humain

Notes et références

Articles connexes

Related Articles

Wikiwand AI