長鎖散在反復配列
From Wikipedia, the free encyclopedia

長鎖散在反復配列(ちょうささんざいはんぷくはいれつ、英: long interspersed nuclear element, LINE)とは、非LTR型レトロトランスポゾンの一群である。多くの真核生物のゲノムに広く見られ[1][2]、ヒトゲノムでは全体のおよそ21.1%を占める[3][4][5]。それぞれの長さはおおよそ7000塩基対程度である。mRNAへ転写されたのち、逆転写酵素活性を持つタンパク質へと翻訳される。この逆転写酵素によりLINE RNAからコピーされたDNAのゲノム上における新しいサイトへの組み込みが可能となる。
ヒトゲノムにおいて多量にみられるのはLINE1だけである。ヒトゲノム上には、切り詰められたもので100000個の、完全な長さを持つもので4000個のLINE1要素が存在する[6]。多くのLINE配列は、ランダム変異の蓄積によりもはや転写および翻訳が起こらないほど劣化している。LINE DNA配列の比較により、ゲノムへのトランスポゾンの挿入時期を推定できる。
J. Adams et al. 1980により、およそ6.4 kb長のLINE由来配列が初めて記載された[7]。
分類
鍵となる逆転写酵素 (RT) の構造的特徴と系統に基づき、L1、RTE、R2、I、Jockeyの5つの主要なグループに分類され、さらにすくなくとも28個の下位分類がある[8]。
植物ゲノムでは、これまでのところ、L1およびRTEに分類されるLINEのみが報告されている[9][10][11]。L1型はいくつかのグループに下位分類されるが、RTE型LINEは保存性が高く、多くの場合単一のファミリーを構成する[12][13]。
菌類では、Tad、L1、CRE、Deceiver、Inkcapといった要素が同定されており[14]、Tad類似要素は真菌のゲノムにのみ見られる[15]。
すべてのLINEは少なくとも1つのタンパク質、ORF2をコードする。ORF2 はRTドメインとエンドヌクレアーゼ (EN) ドメインをあわせもち、EN領域はN末端APEおよびC末端RLEのどちらかもしくはまれに両方の活性をもつ。リボヌクレアーゼHドメインが存在することもある。進化的に古いR2およびRTEスーパーファミリーを除いて、LINEは通常ORF1と呼ばれる別のタンパク質をコードする。ORF1はGag-knuckle型ジンクフィンガー、L1-like RRM[訳語疑問点] (InterPro: IPR035300)、エステラーゼのいずれかもしくはすべてを持つ。植物、真菌、昆虫においてはLTRレトロトランスポゾン と比べてLINEの頻度は低いが、脊椎動物においては頻度が高く、特に哺乳動物においてはゲノムの約20%を占める[8]。
LINE1
LINE1(L1 要素)は、現生のヒトゲノムにおいてもいまだ活動的な要素の1つであり、オオコウモリを除くすべての哺乳類に見られる[16][17]。
その他
L2およびL3要素は、ヒトゲノムに痕跡のみを残しており[5]、これらが活動的だったのはおよそ2〜3億年前と推定される。L1要素とは異なり、L2要素には隣接する標的部位重複がみられない[18]。L2およびL3要素は共にCR1クレード Jockeyに分類される[19]。
頻度
ヒト
最初のドラフト版ヒトゲノムでは、ヒトゲノムに占めるLINEの割合は21%、コピー数は85万だった。この内訳はL1、L2、L3要素がそれぞれ51万6千、31万5千、3万7千であった。L1要素に依存して増殖する非自律的レトロトランスポゾンであるSINEは、ヒトゲノムの13%を占め、およそ150万のコピー数を持つ[5]。SINEの起源はRTEに分類されるLINEに由来することが推定されている[20]。最近の推定では、典型的な人間のゲノムには潜在的に可動性のあるL1要素が平均100個含まれるとされるが、分散が大きく多数の活動的L1要素を持ち、L1誘引変異導入の可能性が高い個体も存在する[21]。
L1のコピー数の増加は統合失調症患者の脳にも見られ、LINEがいくつかの神経疾患に役割を果たす可能性を示唆している[22]。

伝播
LINE は、標的プライム逆転写 (TPRT) と呼ばれる機構により伝播する。この機構は、カイコにおける R2 RNA要素について初めて記載された。
ORF2(および存在する場合はORF1)タンパク質は、それらをコードするmRNAと主にcis会合し、おそらく2つのORF2と未知の個数のORF1トライマーからなるリボ核タンパク質 (RNP) 複合体を形成する[23]。複合体は核に戻され、そこでORF2のエンドヌクレアーゼドメインにより(哺乳類ではTTAAAAヘキサヌクレオチドモチーフにおいて)DNAが開裂する[24]。そして3′OHグループが逆転写酵素に対して開放され、LINE RNA転写物の逆転写開始が可能となる。逆転写後、標的鎖が切断され、新しく作成されたcDNAが組み込まれる[25]。
新たな挿入により短い標的部位重複[訳語疑問点]が形成される。また、新たな挿入配列の大部分は5′が大幅に(ヒトにおける平均挿入サイズは 900bp)切り詰められ、しばしば逆転している(Szak et al., 2002)。5′UTRを欠くため、新しい挿入配列のほとんどは機能しない。