シュードノット
From Wikipedia, the free encyclopedia
シュードノットの構造形態は、コンテクスト依存性や塩基対形成領域の重複のため、計算生物学的手法による検出には適していない。シュードノット中の塩基対形成パターンは入れ子状になっておらず、このことが標準的な動的計画法によるRNA配列中のシュードノットの存在予測をより困難なものにしている。動的計画法では塩基対形成したステムを同定するために再帰的なスコアリングシステムが用いられるため、入れ子状になっていない塩基対はほとんど検出することができない。確率文脈自由文法といった新たな手法もシュードノットを同様の問題を抱えている。そのため、MfoldやPfoldといったよく用いられる二次構造予測手法ではクエリ配列中に存在するシュードノット構造を予測することはできず、2つのステムの内より安定なものだけが同定される。
動的計画法を用いて限られたクラスのシュードノットを同定することは可能であるが、これらの手法は網羅的ではなく、シュードノットを考慮しないアルゴリズムよりも配列長に応じた計算規模の増大が著しい[3][4]。シュードノットを含む最小自由エネルギー構造の予測はNP完全問題であることが示されている[5][6]。
生物学的意義
表記法
シュードノットは一次配列上でどのようにステムが交差するか、そして何度交差するかによって多数のタイプが存在する。この違いによって、シュードノットはH、K、L、M型へと分類されている[8]。冒頭の図で示されている単純なテロメラーゼP2b-P3は、H型のシュードノットである。
RNAの二次構造は通常ドットとブラケットによる表記がなされ、丸括弧 () はステムを形成する塩基対を、ドットはループを表す。しかし、シュードノットではステムが他のステムによって分断されているため、異なるステムを表すために他のブラケットまたは文字を用いた表記の拡張が必要である。そのような場合、ステムの開始には ([{<ABCDE 、終わりには edcba>}]) が外側から順番に用いられる[9]。2つの(わずかに異なる)テロメラーゼのアラインメントをこの表記法で示すと次のようになる。
(((.(((((........[[[[[[[[[))))).))). ...]]].]]]]]].
drawing 1 CGCGCGCUGUUUUUCUCGCUGACUUUCAGCGGGCGA---AAAAAAUGUCAGCU 50
ALIGN |.||||||||||||||||||||||||| .|.| |||||| ||||||.
1ymo 1 ---GGGCUGUUUUUCUCGCUGACUUUCAGC--CCCAAACAAAAAA-GUCAGCA 47
((((((........[[[[[[[[[)))) ))........]]].]]]]]].
テロメラーゼRNAのシュードノットに通常存在するUバルジが、シュードノットの安定性を増すために1ymoでは除かれている[10]。

