配列アセンブリング

From Wikipedia, the free encyclopedia

配列アセンブリング(はいれつアセンブリング)とは、バイオインフォマティクスにおいて短いDNAの断片から元の長い塩基配列を再構築することを指す。DNAシーケンシングでは用いる手法にもよるが一度に読める長さは20から1000残基にとどまるため、この技術はそれより長い塩基配列の決定には不可欠の技術である。

また、このようなアセンブリングを行うプログラムのことをアセンブラと呼ぶ。

初期のアセンブラは単純な配列アライメントのプログラムのようなもので、1980年代後半から1990年代前半にかけて登場し、自動DNAシーケンサーから出力されたDNAの断片配列を処理することが目的だった。シークエンスする対象がウイルスやプラスミドといった単純なものから真核生物のゲノムのといった複雑なものにまで拡大してきた過程で、アセンブラのプログラムもそれらを処理できるように改良を加えられ発達してきた。

現在のゲノムアセンブラは以下のような特徴を持つ。

  1. 数テラバイトの配列データを処理できる
  2. 反復配列などに対応している
  3. シーケンサーから出力された断片の読み取り誤りに対応している

ESTアセンブラ

新規アセンブルとマッピングによるアセンブル

DNAシークエンシング技術からの影響

Related Articles

Wikiwand AI