コンピューティング

解析パイプライン

  • タグカウントによる遺伝子発現解析: 革新的な転写物発現解析方法です。参照配列がなくても、全ゲノムにわたる同定・定量・アノテーションができます。
  • Small RNA: MIREAPはシーケンス深度、データ、miRNAの構造などの情報によりmiRNAの機能とそのターゲットを予測します。また、miRNA、rRNA、repeats、エキソン・イントロンを含む各sRNAの配列情報と発現量を検出可能です。
  • MAQ-fasta2bfa: MAQ (Mapping and Assembly with Qualities)はNGSにより得られた短リードのアセンブリに用いられます。MAQにてリードを参照配列にマッピングし、一致性を判明します。その後、組立ての段階で後方確率を最大化し、一致配列における各部位のphred quality scoreを計算し、ヘテロ接合体を検出します。

基礎データ解析

  • Peak Map Transfer: Phred リードDNAシーケンサートレースデータ(Phred read DNA sequencer trace data)を利用して塩基配列を読み出し、Quality Valueを決定します。出力ファイルにてこれらの解析結果を保存します。
  • Sequence Joint: phrapアセンブラを用い、Peak Map Transferにて取得した塩基配列とQuality Valueを組合わせます。シーケンス編集・組立結果ビューアーツールとして応用されています。
  • Basic Process: FASTAデータにて解析を行います。
  • Carrier Mask: 配列比較に応用される汎用プログラムcross_matchを用いて解析を行います。
  • Data Process: phdをFASTAファイルに変換するプログラムPhd2fastaにて、phrapとcross_matchに必要なFASTAデータを出力します。

 

遺伝子・ゲノムアノテーション

遺伝子予測:

  • GENSCAN-ヒト、他の脊椎動物、無脊椎動物、植物ゲノム解析ツールであり、遺伝子機能の同定に用いられています。 
  • BGF-Hidden Markov Modelであり、動的計画法(dynamic programming)に基づいたab initio遺伝子予測を行います。
  • TWINSCAN-新たな遺伝子構造予測プログラムとして、GENSCANより確率モデル数が多くなり、関連ゲノム配列間のホモロジーを解明することもできます。

反復配列解析:

  • RepeatMasker-散在反復配列と低複雑性配列の検出に応用されています。
  • TRF (Tandem Repeats Finder)-塩基配列上にある縦列反復配列を検出するツールです。。縦列反復配列とは、同じ配列が同じ向きに隣り合って存在することを指します。
  • 遺伝子アノテーション: InterPro-タンパク質のファミリー分類、 ドメイン、機能サイトに関する記述を集めた統合データベースです。

進化解析

  • KaKs Calculator: 非同義(Ka)と同義(Ks)置換の比を算出することにより、タンパク質コード領域における進化に関する情報を提供します。

シーケンスデータのアライメント

局所的なアライメント:

  • BLAST (Basic Local Alignment Search Tool)-配列間の局所的類似性の領域を検出するツールです。タンパク質配列をデータベースにマッピングすることにより、比較とマッピングの有意性分析を行います。
  • Blastpgp-レギュラーのgapped-blast検索を行うプログラムであり、PSI-BLASTモード或いはPHI-BLASTモードで反復性の検索を実現しました。検索結果から、関連遺伝子の特定ファミリーのPosition-Specific Scoring Matrix (PSSM)を構築可能です。
  • Blat-主に二種類のアライメントがあります。(1)DNAレベルにおいて、同一性が95%以上の配列のアライメントを行います。(2)転写物或いはタンパク質レベルにおいて、同一性が80%以上の配列のアライメントを行います。上記二種類のアライメントにより、ラージインサート(Large Insert)を検出可能です。
  • Genewise-Conceptual translationレベルにおいて、配列エラーとイントロンを考えずに遺伝子配列の比較を行うプログラムペッケージです。
  • Sim4-est,cDNA,mRNAの配列をゲノムにマッピングするツールです(ゲノムとマッピングする配列間に違いがほとんどない場合に有用)。
  • Exonerate-相同性検索とゲノム等への配列マッピングを行う統合プログラムです。
  • SSAHA2(Sequence Search and Alignment by Hashing Algorith)-迅速なDNAマッチングとアライメントを実現したアルゴリズムです。

 

網羅的なアライメント:

  • T_coffee参考配列を用いたマルチアライメントを行います。
  • ClustalW: 複数の塩基配列やアミノ酸配列をできるかぎり一致するように並べる(マルチプルアラインメント)ツールです。
  • Mummer: オープンソースソフトウェアパッケージ(Open Source Software Package)であり、長いDNA配列とアミノ酸配列のアライメントを行います。
  • Muscle: アミノ酸或いはヌクレオチド配列を対象としたマルチアライメントを行うプログラムです。

 

短配列のアライメント:

  • SOAP – SOAP aligner/soap2、短いDNA配列のアライメントに応用されるソフトです。

 

Process-Align結果解析:

  • Solar(Sorting Out Local Alignment Result)-BLAST、FASTA、SSEARCH、SSAHA、MUMMERとcross matchの結果を統合し、アライメントを行います。