DDBJ Read Annotation Pipeline : 新型シーケンサ由来配列のクラウド型パイプライン

長崎 英樹, 望月 孝子, 神沼 英里, 渡邊 成樹, 児玉 悠一, 猿橋 智, 菅原 秀明, 高木 利久, 大久保 公策, 中村 保一

doi:10.14841/jspp.2011.0.0828.0

書誌事項

タイトル別名

DDBJ Read Annotation Pipeline: A cloud computing based pipeline for high-throughput analysis of new generation sequencing data

説明

国立遺伝学研究所日本DNAデータバンク(以下DDBJ)では、新型シーケンサからの出力データをアーカイブするため、DDBJ Sequence Read Archive(DRA)を運営している。新型シーケンサの配列は個々のリード長が短いこと、リード数が膨大なことから、解析に大規模なコンピュータシステムや解析の為のスキルが要求される。そこでDDBJでは、大規模配列処理にクラウド型で計算機資源を利用する方法を提案しており、その一環として、新型シーケンサ配列を解析するクラウド型解析パイプライン DDBJ Read Annotation Pipeline(http://p.ddbj.nig.ac.jp/)を開発している。 パイプラインの特徴を以下に挙げる。 1) 様々な新型シーケンサ(illumina, Roche/454, Life Techonology)に対応した 解析ツールが利用可能である。 2) 結果を統一ファイル形式に変換して、ベースコールの平均クオリティスコアや参照配列被覆率(coverage)、アライメント深度(depth)等の標準的な統計量を計算する。 3) ウェブアプリケーションの遠隔操作で、国立遺伝学研究所スーパーコンピュータのPCクラスタを利用したクラウド解析を行うことが出来る。 本発表ではパイプラインの最新機能を紹介する。

収録刊行物

日本植物生理学会年会およびシンポジウム　講演要旨集

日本植物生理学会年会およびシンポジウム　講演要旨集 2011 (0), 0828-0828, 2011

日本植物生理学会

詳細情報詳細情報について

CRID: 1390282680612736896

NII論文ID: 130006998625

DOI: 10.14841/jspp.2011.0.0828.0

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘