タンパク質立体構造の配列および原子間距離による分類と非冗長化されたPDB代表タンパク質チェインデータベース(PDB-REPRDB)の作成

書誌事項

タイトル別名
  • The classification of protein structures based on the sequential and structural similarity, and the database of representative protein chains (PDB-REPRDB)

この論文をさがす

説明

タンパク質立体構造データベース(PDB)は、近年のX線結晶回折やNMRによる構造解析技術の進歩により、その内容は現在7500エントリー(3.4Gbytes)を越え、今後もさらに増え続けると予想されている。しかしながら、冗長性やデータの不完全性のためにPDB全てのエントリーがタンパク質の立体構造の解析に適しているとは言えず、何らかの基準でタンパク質立体構造を分類し、代表タンパク質を決定する必要がある。タンパク質立体構造データの分類は、立体構造の取扱いの困難さとそれに基づく分類に膨大な計算が必要なため、近似的に配列の相同性(ID%)を指標にして行われてきた。我々は、従来のID%による分類に、タンパク質分子を重ね合わせた時の原子間距離の最大値(Dmax)を分類の指標として加え、より正確な分類を可能にした。本論文では、本手法をMPIライブラリを用いて並列化し、新しい分類指標の追加に伴う計算量増加の問題を解決した。本研究で実装した並列版では、従来の約110倍の高速化を実現し、およそ1週間を必要をしていた代表タンパク質決定処理を約1.5時間で実できるようになった。我々は、本手法を用い、様々なID%とDmaxの値の組合せでPDBのチェインを分類し、代表を決定した"PDB代表タンパク質チェインデータベース(PDB-REPRDB)"を作成した。本データベースをWWWで公開し、既に世界から2100回以上アクセスされている。

収録刊行物

参考文献 (12)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1571980077129537792
  • NII論文ID
    110002936322
  • NII書誌ID
    AN10505667
  • ISSN
    09196072
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ