遺伝子変異データベース構築のための情報収集と抽出の現状

書誌事項

タイトル別名
  • a) Current Status to Construct Mutation View, A Database for Human Genome Variation and Phenotype(<Special Feature>Growing Expectation for Biomedical Natural Language Processing in the Post-genome Era : Current Topics of BioNLP)
  • イデンシ ヘンイ データベース コウチク ノ タメ ノ ジョウホウ シュウシュウ ト チュウシュツ ノ ゲンジョウ
  • 【特集】ポストゲノム時代に高まるバイオ自然言語処理への期待:バイオ自然言語処理最新事情 <2. バイオ研究者からのバイオNLPへの期待>

この論文をさがす

説明

遺伝子の変動性(疾患原因変異と多型)と表現型についてのデータベースMutationViewを構築してきた.現在,ゲノム塩基配列読み取りが完了して,さまざまな公的データベースが構築されて資材を提供していることもあり,Computerによる遺伝子構造データの自動作成は可能である.一方,疾患と変異の関わりをデータベース化するためには,変異の詳細以外にも,症状などの患者情報等多岐にわたる情報をデータとして構築することが必要となる.現状では,これらの情報は,主に発表済み論文から収集,抽出しているが,使用専門用語の冗長性や階層性などの問題に対処する必要性から,専ら研究者の手作業によって進めている.本稿では情報処理,計算機科学の専門家による支援の可能性を少しでも開くために,収集しているデータの種類,性質,情報元などを整理し,「手作業」の内容も分析してみたい.

収録刊行物

  • 情報処理

    情報処理 46 (2), 112-118, 2005-02-15

    情報処理学会

参考文献 (9)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ