Bio-Medical Text Mining by Hitachi, Ltd.

Bibliographic Information

Other Title
  • テキストマイニング  日立製作所が提案する医薬向けテキストマイニング
  • ヒタチ セイサクショ ガ テイアン スル イヤク ムケ テキストマイニング

Search this article

Description

日立製作所が提供するテキストマイニングの主要な3つの要素について紹介する。ひとつは, 公共データベースなどから収集したシノニムを豊富に持つ名称辞書である。2つめは, テキストに出現するタームの頻度を統計的に処理して, テキスト間類似度を評価したり, テキストから重要なキーワードを自動的に抽出する統計的自然言語処理である。3つめは, テキスト中から, 辞書に登録されているタームを網羅的に検出し, あらかじめ登録しておいた文型テンプレートに合致する記述を抽出することで, 関係する2つのタームと関係の種類を抽出する情報抽出である。

Journal

Keywords

Details 詳細情報について

Report a problem

Back to top