既存知能を利用した小規模コーパスからの知識獲得

研究課題情報

体系的番号
JP09780308 (JGN)
助成事業
科学研究費助成事業
資金配分機関情報
日本学術振興会(JSPS)

科研費情報

研究課題/領域番号
09780308
研究種目
奨励研究(A)
配分区分
  • 補助金
審査区分/研究分野
  • 複合領域 > 情報科学 > 知能情報学
研究機関
  • 茨城大学
研究期間 (年度)
1997 〜 1998
研究課題ステータス
完了
配分額*注記
2,200,000 円 (直接経費: 2,200,000 円)

研究概要

本研究の目的は,小規模コーパスから言語処理に有用な知識を獲得することである.大規摸コーパスから有用な知識が得られることは解明されてきたが,実際に大規模コーパスを準備することは困難であり,小規模コーパスからどのように知識を抽出するかが現実的な問題としてある.本研究ではこの問題に対し,既存にある知識を併用することを試みている.基本的には既存の辞書やシソーラスが有用である.ただし,それらは人間が利用するために作られたものであり,機械処理には向いていない.そこでまず既存のシソーラス補強することを検討し,成果を論文誌に発表した. また研究を進めるにあたり,自然言語処理の様々な問題は語義選択問題に帰着されることがわかってきた.そこで,語義選択問題の中でも特に,応用が明確な文書校正に着目した研究を開始した.具体的には,同音異義語の誤り検出に対して決定リストの手法,平仮名列の誤り検出に対してN-gram手法といった統計的な手法を試みた.その結果,これらの誤り検出にもコーパスを利用した統計的な手法が効果的であることを確認した. さらに情報抽出で必要となる人名などの固有名詞抽出や複合語の単語分割にもコーパスからの規則抽出が有効であるので,既存知識として従来手法の規則ベースの手法を想定し,規則ベースの手法の誤りをコーパスから得られた知識を利用して修正することを試み,その有効性を確認した.

関連論文

もっと見る

関連研究データ

もっと見る

関連図書・雑誌

もっと見る

関連博士論文

もっと見る

関連プロジェクト

もっと見る

関連その他成果物

もっと見る

詳細情報 詳細情報について

ページトップへ