HMMによる日本語形態素解析システムのパラメータ学習

  • 竹内 孔一
    奈良先端科学技術大学院大学 情報科学研究科
  • 松本 裕治
    奈良先端科学技術大学院大学 情報科学研究科

書誌事項

タイトル別名
  • Learning Parameters of Japanease Morphological Analyzer based-on Hidden Markov Model

この論文をさがす

抄録

日本語の形態素解析は自然言語処理を行なう上で最も基本的でかつ重要な処理である。我々の研究室で開発している形態素解析システムJUMANは、品詞の連接と単語に対してコストによる制約を与えることで曖昧性の絞り込みを行なっている。コスト値はJUMANの品質に大きな影響を与えるにも関わらず、人手で付与されるため最適化する機構は存在しなかった。そこで、本研究では、英語のタグづけなどで効果を発揮しているHMM(Hidden Markov Model)を用いて、コーパスによる学習を行なうことでJUMANのコスト値、すなわちパラメータの最適化を行なう。HMM学習の結果、現在のJUMANの解析精度を改善する結果が得られた。

収録刊行物

被引用文献 (11)*注記

もっと見る

参考文献 (6)*注記

もっと見る

詳細情報

  • CRID
    1571980077130651392
  • NII論文ID
    110002935039
  • NII書誌ID
    AN10115061
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ