HHMM変換を用いた左非循環PCFGの高速推論

書誌事項

タイトル別名
  • Efficient Inference of Left Acyclic PCFG Using HHMM Transformation

この論文をさがす

抄録

確率的文脈自由文法(PCFG)は,系列データの統語構造を推定する機械学習モデルであり,自然言語処理をはじめとしてプラン認識やアクセスログ解析など広範な分野で利用されている.しかし,PCFGの代表的な推論アルゴリズムであるInside-outside algorithmは,計算量が系列長に対して3乗のオーダであり,長い系列を含むデータセットの解析は現実的でないという問題がある.本研究では,PCFGを定義する文法が左非循環文法(Left Acyclic Grammar; LAG)と呼ぶ制約を満たすことを条件として,PCFGを階層型隠れマルコフモデル(Hierarchical Hidden Markov Model; HHMM)に等価変換することにより,線形時間で等価なPCFGの推論を行う手法を提案する.実験により,提案手法によってInside-outside algorithmと等価な事後確率分布の推論が可能であることを確認し,特に長い系列を含むデータセットにおいて大幅な高速化が可能になることを示す.

Probabilistic Context Free Grammar (PCFG) is a machine learning model for estimating latent syntactic structures of sequence data, which has a wide application area such as natural language processing, plan recognition and log analysis. However, the standard inference method for PCFGs, inside-outside algorithm, has cubic-time complexity for input sequence that makes it impractical to apply to long sequence data. In this study, we propose a linear-time inference method for PCFGs by using equivalent transformation into Hierarchical Hidden Markov Model (HHMM) under a condition of grammar named Left Acyclic Grammar (LAG). We give the experimental results that demonstrate our proposal method estimates exactly identical posterior distribution with inside-outside algorithm does, and show the execution time is dramatically improved especially for long sequence data.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050282812882466944
  • NII論文ID
    110009886571
  • NII書誌ID
    AA11464847
  • ISSN
    18827799
  • Web Site
    http://id.nii.ac.jp/1001/00141539/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ