絵本のテキストを対象とした形態素解析

書誌事項

タイトル別名
  • Japanese Morphological Analysis of Picture Books
  • エホン ノ テキスト オ タイショウ ト シタ ケイタイソ カイセキ

この論文をさがす

抄録

これまで,主に新聞などのテキストを対象とした解析では,形態素解析器を始めとして高い解析精度が達成されている.しかし分野の異なるテキストに対しては,既存の解析モデルで,必ずしも高い解析精度を得られるわけではない.そこで本稿では,既存の言語資源を対象分野の特徴にあわせて自動的に変換する手法を提案する.本稿では,絵本を解析対象とし,既存の言語資源を絵本の特徴にあわせて自動的に変換し,学習に用いることで相当な精度向上が可能であることを示す.学習には既存の形態素解析器の学習機能を用いる.さらに,絵本自体にアノテーションしたデータを学習に用いる実験を行い,提案手法で得られる効果は,絵本自体への約 11,000 行,90,000 形態素のアノテーションと同程度であることを示す.また,同じ絵本の一部を学習データに追加する場合と,それ以外の場合について,学習曲線や誤り内容の変化を調査し,効果的なアノテーション方法を示す.考察では,絵本の対象年齢と解析精度の関係や,解析精度が向上しにくい語の分析を行い,更なる改良案を示す.また,絵本以外への適用可能性についても考察する.

収録刊行物

  • 自然言語処理

    自然言語処理 21 (3), 515-539, 2014

    一般社団法人 言語処理学会

被引用文献 (3)*注記

もっと見る

参考文献 (4)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ