自然言語処理を利用した農産物関連テキストからの概念抽出―野菜商品レビューを対象事例として―

書誌事項

タイトル別名
  • Concept Extraction Methods for Agricultural Product–Related Texts Based on Natural Language Processing Techniques: A Case Study of Online Vegetable-Product Reviews

抄録

農産物関連の代表的なテキストデータであり,今後テキストマイニングの必要性が高まるであろうインターネット通販の野菜商品レビューを対象に,付属辞書を参照した形態素解析結果からレビュー内容を把握する際の問題点を明らかにした.付属辞書を参照した形態素解析では語の分割精度が低いこと,出現頻度が高い同義語が別語と扱われること,否定概念が欠落すること,形容詞の対象が不明確であることでテキストからの概念抽出精度が低くなると判断した.これらの問題解決のために,自然言語処理済みテキストから抽出すべき構文解析情報等を提案し,以下の概念抽出工程を提示した.1)解析対象に合致した参照辞書を構築して形態素解析を行う.2)構文解析後,動詞“する”は,その直前に出現する名詞と一語に集約し,具体的動作を示す動詞に変換する.3)否定概念を付与するために,助動詞“ぬ”,接頭辞“無”・“不”・“低”・“未”・“非”,接尾辞“ない”について語の変換,集約処理をする.4)同義語を正規化する.5)解析対象に合わせて係り受け関係の語を抽出する.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (5)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ