<論文・報告>感情分析における機械学習手法の比較検討

機関リポジトリ (HANDLE) オープンアクセス

この論文をさがす

説明

本研究ではKaggleの自然言語処理に関わるコンペティションの一つである『Toxic Comment Classification Challenge』において種々の機械学習アルゴリズムを比較することを目的とする. 本データセットは感情分析に関連するものであり, 感情分析とはテキストデータからテキストに含まれる感情を分析するタスクである. 本稿では機械学習を用いた感情分析の検討を行う. 具体的には, 感情分析をする際に1. 文章をベクトル化する, 2. ベクトル化したものを用いて分析を行うという二段階の方法を検討する. 1ではterm frequency-inverse documentfrequency(tf-idf)と呼ばれるBag of Words(BoW)に基づいた方法を用い, 2ではNaive Bayes Support Vector Machine(NBSVM)およびロジスティック回帰を用いた[1]. そして, これらの方法の組み合わせを比較検討した. またデータを別の言語に翻訳し元に戻すことで作られたデータの使用の有無でも比較した[2].

収録刊行物

  • ELCAS Journal

    ELCAS Journal 5 23-25, 2020-04

    京都大学高大接続・入試センター

詳細情報 詳細情報について

  • CRID
    1050848249735216640
  • NII論文ID
    120006850451
  • NII書誌ID
    AA12881685
  • HANDLE
    2433/251397
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ