<論文・報告>感情分析における機械学習手法の比較検討
-
- 中井, 諒馬
- 立命館守山高等学校
この論文をさがす
説明
本研究ではKaggleの自然言語処理に関わるコンペティションの一つである『Toxic Comment Classification Challenge』において種々の機械学習アルゴリズムを比較することを目的とする. 本データセットは感情分析に関連するものであり, 感情分析とはテキストデータからテキストに含まれる感情を分析するタスクである. 本稿では機械学習を用いた感情分析の検討を行う. 具体的には, 感情分析をする際に1. 文章をベクトル化する, 2. ベクトル化したものを用いて分析を行うという二段階の方法を検討する. 1ではterm frequency-inverse documentfrequency(tf-idf)と呼ばれるBag of Words(BoW)に基づいた方法を用い, 2ではNaive Bayes Support Vector Machine(NBSVM)およびロジスティック回帰を用いた[1]. そして, これらの方法の組み合わせを比較検討した. またデータを別の言語に翻訳し元に戻すことで作られたデータの使用の有無でも比較した[2].
収録刊行物
-
- ELCAS Journal
-
ELCAS Journal 5 23-25, 2020-04
京都大学高大接続・入試センター
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050848249735216640
-
- NII論文ID
- 120006850451
-
- NII書誌ID
- AA12881685
-
- HANDLE
- 2433/251397
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- CiNii Articles