確率的TF-IDFを用いた特徴語抽出と文書検索
この論文をさがす
説明
本研究では単語頻度と文書頻度により単語に重みを与えるTF-IDFを単語の出現確率P(x)を用いて推定し、この確率的TF-IDFを用いて特徴語抽出とTwitterなどの短文検索に利用できるかを検証する。この検証により、Twitterなどの文書数の変動が激しいデータに対して、(文書数を数えることなく)単語に重みを与え検索することが可能になる。
収録刊行物
-
- 第80回全国大会講演論文集
-
第80回全国大会講演論文集 2018 (1), 297-298, 2018-03-13
情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050574047123418112
-
- NII論文ID
- 170000177151
-
- NII書誌ID
- AN00349328
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles