書誌事項
- タイトル別名
-
- Estimating an author’s gender using a random forest for offender profiling
- ランダムフォレスト ニ ヨル チョシャ ノ セイベツ スイテイ : ハンザイシャ プロファイリング ジツゲン ニ ムケタ ケントウ
この論文をさがす
抄録
<p> 犯人の早期検挙を目的とした捜査支援手法である犯罪者プロファイリングは,犯罪現場の状況などを統計的もしくは心理学的に分析し,犯人の性別や年齢層,職業などの犯人像を推定するものであるが,印字された文書や電子メールなどしか存在しない事件においては犯罪現場自体がないため,有効な手段が従来はなかった.本研究は,文章情報を基に,犯人像を推定する手法の開発の嚆矢として,まずブログを対象に,ランダムフォレストによる著者の性別推定を試みた.その結果によると,性別推定には,漢字や平仮名,片仮名,名詞の使用率,品詞(動詞・形容詞・助詞・感動詞)や接続助詞「し」,助動詞「なかっ」,読点,文字(代名詞「私」「僕」,小書き文字「っ」「ゃ」) の使用頻度が有効で,1個抜き交差確認法による検証の結果,最高で正解率86.0% (適合率:男性84.6%,女性87.5%) を得た.なお,サポートベクターマシンを用いた検証も合わせて実施したが,正解率は最高で 75.0%(適合率:男性69.2%,女性85.7%)と相対的に低い精度を示した.</p>
収録刊行物
-
- 情報知識学会誌
-
情報知識学会誌 27 (3), 261-274, 2017
情報知識学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390001204423207296
-
- NII論文ID
- 130006218937
-
- NII書誌ID
- AN10459774
-
- ISSN
- 18817661
- 09171436
-
- NDL書誌ID
- 028614710
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- NDL
- Crossref
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可