Amebaブログの文書を用いた単語間関連度の算出
書誌事項
- タイトル別名
-
- Calculation of the degree of association between words using the document of the Ameba blog
説明
目的:<br>近年,検索補助に自然言語処理が使われ,人手を使わず自動で文章や単語の関連度を求める研究が多く行われている.<br>本研究では,WEBページから切り出した単語から単語間の関連度を求め,人手を使わず言語知識の自動獲得を目的とする.<br><br>方法:<br>クローラーを用いブログサイトAmebaのページを取得し,ブログから文書を抽出する.<br>AmebaのHTMLの書き方で本文だけを容易に取得できることが判明したのでクロール対象をAmebaに限定した.<br>文書を形態素解析システムSENを用い単語だけを抽出.<br>WEBページ間の共起単語数などを元にWEBページ間の関連度を算出.<br>WEBページと単語間の関連も求め,最終的に単語×単語テーブルを作成し,評価値を決め関連度の算出を行う.
収録刊行物
-
- 電気関係学会九州支部連合大会講演論文集
-
電気関係学会九州支部連合大会講演論文集 2012 (0), 116-116, 2012
電気・情報関係学会九州支部連合大会委員会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390001205665712128
-
- NII論文ID
- 130005479761
-
- データソース種別
-
- JaLC
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可