-
- 江藤 正己
- 慶應義塾大学大学院文学研究科
書誌事項
- タイトル別名
-
- Multivalued co-citation measure based on semantic distance between co-cited papers in a citing paper
- A case study focused on enumeration of citations
- 列挙形式の引用を例として
この論文をさがす
説明
【目的】類似論文検索の代表的な手法の一つに共引用の関係を利用するものがある。この手法では,「引用論文の本文とは無関係に,一つの引用論文から引用された被引用論文間の類似度は全て同じ」ことが仮定され,「共引用関係にある」「共引用関係にない」の2値情報を基に類似度が算出される。しかし,引用論文の本文を解析して被引用論文間の関係を詳細にとらえることで,共引用関係を多値化し,類似度の算出をより精密にできると考えられる。本稿では,引用箇所間の意味的な近さに基づいて共引用を多値化する手法を提案し,その可能性と有用性について検討する。【方法】提案手法を成立させる仮説「引用箇所間が意味的に近ければ共引用関係が強く,引用箇所間が意味的に遠ければ共引用関係は弱い」の検証をおこなった。大規模論文集合への適用を想定し,引用箇所間の意味的な近さを引用箇所の位置関係や引用文章中の語の共起関係によってとらえる方法を採用した。そして,この二つの関係が最も強いものとして,列挙形式の引用(一つの引用で同時に複数の論文を並列列挙する形式をとる引用)による共引用に着目した。仮説の検証はこれを用い,列挙形式で引用された論文間の類似度とその他の形式で引用された論文間の類似度とを比較する実験によりおこなった。【結果】列挙形式で引用された被引用論文間の類似度は,それ以外の形式で引用された被引用論文間の類似度よりも高い値になった。このことにより,提案手法の可能性と有用性が検証された。したがって,本文を解析して共引用を多値化することで,類似度の算出をより精密にできることが明らかになった。また,提案手法が大規模論文集合へ適用可能なことも確認できた。
収録刊行物
-
- Library and Information Science
-
Library and Information Science 58 49-67, 2007-12-31
三田図書館・情報学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390572244931945984
-
- ISSN
- 03734447
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- Crossref
- OpenAIRE
-
- 抄録ライセンスフラグ
- 使用不可