文書ストリームにおける語のバーストと共起ネットワークにおけるクラスタ構造の関係について

書誌事項

タイトル別名
  • ブンショ ストリーム ニ オケル ゴ ノ バースト ト キョウキ ネットワーク ニ オケル クラスタ コウゾウ ノ カンケイ ニ ツイテ
  • On the Relationship between Word Bursts in Document Streams and Clusters in Lexical Co-occurrence Networks

この論文をさがす

抄録

文書に現れる語をノードとし,出現位置が近接しているものどうしをリンクで結び付けることにより得られる共起ネットワークでは,意味的関連性を有する語どうしがクラスタ構造と呼ばれる稠密な相互のつながりを形成している.本論文では,時間経過にともない文書が生成されていく,いわゆる文書ストリームから共起ネットワークを構成し,そこでクラスタ構造が生成される様子を調べた.その結果,共起ネットワークを(相対的に)古い語彙からなる部分と新しい語彙からなる部分に分けたとき,後者において,クラスタの出現という構造上の変化が,実社会の出来事などに起因する語の出現頻度の増大(バースト)に関連していることが明らかになった.

In word co-occurrence networks, where two words appearing close to each other in documents are connected by a link, a group of relevant words forms a densely connected subnetwork called a cluster. In this paper, we analyze the process of emergence of the structure in co-occurrence networks generated from document streams. The analysis reveals that, if we restrict our scope to the subnetwork mostly consisting of (relatively) new words, we can associate emergence of the structure with the increase of word occurrence rate (bursts) that arises from real world events.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (22)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ