リンクに基づく分類のためのネットワーク構造を用いた属性生成

書誌事項

タイトル別名
  • リンク ニ モトズク ブンルイ ノ タメ ノ ネットワーク コウゾウ オ モチイタ ゾクセイ セイセイ
  • Generating Social Network Features for Link-based Classification
  • データマイニング

この論文をさがす

抄録

近年,ネットワーク構造を持つデータを用いて学習や予測を行うためのさまざまな研究が行われている.ソーシャルネットワークや遺伝子のネットワークなど,ネットワーク構造を持つデータは多く,ネットワークからのデータマイニングは一般にリンクマイニングと呼ばれる.その中でも,リンクが張られている近傍ノードの情報も利用しながらノードの分類を行うタスクは「リンクに基づく分類」(link-based classification)と呼ばれ,その精度を上げるためにネットワーク構造を用いたさまざまな指標が考案されている.一方,これまで社会ネットワーク分析や複雑ネットワークの分野ではネットワークを評価する指標として,中心性,構造空隙,クラスタ係数などがよく用いられた.本稿では,この2 つの研究の流れに注目し,従来から用いられてきた指標の生成を可能とするオペレータを定義し,リンクに基づく分類に適用する.論文のネットワークとソーシャルネットワークという2 種類のデータに適用し,従来から用いられてきた指標の重要性を明らかにするとともに,未知の指標の可能性についても議論する.

There have been numerous attempts at the aggregation of attributes for relational data mining. Recently, an increasing number of studies have been undertaken to process social network data, partly because of the fact that so much social network data has become available. Among the various tasks in link mining, a popular task is link-based classification, by which samples are classified using the relations or links that are present among them. On the other hand, we sometimes employ traditional analytical methods in the field of social network analysis using e.g., centrality measures, structural holes, and network clustering. Through this study, we seek to bridge the gap between the aggregated features from the network data and traditional indices used in social network analysis. The notable feature of our algorithm is the ability to invent several indices that are well studied in sociology. We first define general operators that are applicable to an adjacent network. Then the combinations of the operators generate new features, some of which correspond to traditional indices, and others which are considered to be new. We apply our method for classification to two different datasets, thereby demonstrating the effectiveness of our approach.

収録刊行物

被引用文献 (2)*注記

もっと見る

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ