Datamining for Causal Analysis.

Bibliographic Information

Other Title
  • 要因分析のためのデータマイニング

Search this article

Description

大福帳システム、データベースからの仮説検証など、データベースを積極的にマーケティング戦略に利用していこうとする動きが、流通業を中心として盛んになっている。その中でも、データマイニングは、データベース中から未知の規則を発見できる、仮説生成型アプリケーションとして注目されている。現在、データマイニングの手法として知られているものを大別すると、以下のようになる。(1)クラス分類型:パターン認識や学習といわれているもので、クラスのわかっているサンプルデータを訓練例として、クラスを分類するための式、ルール、決定木等を生成するものである。ニューラルネットもここに入れられる。応用としては、顧客の信用調査、不正検出、ポートフォリオマネージメント等があげられる。(2)クラスタ分割型:属性間の距離などを規準にして、似かよっている属性を持つデータをグループ化するものであり、統計的クラスタリングや整数プログラミングの手法などが知られている。応用としては、顧客のプロトタイピング、バスケットアナリシス等があげあれる。(3)演繹データベース検索型:データベースから新しいパターンを導出し、これを数えあげることによって、そのパターンの有効性を検証する。応用としては、関連購買分析があげられる。(4)視覚化型:データをわかり易く表示し、対話的にデータの絞り込みなどの操作することによって、データ中の変数間の関係を明確化するものであり、基本的にルールの発見は人に任されている。これらの手法の中でも、演繹データベース検索型は、扱えるデータのサイズ、柔軟なパターン、および、解の完全性などの点で優れており、大規模データベースに対してもスケーラブルなアルゴリズムが開発されている。この手法は、直接的には流通業において、どの商品とどの商品が一緒に買われたかという関連購買分析に有効であることが知られているが、本稿では、これを一般の要因分析に応用することを示す。POSデータ等の大量の購買履歴と、その時間、場所的な背景データを同時に処理することによって、購買の要因のみならず、要因間の因果関係なども抽出することができるようになる。

Journal

Details 詳細情報について

Report a problem

Back to top