データマイニングとは
大量に蓄積した販売データや顧客データを基に
統計処理を行い経営資料を得る方法。

データマイニングの手順

既存データベース
販売データ
調査データ
↓ 
データ蓄積
(データウェアハウス)

統計手法の活用

仮説の検証
解決策の立案


図 1    アンケート具体例(サンプル数676、複数回答)
          「中華料理店人気調査」

店名 食べて見たい 食べたことがある おいしい 店が近い 見た目が良い
1 自店 98 289 132 201 84
2 珍来 85 210 152 166 55
3 北京飯店 67 254 121 198 31
4 白星 64 198 132 156 37
5 永楽 59 180 113 132 65
6 バーミヤン 59 220 121 157 19
7 来来軒 55 178 108 124 21
8 ラーメン亭 58 226 156 102 18
9 ジョナサン 48 109 121 164 31
10 王将 49 192 103 126 18
11 喜多見ラーメン 44 195 101 130 14
12 油麺亭 36 143 98 137 22
13 かかし亭 35 123 93 100 15

図 2    相関分析表

食べてみたい 食べた事がある おいしい 店が近い 見た目が良い
食べてみたい 1 0.69021 0.58101 0.76627 0.80956
食べた事がある 0.69021 1 1.12643 0.89706 0.53493
おいしい 0.58101 0.02643 1 0.17655 0.31143
店が近い 0.76627 0.89706 0.17655 1 0.61613
見た目が良い 0.80956 0.53493 1.31143 0.61613 1

「図 1」は来店客を対象にアンケートを集計した表で、この数値を基に
アンケート項目間の強さを分析します。
「図 2」の相関分析表は数値が「1」に近いほどアンケート項目間の関係
が深くなります(アンダーバーの数値枠)。(相関が高い)
逆に数値が「0」に近いほど関係が薄いという事になります。
この事から
@「食べてみたい」と「食べた事がある」との関係は比較的強い、つまり
一度食べた人はこれからも食べる可能性が高いということです。
A「食べてみたい」と関係が深いのは「店が近い」と「見た目が良い」の二つ。
B「食べた事がある」と「おいしい」はほとんど関係ありません。
 「食べた事がある」人が必ずしも「おいしい」と思っているとは限らないのは
 当然としても、その逆も成立しています。つまり「おいしい」と思っているから
 「食べに来ている」とは限らないという事です。
次に「食べてもらいたい」を構成する要因として大きなものは何かと分析したものが
「図 3」の「偏相関分析表」です。

図 3  偏相関分析表

食べてみたい  食べた事がある  おいしい    店が近い   見た目が良い  
食べてみたい -1 0.43616 0.7933 0.18164 0.73635
食べた事がある 0.43616 -1 -0.51083 0.68407 -0.30246
おいしい 0.7933 -0.51083 -1 0.00535 -0.47769
店が近い 0.18164 0.68407 0.00535 -1 0.05047
見た目が良い 0.773635 -0.30246 -0.47769 0.05047 -1

ここでも「1」に近い数値をもつ項目を見ると「おいしい」と「見た目が良い」の
二つです。「おいしい」の中には「過去に食べた事があっておいしかった」とか
「おいしいと評判だ」「おいしいような気がする」といった気持ちも含まれています。
この事から
@「食べてみたい」気持ちの大きな要因(貢献度)は「おいしい」と「見た目が良い」
 の二つだけということです。
A「近くにある」という要因はほとんど関係ないということです。

以上が「データマイニング」の概要です。


back