データマイニングとは
大量に蓄積した販売データや顧客データを基に
統計処理を行い経営資料を得る方法。
データマイニングの手順
| 既存データベース |
| 販売データ |
| 調査データ |
| データ蓄積 (データウェアハウス) |
| 統計手法の活用 |
| 仮説の検証 |
| 解決策の立案 |
図 1 アンケート具体例(サンプル数676、複数回答)
「中華料理店人気調査」
| 店名 | 食べて見たい | 食べたことがある | おいしい | 店が近い | 見た目が良い | |
| 1 | 自店 | 98 | 289 | 132 | 201 | 84 |
| 2 | 珍来 | 85 | 210 | 152 | 166 | 55 |
| 3 | 北京飯店 | 67 | 254 | 121 | 198 | 31 |
| 4 | 白星 | 64 | 198 | 132 | 156 | 37 |
| 5 | 永楽 | 59 | 180 | 113 | 132 | 65 |
| 6 | バーミヤン | 59 | 220 | 121 | 157 | 19 |
| 7 | 来来軒 | 55 | 178 | 108 | 124 | 21 |
| 8 | ラーメン亭 | 58 | 226 | 156 | 102 | 18 |
| 9 | ジョナサン | 48 | 109 | 121 | 164 | 31 |
| 10 | 王将 | 49 | 192 | 103 | 126 | 18 |
| 11 | 喜多見ラーメン | 44 | 195 | 101 | 130 | 14 |
| 12 | 油麺亭 | 36 | 143 | 98 | 137 | 22 |
| 13 | かかし亭 | 35 | 123 | 93 | 100 | 15 |
図 2 相関分析表
| 食べてみたい | 食べた事がある | おいしい | 店が近い | 見た目が良い | |
| 食べてみたい | 1 | 0.69021 | 0.58101 | 0.76627 | 0.80956 |
| 食べた事がある | 0.69021 | 1 | 1.12643 | 0.89706 | 0.53493 |
| おいしい | 0.58101 | 0.02643 | 1 | 0.17655 | 0.31143 |
| 店が近い | 0.76627 | 0.89706 | 0.17655 | 1 | 0.61613 |
| 見た目が良い | 0.80956 | 0.53493 | 1.31143 | 0.61613 | 1 |
「図 1」は来店客を対象にアンケートを集計した表で、この数値を基に
アンケート項目間の強さを分析します。
「図 2」の相関分析表は数値が「1」に近いほどアンケート項目間の関係
が深くなります(アンダーバーの数値枠)。(相関が高い)
逆に数値が「0」に近いほど関係が薄いという事になります。
この事から
@「食べてみたい」と「食べた事がある」との関係は比較的強い、つまり
一度食べた人はこれからも食べる可能性が高いということです。
A「食べてみたい」と関係が深いのは「店が近い」と「見た目が良い」の二つ。
B「食べた事がある」と「おいしい」はほとんど関係ありません。
「食べた事がある」人が必ずしも「おいしい」と思っているとは限らないのは
当然としても、その逆も成立しています。つまり「おいしい」と思っているから
「食べに来ている」とは限らないという事です。
次に「食べてもらいたい」を構成する要因として大きなものは何かと分析したものが
「図 3」の「偏相関分析表」です。
図 3 偏相関分析表
| 食べてみたい | 食べた事がある | おいしい | 店が近い | 見た目が良い | |
| 食べてみたい | -1 | 0.43616 | 0.7933 | 0.18164 | 0.73635 |
| 食べた事がある | 0.43616 | -1 | -0.51083 | 0.68407 | -0.30246 |
| おいしい | 0.7933 | -0.51083 | -1 | 0.00535 | -0.47769 |
| 店が近い | 0.18164 | 0.68407 | 0.00535 | -1 | 0.05047 |
| 見た目が良い | 0.773635 | -0.30246 | -0.47769 | 0.05047 | -1 |
ここでも「1」に近い数値をもつ項目を見ると「おいしい」と「見た目が良い」の
二つです。「おいしい」の中には「過去に食べた事があっておいしかった」とか
「おいしいと評判だ」「おいしいような気がする」といった気持ちも含まれています。
この事から
@「食べてみたい」気持ちの大きな要因(貢献度)は「おいしい」と「見た目が良い」
の二つだけということです。
A「近くにある」という要因はほとんど関係ないということです。
以上が「データマイニング」の概要です。