データマイニング

データマイニングとは
大量に蓄積した販売データや顧客データを基に
統計処理を行い経営資料を得る方法。

データマイニングの手順

既存データベース

販売データ

調査データ

↓　

データ蓄積
（データウェアハウス）

↓

統計手法の活用

↓

仮説の検証

解決策の立案

図　１　　　　アンケート具体例（サンプル数６７６、複数回答）
　　　　　　　　　　「中華料理店人気調査」

	店名	食べて見たい	食べたことがある	おいしい	店が近い	見た目が良い
1	自店	98	289	132	201	84
2	珍来	85	210	152	166	55
3	北京飯店	67	254	121	198	31
4	白星	64	198	132	156	37
5	永楽	59	180	113	132	65
6	バーミヤン	59	220	121	157	19
7	来来軒	55	178	108	124	21
8	ラーメン亭	58	226	156	102	18
9	ジョナサン	48	109	121	164	31
10	王将	49	192	103	126	18
11	喜多見ラーメン	44	195	101	130	14
12	油麺亭	36	143	98	137	22
13	かかし亭	35	123	93	100	15

図　２　　　相関分析表

	食べてみたい	食べた事がある	おいしい	店が近い	見た目が良い
食べてみたい	1	0.69021	0.58101	0.76627	0.80956
食べた事がある	0.69021	1	1.12643	0.89706	0.53493
おいしい	0.58101	0.02643	1	0.17655	0.31143
店が近い	0.76627	0.89706	0.17655	1	0.61613
見た目が良い	0.80956	0.53493	1.31143	0.61613	1

「図　１」は来店客を対象にアンケートを集計した表で、この数値を基に
アンケート項目間の強さを分析します。
「図　２」の相関分析表は数値が「１」に近いほどアンケート項目間の関係
が深くなります(アンダーバーの数値枠）。（相関が高い）
逆に数値が「０」に近いほど関係が薄いという事になります。
この事から
①「食べてみたい」と「食べた事がある」との関係は比較的強い、つまり
一度食べた人はこれからも食べる可能性が高いということです。
②「食べてみたい」と関係が深いのは「店が近い」と「見た目が良い」の二つ。
③「食べた事がある」と「おいしい」はほとんど関係ありません。
　「食べた事がある」人が必ずしも「おいしい」と思っているとは限らないのは
　当然としても、その逆も成立しています。つまり「おいしい」と思っているから
　「食べに来ている」とは限らないという事です。
次に「食べてもらいたい」を構成する要因として大きなものは何かと分析したものが
「図　３」の「偏相関分析表」です。

図　３　　偏相関分析表

	食べてみたい	食べた事がある	おいしい	店が近い	見た目が良い
食べてみたい	-1	0.43616	0.7933	0.18164	0.73635
食べた事がある	0.43616	-1	-0.51083	0.68407	-0.30246
おいしい	0.7933	-0.51083	-1	0.00535	-0.47769
店が近い	0.18164	0.68407	0.00535	-1	0.05047
見た目が良い	0.773635	-0.30246	-0.47769	0.05047	-1

ここでも「１」に近い数値をもつ項目を見ると「おいしい」と「見た目が良い」の
二つです。「おいしい」の中には「過去に食べた事があっておいしかった」とか
「おいしいと評判だ」「おいしいような気がする」といった気持ちも含まれています。
この事から
①「食べてみたい」気持ちの大きな要因（貢献度）は「おいしい」と「見た目が良い」
　の二つだけということです。
②「近くにある」という要因はほとんど関係ないということです。

以上が「データマイニング」の概要です。

back