中央大学理工学部情報工学科 卒業論文
居酒屋における注文内容の分析と プロモーションの提案
学籍番号
01D8101022L
小泉 純也指導教員 田口 東 教授
2005
年3
月あらまし
本研究では,関東地区に存在する,ある居酒屋の伝票を集計したデータを用いて,注文 内容を分析し,得られた結果を考慮して,効果的なプロモーションを提案する.
まず,メニューをカテゴリに分類し,ABC分析を用いて各カテゴリを
3
レベルにランク 付けを行う.次に,ドリンクと料理の相性を見るためにコレスポンデンス分析を用いて,相性を視覚的に把握する.また,分析結果の数値を用いて,ドリンクと料理の相性を数値 化し,相性の順序付けを行う.以上の分析結果と客の滞在時間や注文内容を考慮して,あ らゆる場合におけるプロモーションを提案する.
キーワード:ABC分析,コレスポンデンス分析
目次
第
1
章はじめに
... 1
第
2
章使用データ
... 2
2.1 データの概要 ... 2
2.2 対象とした居酒屋の特徴... 3
第
3
章 中心となるメニューの抽出と時間による注文の変化... 4
3.1 メニューの分類 ... 4
3.2 ABC
分析... 5
3.2.1 ABC
分析とは... 53.2.2 金額の構成比における ABC
分析... 6
3.2.3 個数の構成比における ABC
分析... 7
3.3 来店時間を考慮したメニューの注文数の変化 ... 9
3.4 来店からの経過時間による売上金額の変化 ... 11
第
4
章 メニュー間の相性...13
4.1 コレスポンデンス分析 ... 13
4.1.1 コレスポンデンス分析とは ... 13
4.1.2 計算手順 ... 13
4.1.3 寄与率と相関比... 17
4.2 コレスポンデンス分析の結果 ... 18
4.2.1 クロス集計表の作成... 18
4.2.2 ドリンクと料理のカテゴリの相性 ... 18
4.2.3 ドリンクと“魚介”に含まれるメニューの相性... 19
4.2.4 ドリンクと“ご飯・麺”に含まれるメニューの相性... 20
4.2.5 ドリンクと人気メニューの相性... 21
4.3 相性の順序付け ... 22
4.3.1 相性の定義... 22
4.3.2 相性値の算出 ... 23
4.3.3 順序付け結果の考察... 25
第
5
章 効果的なプロモーション... 30
第
6
章おわりに
... 32
6.1 まとめ ... 32
6.2 今後の課題 ... 32
謝辞
... 33
参考文献
... 34
付録
... 35
第 1 章 はじめに
今日の外食産業は,あらゆる業態において新規店舗が次々とオープンしている.新規店 舗はどの店も斬新なサービスや料理とともに,大規模な宣伝をして新規客を呼び込む.そ の一方で既存店は新規客の来店を狙うのは難しい.そのため,既存店は,リピーターの獲 得や客単価の向上を狙うことが重要である.日本フードサービス協会の調査によると,既 存店は売上金額や来客数は減少の一途をたどっているが,客単価は増加の傾向が出ている
[1].本研究で対象とする大衆居酒屋では,店員がメニューを客に勧めることは大変効果的
であり,客との会話が増えることにより,店のイメージ向上にもつながる.本研究では,居酒屋の伝票を収集したデータの分析を行う.メニューをカテゴリに分類 し,売上や注文数の中心となるカテゴリを把握する.また,ドリンクから見た料理の相性 を調べる.以上の分析結果をもとに,客の嗜好に合ったメニューのプロモーションを提案 することを目的とする.
第 2 章
使用データ
2.1 データの概要
本研究で使用するデータは,関東地区に存在する,ある居酒屋から提供していただいた 伝票を集計したものである.
対象期間は
2004
年7
月25
日から2004
年9
月15
日の間から金・土曜日と8
月1
日と8
月15
日を除いた計35
日間とする.金・土曜日を除いたのは,データの欠損が多かったた めである.データから以下の項目を使用する.•
伝票NO(何度目の注文か)
•
客の人数•
注文されたメニュー•
メニューの注文数•
日にち•
注文時間•
注文されたメニューの金額•
組の合計金額本研究では,対象期間内で欠損のないデータのみを用いる.また,メニューの相性を見 る場合に大人数の客はふさわしくないため,7 名以上のグループ客はデータから除外した.
データの概要は以下の通りである.
•
来客組数630
組•
来客人数1,671
人•
注文回数3,389
回•
注文個数10,602
個•
売上金額5,107,411
円•
客単価3,056
円客の人数別に平均注文数と客単価を表したものを表
2.1
に示す.表2.1
から,客の大半が2,3
名であることがわかる.しかし,2,3名の客単価は低くなっている.滞在時間や注文 回数は,人数が増えると増加する傾向が見られる.表
2.1 客の人数による注文数と客単価の変化
客の人数
1
名2
名3
名4
名5
名6
名 組数[
組] 26 376 108 64 34
22
滞在時間[
分] 70 110 119 144 188 182
注文回数[回] 3.35 4.53 5.36 6.94 9.50 11.50
一人当たりのドリンク注文数 [個]3.08 2.24 2.24 2.77 3.13 2.77
一人当たりの料理注文数[個] 3.23 2.26 1.77 1.96 1.91 1.75
客単価
[円] 3,785 2,935 2,680 3,123 3,375 3,253
2.2 対象とした居酒屋の特徴
本研究で対象とした居酒屋の特徴として以下のことが挙げられる.
•
営業時間は,8
月15
日までは17
時から翌3
時,それ以降は17
時から24
時である.•
メニューに焼肉としゃぶしゃぶがあり,それぞれ2
時間制の食べ放題がある.•
対象期間内の日曜日には焼肉半額セール(食べ放題は300
円引き)を行っている.•
生ビールやサワーのジョッキが他の居酒屋に比べてサイズが大きく,中ジョッキが 他の店の大ジョッキに相当する.第 3 章
中心となるメニューの抽出と時間による注文の変化
3.1 メニューの分類
本研究で対象とした期間内に注文されたメニューは
351
種類存在し,これらをこのまま 分析することは困難なため,ドリンクを7
カテゴリ,料理を11
カテゴリ,その他を4
カテ ゴリの計22
のカテゴリに分類する.カテゴリコードとカテゴリ名を表3.1
から表3.3
に示 す.料理のカテゴリの“一品料理”と“おつまみ”の分類は,加熱調理されて提供される ものを“一品料理”,そうでないものを“おつまみ”とした.例として,“一品料理”には“鶏の唐揚げ”や“ポテトフライ”,“おつまみ”には“枝豆”や“お新香”がある.その 他のカテゴリの“opt”は,“空のグラス”(ボトル注文時)などを含み,また,“他”は,“料 理他”,“飲物他”などのメニューにない注文を含む.“サワー”の数が特別多いのは,グラ スのサイズが
4
種類あり,それぞれ別のメニューとしてカウントされているためである.表
3.1 ドリンクのカテゴリ
コード カテゴリ名 メニュー数
5
カクテル33
11
サワー70
13
シーズンドリンク12
15
焼酎30
17
ソフトドリンク15 19
日本酒・ウイスキー・ワイン25
20
ビール6
表
3.2 料理のカテゴリ
コード カテゴリ名 メニュー数2
一品料理17 3
おつまみ17
6
魚介12
7
串焼き12
9
ご飯・麺13
10
サラダ6
12
シーズン14
14
しゃぶしゃぶ8
16
ステーキ6
18
デザート14
22
焼肉22
表
3.3 その他のカテゴリ
コード カテゴリ名 メニュー数
1 opt 10
4
お通し1
8
コース5
21
他3
3.2 ABC 分析
3.2.1 ABC 分析とは
飲食業のように複数の商品を扱っている業種において,店舗はどの商品がその店舗にと って重要であるかを把握する必要がある.ABC 分析は,「少数の要因によって多数が決定 づけられる」という考え方(パレートの法則)に基づいて,複数の要因の中から重要な要 因を決定する手法である.
各要因について全体での構成比を求め,それを降順に並べる.次に,構成比の高い順に 累計構成比を計算する.その要因までの累計構成比が
0%〜70%となる要因を A
ランク,同様に
70%〜90%を B
ランク,90%〜100%をC
ランクと全体を3
つに分類する.A,B,C
の3
つのランクに分類することから,ABC分析といわれている.縦軸に構成比,横軸に要因を置き,各要因の構成比を棒グラフ,累計構成比を折れ線グ
ラフとして描いたグラフをパレート図という.パレート図を描くことで,各要因の重要度 が把握しやすくなる.
3.1
節で分類した全カテゴリのうち,どのカテゴリがいかに重要な要因であるかを分析す る.ここで,データ量が少なく,メニューに統一性がないカテゴリ“opt”と“他”を除い た,計20
個のカテゴリについてABC
分析を行う.ABC
分析を行う上で,各要因をどの視点から見て重要であるかを決める必要がある.こ こでは,どの要因が売上金額に影響を与えているかと,どの要因が多く注文されているか という2
つの視点からABC
分析を行う.3.2.2 金額の構成比における ABC 分析
各カテゴリにおける金額の構成比とランクを表
3.4
に,パレート図を図3.1
に示す.“ビール”が全体の
2
割以上を占めており,ただひとつ飛びぬけている.ドリンク全体の
46%がビールである.
“サワー”が“お通し”に次いで3
番目に入っている.また,食べ物では“焼肉”が
1
番のウエイトを占めており,店の特徴がはっきりと表れている.“一品 料理”,“おつまみ”に続いて“ご飯・麺”もA
ランクに入ったが,図3.1
を見ると,料理 のカテゴリに関して,全体的に大きな差は見られない.表
3.4 カテゴリの金額構成比とランク
カテゴリ 金額 金額構成比金額累計構成比 ランク
ビール
\1,120,042
21.93% 21.93% Aお通し
\477,540
9.35% 31.28% Aサワー
\474,243
9.29% 40.57% A焼肉
\342,869
6.71% 47.28% A一品料理
\332,661
6.51% 53.79% Aおつまみ
\303,660
5.95% 59.74% Aカクテル
\263,235
5.15% 64.89% Aご飯・麺
\207,312
4.06% 68.95% A焼酎
\189,231
3.71% 72.66% A魚介
\180,656
3.54% 76.19% Bサラダ
\174,930
3.43% 79.62% B串焼き
\169,965
3.33% 82.95% Bシーズン
\163,548
3.20% 86.15% B日本酒・ウイスキー・ワイン
\142,884
2.80% 88.94% Bステーキ
\118,776
2.33% 91.27% Bシーズンドリンク
\117,474
2.30% 93.57% Cソフトドリンク
\112,476
2.20% 95.77% Cコース
\103,920
2.03% 97.81% Cしゃぶしゃぶ
\85,284
1.67% 99.48% Cデザート
\25,970
0.51% 99.99% C合計
\5,107,411
100.00%0%
20%
40%
60%
80%
100%
ビ ー
ル
お 通 し
サワー 焼 肉
一 品 料 理
おつ
ま み
カ ク テ
ル
ご 飯
・麺
焼 酎
魚 介
サ ラ ダ
串 焼 き
シ ー ズ
ン
日 本 酒 等
ス
テ ー キ
シ ー ド リ
ソ フ ト
コース しゃぶ
デ ザ ー
ト
カテゴリ 構
成 比
金額構成比 金額累計構成比
図
3.1 金額構成比を用いたパレート図
3.2.3 個数の構成比における ABC 分析
金額の場合と同様に,各カテゴリにおける個数の構成比とランクを表
3.5
に,パレート 図を図3.2
に示す.金額構成比と比較すると,“ビール”と“お通し”が,金額では
2
倍以上の差があったの にも関わらず,個数ではほぼ等しくなっている.お通しは,客一人につき一つ提供するこ とになっているので,“ビール”はほぼ来客人数と同じだけ注文されていることがわかる.金額で大きな差が見られたのは,お通しが
315
円であるのに対して,カテゴリ“ビール”の中で一番注文数が多い「生ビール(中)」が
798
円と,単価に大きな差があるからである.“ソフトドリンク”は金額において
C
ランクであるにも関わらず,個数ではA
ランクに含 まれる.これも単価が影響しており,“ソフトドリンク”に含まれるメニューはどれも300
円以下のものであり,注文される数は多くても,売上にはあまり大きな影響を与えていな い.また,対象期間が7
月の下旬から9
月の中旬という暑い時期であったにも関わらず,アイスクリームを含む“デザート”の注文が非常に少ない.食事を終えた客に“デザート”
を勧めることが客単価アップに効果的であると考えられる.
表
3.5 カテゴリの個数構成比とランク
カテゴリ 数 個数構成比個数累計構成比 ランク
ビール 1524 14.81% 14.81% A
お通し 1516 14.74% 29.55% A
焼肉 934 9.08% 38.63% A
サワー 853 8.29% 46.92% A
おつまみ 751 7.30% 54.22% A
一品料理 670 6.51% 60.73% A
カクテル 557 5.41% 66.15% A
ソフトドリンク 479 4.66% 70.80% A
串焼き 449 4.36% 75.17% B
ご飯・麺 411 3.99% 79.16% B
焼酎 328 3.19% 82.35% B
魚介 323 3.14% 85.49% B
シーズン 323 3.14% 88.63% B
サラダ 319 3.10% 91.73% B
シーズンドリンク 193 1.88% 93.60% C
日本酒・ウイスキー・ワイン 190 1.85% 95.45% C
ステーキ 177 1.72% 97.17% C
しゃぶしゃぶ 148 1.44% 98.61% C
デザート 86 0.84% 99.45% C
コース 57 0.55% 100.00% C
合計 10288 100.00%
0%
20%
40%
60%
80%
100%
ビ ー
ル
お 通
し
焼 肉
サワー おつまみ 一 品 料 理
カ ク テル
ソ フ ト
串 焼 き
ご 飯
・麺
焼 酎
魚 介
シ ー
ズン
サ ラ ダ
シ ー ド リ
日 本 酒 等
ス
テ ー
キ しゃぶ
デ ザ ー
ト コース
カテゴリ 構
成 比
個数構成比 個数累計構成比
図
3.2 個数構成比を用いたパレート図
3.3 来店からの時間による注文の変化
本研究で対象としている大衆居酒屋において,客の注文の流れは概して以下のようにな る.はじめにドリンクを注文し,ドリンクが提供されたとき,もしくはドリンクの注文と 同時に料理を何品か注文する.以後,ドリンクや料理がなくなり次第,追加注文をする.
このとき,最初に注文されるメニューと,追加として注文されるメニューにどのような特 徴があるのかを,来店からの時間を考慮することにより調べる.
使用したデータに来店時間のデータが存在しないので,最初の注文時間をそのまま来店 時間と考える.来店からの時間を以下の
5
つに分ける.① 来店から
10
分②
10
分から30
分③
30
分から60
分④
60
分から120
分⑤
120
分以降①から⑤の各時間におけるドリンクのカテゴリと料理のカテゴリにおける,各カテゴリ の注文比率を算出し,グラフにしたものをそれぞれ図
3.3
と図3.4
に示す.0%
10%
20%
30%
40%
50%
60%
70%
初〜10分 〜30分 〜60分 〜120分 120分以降 来店からの時間
構 成 比
カクテル サワー
シーズンドリンク 焼酎
ソフトドリンク 日本酒など ビール
図
3.3 来店からの時間別ドリンクのカテゴリの構成比
0%
5%
10%
15%
20%
25%
30%
35%
初〜10分 〜30分 〜60分 〜120分 120分以降 来店からの時間
構 成 比
一品料理 おつまみ 魚介 串焼き ご飯・麺 サラダ シーズン ステーキ デザート
図
3.4
来店からの時間別料理のカテゴリの構成比“ビール”は初めの
10
分間で約60%
を占めているが,その後減少を続け,120
分以降で は10%
程度にまで下がっている.その一方で,初めの10
分間とそれ以降を比較すると,“サ ワー”と“焼酎”は,それぞれ約2.5
倍,約4
倍と大幅に増加している.このことから,最 初の1
杯目や2
杯目あたりまではビールを注文し,その後は“サワー”,“焼酎”など“ビ ール”以外のドリンクに変えていく傾向が見られる.また,“サワー”と“焼酎”は,10
分 経過後は割合がほとんど変化せず,“ソフトドリンク”と“カクテル”は,全体的に大きな 変化は見られなかった.料理のカテゴリのグラフでまず目につくことは,“デザート”が食事を終えたころの
60
分以降から注文されていることである.また,“デザート”を除いてみると,右上がりのカ テゴリと右下がりのカテゴリに分けられる.“一品料理”,“おつまみ”,“ご飯・麺”は,初 めの10
分間の構成比に比べ,他の時間における構成比が大きくなる.他のカテゴリは初め の10
分間の構成比が最大となっている.このことから,最初は食事という感覚で料理を注 文し,ある程度時間が経過した後は酒のつまみとして注文する.最後の締めには“ご飯・麺”,“デザート”を注文するなどの変化が見られる.また,“一品料理”と“おつまみ”は,
120
分まではほぼ同じ割合であるが,120
分以降は“おつまみ”が大きく上回っている.120
分以降は加熱調理された“一品料理”よりも,冷めてもおいしく食べられる“おつまみ”を好む傾向が出ている.120分以降では,注文される料理の
30%以上が,
“おつまみ”とな っている.3.4 来店からの経過時間による売上金額の変化
来店からの経過時間別の売上金額を,10 分間隔で計算しグラフにしたものを図
3.5.a
と図
3.5.b
に示す.図3.5.b
は,図3.5.a
の最初の20
分間を除いたものである.図3.5.a
を見ると,最初
20
分間がそれ以降に比べて大きな値となっている.使用したデータの総売上金額は
5,107,411
円であり,そのうち,最初の20
分間での売上金額は3,150,638
円と,全体の
6
割を占めている.また,図3.5.b
から,30
分経過時の売上に比べ,40
分,50
分経 過時の売上が増加していることがわかる.このことから,40
分から50
分経過時に,最 初に注文した料理やドリンクがなくなることが多く,追加注文が増えていると考えられ る.0 50 100 150 200 250
10 60 110 160 210 260 310 360
来店からの時間[分]
売 上 金 額
[
万 円]
図
3.5.a 来店からの時間別の売上金額
0 5 10 15 20 25 30 35
30 80 130 180 230 280 330 380
来店からの時間[分]
売 上 金 額
[
万 円]
図
3.5.b 来店から 20
分以上経過後の売上金額客一人の一分間の平 経過時間別の単位売 上を計算し,グラフにしたものを図
3.6
に示す.図3.6
を見ると,図3.5.a
と同様に最初の20
分間がそれ以降に比べて大きな値となっている.最初の20
分間を除き,30分間隔に変 更したものが図3.7
である.30 分間隔に変更したのは,ある程度時間が経過すると客数が 減少し,客一人の影響が大きくなるためである.図3.7
より,来店から90
分を過ぎたとこ ろで,単位売上は10
円を下回っている.さらに,210分を過ぎたところで5
円を下回って いる.300
分以降は,データ数の欠乏により,ばらつきが大きくなっている.この結果,180
分を過ぎてからは,追加の注文はあまり望めないと言える.均売上金額を単位売上と定義する.来店からの
0 20 40 60 80 100 120
10 60 110 160 210 260 310 360 410 来店からの時間[分]
単 位 売 上
[ 円
]
図
3.6 来店からの時間別の単位売上
0 5 10 15 20
30 60 90 120 150 180 210 240 270 300 330 360 390 来店からの時間[分]
単 位 売 上
[ 円
]
図
3.7 来店から 20
分以上経過後の単位売上第 章
ニュー間 相性
4.1 レスポ デンス分析
4.1.1 コレスポンデンス分析とは
コレスポンデンス分析は,クロス集計表を元データとして,行要素と列要素を反応傾向 に基づいて数量化する手法である.数量化した値からポジショニングマップを作成するこ とにより,要素の類似度を視覚的に把握することができる.出力された数値が近いものほ ど,類似度が高いと評価できる.理論的には数量化Ⅲ類と同等である.
コレスポンデンス分析では,行の要素をサンプル,列の要素をカテゴリと呼ぶ.クロス 集計表において,サンプルが 個,カテゴリが 個
4
メ の
コ ン
n
1n
2( n
1> n
2)
n
1とする.コレスポンデンス分 析は,サンプルとカテゴリの相関係数が最大となるように, 個のサンプルスコアと 個 のカテゴリスコアを与えていく.スコアは最大で
n
2 2− 1
n
次元与えることができる.これは 単に, 次元与えると元のデータをそのまま表せてしまうからである.計算手順
元データのクロス集計表を行列
n
24.1.2
A
と考える.行列A
の 行の総和を 列の総和を と し,それらを成分とするベクトルをそれぞれ , とする.さらに,求めるサンプルスコ アとカテゴリスコアをそれぞれ ,i b i
,j c j
B C
x y
とし,以下のように表す., ,
⎞
⎜ ⎜
⎜ ⎜
⎜ ⎛
=
21
x x
x M
,⎞
⎜ ⎜
⎜ ⎜
⎜ ⎛
=
21
y y
y M
⎟ ⎟
⎟ ⎟
⎟
⎠
⎞
⎜ ⎜
⎜ ⎜
⎜
⎝
⎛
=
2 1 1
1
2 2
2 1
2 22
21
1 12
11
n n n
n
n n
a a
a
a a
a
a a
a
K M O M
K A
⎟ ⎟
⎟ ⎟
⎟
⎠
⎞
⎜ ⎜
⎜ ⎜
⎜
⎝
⎛
=
1
2 1
b n
b b
B M
⎟ ⎟
⎟ ⎟
⎟
⎠
⎞
⎜ ⎜
⎜ ⎜
⎜
⎝
⎛
=
2
2 1
c n
c c
C M
⎟ ⎠
⎝ x n
1⎟ ⎟ ⎟ ⎟ ⎝ y n
2⎠
⎟ ⎟
⎟ ⎟
⎟
ただし,
∑
==
10
n
k ik
i a
b
,相関係数
∑
==
10
n
k kj
j a
c
である.
r
は,S xx
をx
の分散,S yy
をy
の分散,S xy
をx
とy
の共分散とすると,∑
∑ ∑∑
=
=
2. 2
.
i i j j
j i ij xy
a a
a r S
y x
y x
と
t
a
⎟ =
⎜
⎟
⎜
2
M K
M O
M
(4.1)
yy
xx S
S
表せる.ここで,
( )
y
x n
n
n j
i ij
y y a
a a
a a
a x x
x
a ⎟
⎟ ⎞
⎜
⎜ ⎛
⎟
⎟ ⎞
⎜
⎜ ⎛
∑∑ =
22
1
2 1 2 22
21
1 12
11
2 1
K
K x Ay
n n n n
n a y
a ⎟ ⎟
⎜ ⎠
⎜
⎟ ⎝
⎟
⎜ ⎠
⎜
⎝
11 1 12 2であり,
B
の要素を対角成分とするn
1× n
1の正方行列をB diag
,C
の要素を対角成分とする
n
2× n
2の正方行列をC diag
とすると,( ) B x B x
x t diag
n diag n i
i
x x x x
x x
a =
⎟ ⎟
⎟ ⎟
⎟
⎠
⎞
⎜ ⎜
⎜ ⎜
⎜
⎝
⎛
∑ =
1 1
2 1
2 1 2
.
K M (4.2)
n diag n j
j
y ⎟ ⎟
⎜ ⎠
⎜
⎝
11
1
2 1
.
M (4.3)
と表せる.
(4.2)式と(4.3)式は,行 や列
( ) C y C y
y y t
y y
y y
a ⎟ ⎟ ⎟ ⎞ =
⎜ ⎜
⎜ ⎛
∑
2= K
2diag
i j
の順番を変えても値は変化しないので,(4.2)式と
(4.3)式は一定の値となる.つまり,相関係数 r
はx
とy
の分散の値に依存しないということになる.そこで,(4.2)式と(4.3)式の値を に規準化すると相関係数
1 r
は,Ay Ay x
x y C y x B x
Ay x y
x
y
x t t
diag diag
t t
t
j j i
i
j i ij
a a
r = a = = =
∑
∑ ∑∑
1 1
2 . 2
.
(4.4)
となる.
以上より,コレスポンデンス分析におけるスコアの計算は,次のような最大値問題とみ
なすことができる.
最大化
(4.5)
制約条件
(4.6)
dia 4.7)
この最大化問題にラグランジュ乗数を導入し,ラグランジュ未定乗数法を考える.ラグ ランジュ乗数を
Ay x t r =
= 1 x B x t diag
1 y C
y t g = (
µ
1,µ
2とすると,関数F
は,( ) ( 1 )
1 2 2
2
1
− − −
−
= x t Ay x t B diag x y t C diag y
F µ µ
(4.8)
と求まる.計算を簡単にするために条件式の係数を
1 2
とする.(4.8)式を x
,y
,µ
1,µ
2で偏微分して,
0 x B x = Ay − =
∂
∂
diag
F
µ
1(4.9)
0 y C A
y = x − =
∂
∂
diag
F t
µ
2(4.10)
となる.
µ
1,µ
2で偏微分したものは制約条件と等しくなるので省略する.(4.6), (4.7), (4.9),
の
4
まず,(4.9)式の両辺に
を左からかけて,(4.10)
式より固有値問題の形式に変形する.x t
( )
1 1
1
µ µ
µ
=
=
−
×
=
−
Ay x
0 x B x Ay x
0 x x B Ay x
t diag t t
t diag
t
となる.(4.10)式も同様に を左からかけて,
( x B diag x = 1 )
Q t
(4.11)
y t
( )
2 2
2
µ µ
µ
=
=
−
×
=
−
Ay x
0 y C y A x y
0 y y C A x y
t diag t t
t
t diag
t t
と変形できる. となる.さらに,
(4.4)式より相関係数
( y C diag y = 1 )
Q t
(4.12)
以上より,
であるから, 1
Ay x t
=
=
21
µ
µ r = x t Ay
µ
もしくはµ
2が相関係数r
の最大値となることを示している.以後,2
1
µ
µ
µ = =
とする.次に,y
を消去する変形を行う. 式より,t
(4.10)
diag
1 1 1
−
−
−
=
=
=
=
µ µ µ µ
(4.13)
と
x A C y
x A C y C C
x A y C
A x y C
t diag
t diag diag
diag
t diag
( C diag− C diag = I )
Q
1する.(4.9)式の両辺を
µ
倍した式に,(4.11)式を代入し,( C A x )
A diag
−1t
(4.14)
0 x B
0 x B Ay
=
−
=
−
diag diag
2 2µ µ µ
とする.固有値問題にするには,左辺から
B
を新しく定義する.diag
を除く必要があるので,以下の2
つの行列⎟ ⎟
⎟ ⎟
⎟ ⎞
⎜ ⎜
⎛ 0
2 1
1
b
b
⎜ ⎠
⎜ ⎜
⎝
=
0
12
b n
B O ,
⎟ ⎟
⎜ ⎜ 0
b
⎟
⎟ ⎟
⎟
⎟
⎠
⎜ ⎜
⎜ ⎜
⎜
⎜
⎝
−
=
1
1 1
0
2 1
n
B b
これらを用いて,
⎞
⎛ 1
⎟
⎜ b
12
⎟ O
B diag
B
B
12 21=
であるから,0 x B x
B B A AC B
0 x IB Ix
A AC B
0 B x B B B x A AC
=
−
×
=
−
− −
2 2
2 1
µ
µ
t diag
(4.15
B
x B B x A AC
⎟⎟ =
⎠
⎜ ⎞
− ⎛
⎟⎟ ⎠
⎞
⎜⎜ ⎝
⎛
=
−
− −
−
−
− −
−
−
2 1 2 2
1 2 1 2 1
1
1 1
2 1 2
1 2 1 2 1 2 2 1
1
2 1 2 1 2 1
µ µ
t diag diag
t t diag
)
ここで,
0
⎜ ⎝
1 2
2 − −
= B
−AC B
H t
1 1
diag A (4.16)
x B l
21
= (4.17)
(4.18)
と置くと,
µ
2λ = l
Hl = λ (4.19)
となり,
H
を固有値算出行列,λ
を固有値, を固有ベクトルとする固有値問題の形式にl
表せる.固有ベクトルが
l ≠ 0
となる解をもつには,= 0
− I
H λ (4.20)
であるから,この行列式から固有値
λ
と固有ベクトル がそれぞれ 個ずつ求められる.そのとき, 個の固有値の中には必ず最大固有値 が含まれる.これは,(4.9),(4.10)の
2
l n
2n 1
式を満足してしまうため意味を持たない.つまり,固有値と固有ベクトルは 組求ま る.相関係数
2
− 1 n λ
µ =
=
r
より,相関係数は固有値の正の平方根であるので,固有値の値が 大きい次元ほど,元データに近い結果を得られる.固有値を大きい順に 1 2 1,
2,
, λ λ n
−λ K
とし,対応する固有ベクトルを とする.
サンプルスコア とカテゴリスコア
1 2
1
, l , , l n
2−l K
求められた固有値と固有ベクトルを用いて,x y
を求める.各次元のサンプルスコアx
は(4.17)式の2
−1
B
を左からかけて,両辺に
x l B
x B B l B
=
=
−
−
−
2 1
2 1 2 1 2
1
(4.21)
と求まり,カテゴリスコア
y
は,(4.11)
式より,x A C y =
µ
t diag
1
−1(4.22)
と求まる.
4.1.3 適合度と寄与率
数量化などの多変量解析では,分析結果と元のデータとの当てはまりを調べる必要があ る.
は,データ分 の次元が表している比率のことである.コ レスポンデンス分析では,固有値が相関係数と一致するので,固有値の総和に対する各次 元の固有値の大きさを寄与率として扱うことができる.4.1.2項で述べたように,固有値は
個存在するので,第 次元の寄与率 は,
各次元の寄与率と 散量のうちそ
2
− 1
n i e i
∑
−=
=
11
n
2j j i
e i λ λ (4.23)
として表せる.
適合度は,コレスポンデンス分析のモデルが元データのどの程度当てはまっているかを ある.つまり, 次元のうち分析結果として採用した次元までで表せる割合 と考える.採用した次元を とすると,そのときの適合度 は第 次元から第 次元までの 累積寄与率となるので,
2
− 1 n
k
表すもので
f k 1 k
∑
∑ −
=
2
1 n
j k
i
e i λ λ (4.24)
∑ = = =
=
1 1
1 i j
k
i
f k
で得られる.この適合度の
視覚的に類似度を捉えられるように
2
次元を採用する.値から次元数を決定することも有効であるが,本研究ではプロ ットを用いて
4.2 コレスポンデンス分析の結果
4.2.1 クロス集計表
351 351
行351
る.
結果 外した.また,“シーズンドリンク”は,味に統一性が ないために除外した.したがって,ドリンクは,“ビール”,“サワー”,“カクテル”,“焼酎”,
“日本酒”,“ソフトドリンク”
とは,この
6
カテゴリを指す.文字数の関係で,“ソフトドリンク”は“ソフト”としてプ6
結果,クロス集計表は166
行166
列とな った.この集計表より,分析析を行う.
.2.2 ドリンクと料理のカテゴリの相性
とドリンクとの相性を見る.“シーズン”は,“シーズン ドリンク”と同様の理由で除外し,“しゃぶしゃぶ”はデータ数が少ないため除外した.行 をドリンクの カテゴリ,列を料理の カテゴリとしてクロス集計表を作成し,コレスポ ンデンス分析を実行する.実行結果のプロットを図
4.1
に示す.次元での適合度は と大変高い値になっている. 次元の寄与率が であり,
図 の横軸の次元 で,元データの 割以上を数量化したことになる.図 から,“焼 肉”に含まれるメニューを注文する客は,“ソフトドリンク”の近くにプロットされ,他の
ドリン 飲みに来るというより,焼肉
を食べに来るということがわかる.実際に,全
630
組中で“焼肉”に含まれるメニューを1
つ以上注文した組は83
組存とは同時に,メ 肉があることが来店客に広く知られていることを表している.
また,これは一般的に考えて当然の結果とも言えるが,“ビール”と“おつまみ”,“串焼き”
が非常に相性がよい.プロットされた結果は,遠く離れた点を見るのも重要である.たと えば,“魚介”は,“カクテル”に比べて,“日本酒”や“焼酎”と相性がよいと言える.反
の作成
メニュー同士の相性を見ることを目的とし,コレスポンデンス分析を行う.
各メニューに対して,同じ客がどのメニューと同時に注文されるかをカウントし,三角 行列を作成する.それを対称にしたものをクロス集計表と考える.メニューは 種類存 在するので, 列の行列となる.そのままのサイズではコレスポンデンス分析の 精度があまりにも低くなってしまうため,ドリンクはカテゴリごとにまとめて考え こ のとき,“日本酒・ウイスキー・ワイン”は相性という面からすると,まとめて考えるのは ふさわしくないため分解した.しかし,“ウイスキー”と“ワイン”はともにデータ量が少 なく,偏った が表れたために除
の計
6
カテゴリとする.以後,本章における「ドリンク」ロットされる.ドリンクを カテゴリにまとめた
に必要な行と列のみをその都度選択し,コレスポンデンス分
4
3.1
節で分類した料理のカテゴリ6 9
2 0.961 1 0.922
4.1 1 9 4.1
クからは離れた点にプロットされているため,お酒を
在し,うち
49
組が“焼肉食べ放題”を注文していた.このこ ニューに焼
1.0
次元 1
1.0 .5
0.0
2
.5
0.0
-.5
-1.0
-.5 -1.0
デザート 焼肉 サラダ
串焼き
魚介 おつまみ
一品 ビール
焼酎 サワー
カクテル 料理
ステーキ 日本酒 ご飯・麺
ソフト
次元
0
料理のカテゴリ ドリンク
4.2.3 ドリンクと“魚介”に含まれるメニューの相性
ゴリ“魚介”に含まれるメニューとドリンクの相性を見る.“魚介”に含まれ メニューは
12
品存在するが,“刺身の盛り合わせ”と“刺身単品”をまとめたため,計8
となる.行をドリンク,列を“魚介”のメニューとして分析し,実行結果のプロットを ン酢をかけたもので,“イカホイ”とはイカのホイル焼きである.
項における結果では,“魚介”は“日本酒”と相性がよかったが,ここでは“日本酒”
は離れた点に ットされた.これは, 日本酒”のデータ数が他の要素に比べて少ないこ とが関係している.コレスポンデンス分析のスコア 算方法で 式
(4.17)
,式(4.18)
で 述べたように,行また 要素の総数の逆数,または平方根の逆数に比例しているから である.2
次元の適合度は であり,次元1
の寄与率は0.409
である. の縦軸図
4.1
ドリンクと料理のカテゴリ対に,“カクテル”は,“魚介”よりも,フライドポテトやピザが含まれる“一品料理”と 相性がよいと言えるからである.
料理の相性を見るときに,カテゴリごとでは具体的なメニューとドリンクの相性を見る ことができないため,ここからは料理のカテゴリ内のメニューと,ドリンクとの相性を見 る.
まず,カテ る
品
図
4.2
に示す.ここで,“たこぽん”とはたこの刺身にポ4.2.2
プロ “
の計 は,
は列の
0.727
図4.2
次元 1
1.0 .5
0.0 -.5
-1.0
次元
2
1.0
.5
0.0
-.5
-1.0
ソフト カクテル
サワー ほっけ ビール
ししゃも サンマ
刺身
イカホイ
イカ一夜
日本酒 焼酎
たこぽん 鮪鮭炙り
ドリンク
”魚介”のメニュー
図
4.2 ドリンクと“魚介”に含まれるメニュー
を見ると,“たこぽん”,“刺身”,“鮪鮭炙り”と,生ものに近いメニューが下方に集まり,
焼き物が上方に集まった.“日本酒”には刺身,“焼酎”には焼き物が相性がよいと考えら れる.また,横軸は,右側に“焼酎”,“日本酒”がプロットされ,左に“カクテル”がプ ロットされていることから,右側は中高年男性,左側は若者や女性が好むメニューが集ま
えられる.
ドリンクと“ご飯・麺”に含まれるメニューの相性
るメニューの相性を見る.“ご飯・麺”に含まれるメニ ーは
13
品存在するが,“お茶漬け”と“おにぎり”にそれぞれ梅と鮭があり,それらを とめて,計11
品とする.行の要素をドリンク,列の要素を11
品のメニューとしてコレン
4.3
せ
カテゴリでの結果を見ると,“ご飯・麺”は“サワー”と相性がよいことがわかる.
そ
っていると考
4.2.4
ドリンクと“ご飯・麺”に含まれ ュ
ま
スポンデ ス分析を行う.実行結果のプロットを図 に示す.“キムチャ”はキムチチャ ーハン,“ライスセ”はライスセット,“餃子丼”はご飯の上に
20cm
の円状の薄い餃子をのた料理である.
2
次元での適合度は0.775
であり,次元1
の寄与率は0.463
である.図4.1
のドリンクと 料理のこで,図
4.3
を見ると,“サワー”のスコアは次元1
が0.002,次元 2
が0.060
とほぼ中 心にプロットされており,“ご飯・麺”のメニューと全体的に相性がよいことになる.その次元 1
1.5 1.0
.5 0.0
-.5 -1.0
次元
2
1.5
1.0
.5
0.0
-.5
-1.0
ソフト 日本酒
焼酎
カクテル
ビール サワー 焼うどん
キムチャ ラーメン
おにぎり お好み焼
おこげ
ライスセ 焼きそば
餃子丼
お茶漬け ビビンバ
0
ドリンク
”ご飯・麺”のメニュー
図
4.3 ドリンクと“ご飯・麺”に含まれるメニュー
中でも,“焼きそば”と“ラーメン”との相性がよい.また,“カクテル”は“ビビンバ”,
“キムチャ”,“おこげ”と非常に相性がよい.
残りの料理のカテゴリに対しても同様にコレスポンデンス分析を行う.“串焼き”に属す るメニューが,“串焼き盛り合わせ”と“串焼き単品”をひとつにまとめたところ,メニュ ーが
2
品になってしまうため,比較的近いカテゴリと考えられる“ステーキ”に含まれるニューと合わせて行う.結果のプロットを付録に示す.
4.2.5 ドリンクと人気メニューの相性
おにぎり”や“お茶漬け”の梅と鮭ように,味が違うものをまと
,“刺身”や“串焼き”の盛り合わせと単品で注文できるものもまとめる.さらに,食べ 題することができる“焼肉”と“しゃぶしゃぶ”に属するメニューは,データに著しく
て
50
し 実
行 メ
料理は全部で
141
品存在し,全体での分析は困難なため,注文回数の多い人気メニュー を抽出して行う.まず,“め 放
偏りが出 しまうため除外する.残った中で,注文回数が 回を超えたものを人気メニュ ーと定義 ,ドリンクとの相性を見る.人気メニューに該当したものは
19
品存在する.結果のプロットを図
4.4
に示す.“ミモザ”は卵のマヨネーズ和えとツナの入ったサラダ,“ジャコ”はジャコ入りの和風サラダ,“明パリ”は明太マヨネーズソースの洋風サラダ,