気象,曜日による食品の売り上げの変化について 01D8103002E 鈴木 涼
中央大学理工学部情報工学科 田口研究室 2005 年 3 月
あらまし
本研究では,気象,曜日と食品の売り上げとの関 係を調べる.影響の度合いを調べるため,気象,曜 日を独立変数,食品の売り上げ個数を当日の来店者 数で割った値を従属変数として重回帰分析を行う.
このとき,変数間の単位の影響を受けない,標準化 回帰係数に着目する.
キーワード:重回帰分析,標準化回帰係数
1はじめに
長引く不況の影響から消費活動は減少傾向にあ る.そのため,商品の売り上げの予測は店側にとっ て重要な課題である.売り上げを予測するために,
売り上げに影響を与える要因を見つけ出し,その要 因がどの程度影響を与えているのかを分析するこ とが重要である.本研究では,気象,曜日がどの程 度食品の売り上げに影響しているかを分析する.
2
使用データ
食品の売り上げを調べるため,福岡県にあるスー パーの
ID付き
POSデータを用いる.このデータ は,誰が,いつ,何を,何個買ったかが記録されて いる.商品は
42種類に分類されている.この分類 名をライン名という.本研究では,食品関連のライ ン(22 種類)の
1日毎の売り上げに着目する.
気象を調べるため,気象庁がホームページで公開 している気象データを用いる.このうち,最高気温,
降水量,日照時間に着目する.
3
分析方法
3.1 重回帰分析重回帰分析の目的は,従属変数
Yを 個の独立変 数 で説明するような式である,重回帰方程式を 求めることである.重回帰方程式は
k
Xi
1 1
0 X
Y=β +β
k kX β +
+L
であらわされ,この回帰係数 につい て推定,検定するのが重回帰分析である.
βi
標準化回帰係数とは,各 が にどれだけ影響 を与えているかを判断するために,
Xi Y
β
を標準化した ものである.
3.2 変数増減法
回帰式に無駄な独立変数が含まれているときや,
必要な独立変数が含まれていないときに回帰式の 精度が悪くなる.この問題を回避するため,変数を 選択する必要がある.本研究では変数増減法を用い て変数の取捨を行う.変数増減法は,回帰係数ごと の有意性に基づいて変数の取捨の判断を行う.
4
分析結果
4.1 独立変数曜日ごとの平均来店者数を図
1に示す.日曜日と
火曜日の平均来店者数が他の曜日より
60人程多い.
土曜日・祝日は,休日である人も多いので,他の曜 日に比べ家族連れが多くなる等,来店する客層が異 なることが予測される.そこで曜日は,火曜日,日 曜日,土曜日,祝日に着目する.最高気温を , 降水量を ,日照時間を ,当日の最高気温と 前日の最高気温の差を ,平均来店者数の多い日 曜日,火曜日をそれぞれ , ,土曜日・祝日 を とし,これら
7変数を独立変数とする.
X1
X2 X3
X4
X5 X6 X7
0 100 200 300 400 500 600 700 800 900 1000
日曜 月曜 火曜 水曜 木曜 金曜 土曜
平均来店者数[人/日数]
図
1 曜日ごとの平均来店者数4.2 回帰係数の導出
ラインごとの
1日の売り上げ個数をその日の来 店者数で割った値を従属変数とし,ラインごとに重 回帰分析を行った.22 種類のラインのうち,有用 な回帰方程式が求まったのはヤサイ,レイシヨクの
2つのラインである.変数選択法を用いたヤサイの 重回帰分析の結果を表
1に示す.
表
1 ヤサイの重回帰分析結果
回帰係数 標準化回帰係数 t 値 有意確率 定数項
1.93727 17.26009 5.58E-37X6
0.64453 0.76352 15.44123 2.01E-32
X1
-0.02256 -0.30230 -6.00605 1.46E-08
X2
-0.00251 -0.10565 -2.08517 3.88E-02
X7
0.06318 0.08127 1.62799 1.05E-01
自由度調整済み寄与率は
0.64961である. の標 準化回帰係数が正の方向に高い値, の係数が負 の方向に高い値となっている.重回帰分析の結果か ら,ヤサイの売り上げは火曜に著しく増加し,最高 気温の高い日に減少するといえる.実際のヤサイの 売り上げ個数を来店者数で割った値(以降,平均売 り上げ個数とする)と,最高気温を図
2に示す.実 データからも,ヤサイの売り上げが最高気温に反比 例することがわかる.また,曜日ごとの売り上げは,
実際に火曜日が著しく高い.これは,毎週火曜日に ヤサイに属する一部の商品が安売りされているこ
X6
X1
とが原因と考えられる.回帰式より求まる予測平均 売り上げ個数と,実測平均売り上げ個数を図
3に示 す.実測値に比べ予測値が大きい日は,火曜日であ るが,ヤサイの安売りをしていない日である.
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
18 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
最高気温[℃]
売り上げ個数/来店者数[個/人]
図
2 ヤサイの平均売り上げ個数と最高気温0 0.5 1 1.5 2 2.5
0 0.5 1 1.5 2 2.5
実測平均売り上げ個数[個/人]
予測平均売り上げ個数[個/人]
3
図
3 平均売り上げ個数の実測値と予測値4.3 特売日の定義
ヤサイの結果から,食品の売り上げには安売りが 強く影響していることがわかる.そこで,特定の商 品が安売りされており,そのラインの売り上げが著 しく上昇している日がある場合,その日をそのライ ンの特売日と定義する.特売日を定義できたライン はアイス,タマゴである.アイス,タマゴにおいて,
新たにそれぞれの特売日を示す変数 を設定する.
を含んだアイスの重回帰方程式の結果を表
2に 示す.
X8
X8
表
2 特売日を考慮したアイスの重回帰分析結果回帰係数 標準化回帰係数
t値 有意確率 定数項
-0.03144 -1.37039 1.72E-01X8 0.19728 0.81411 18.97053 4.08E-41
X1 0.00286 0.15766 3.45949 7.11E-04
X3 0.00216 0.13391 2.92931 3.94E-03
X6 -0.01253 -0.06095 -1.41734 1.58E-01
自由度調整済み寄与率は
0.73161である. の標 準化回帰係数が最も高い値となっており,以下 の順に続く.以上から,アイスの売り
上げは最高気温が高い日,日照時間が長い日に少し 増加するといえる.特売日を除くアイスの平均売り 上げ個数と,最高気温を図
4に示す.実データから も,アイスの売り上げが最高気温に比例することが わかる.特に,最高気温が
31℃を超えるとその傾向を強くみることができる。
X8
6 3
1 X X
X , ,
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16
18 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
最高気温[℃]
売り上げ個数/来店者数[個/人]
図
4 アイスの平均売り上げ個数と最高気温回帰式より求まる予測平均売り上げ個数と,実測平 均売り上げ個数を図
5に示す.実測平均値の値が
0.16付近で,予測値が実測値を大きく上回ってい る日があるが,多くが
9月であった.
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4
0 0.1 0.2 0.3 0.4 0.5 0.6
実測平均売り上げ個数[個/人]
予測平均売り上げ個数[個/人]
図
5 平均売り上げ個数の実測値と予測値5
終わりに
重回帰分析を行った結果,ヤサイ,レイシヨクに ついて,設定した独立変数により売り上げを説明す ることが出来た.最高気温,降水量が売り上げに影 響していることがわかった.安売りが行われている 曜日の影響が,気象よりも大きいことがわかった.
そこで特売日を定義した.特売日を定義したアイス,
タマゴの結果から最高気温,日照時間が売り上げに 影響していることがわかった.
参考文献
[1] 飯塚悦功,久米均,回帰分析,シリーズ入門
統計的方法
2,岩波書店,東京,
1999.
[2] 東京大学教養学部統計学教室,統計学入門,基礎統計学Ⅰ,東京大学出版会,東京,
1991.
[3] 気象庁ホームページ,電子閲覧室,http://www.jma.go.jp/JMA_HP/jma/