卒業研究論文
アパレルショップのデータ分析から考える「売り場」の最適化
13D8101016H 青木 深雪
中央大学理工学部情報工学科 田口研究室
2017 年 3 月
あらまし
アパレルショップでは、店員が毎日マネキンとなって自店の服を着て、アピールしながら販 売をしている。売り上げは品物の場所や気温、天気によっても変動する。それだけでなく、店 員のアピールが有効であることも知られている。しかし、後者はあまり定量化されていない。
そこで売り上げデータと気象データから、気温との関係の深そうなものの相関性を図る。ま た、アソシエーション分析で店員の着用商品と売り上げの関係を調べ、どんな日に何を着て何 をアピールしていく「売り場」が最適なのかを考える。
キーワード:アパレルショップ、回帰分析、アソシエーション分析
目次
第 1 章 はじめに ... 1
第 2 章 使用データ ... 2
2.1 店舗の概要 ... 2
2.2 売り上げデータ概要 ... 2
2.3 アイテムについて ... 3
2.4 気象データ概要 ... 4
第 3 章 回帰分析 ... 5
3.1 回帰分析とは ... 5
3.2 エクセルを用いた回帰分析 ... 6
第 4 章 データマイニング ... 11
4.1 データマイニングとは ... 11
4.2 アソシエーション分析とは ... 11
第 5 章 気象データと売り上げの相関 ... 13
5.1 気温と売れる商品の相関性 ... 13
5.2 前日との温度差と羽織ものとの関係 ... 24
第 6 章 店員着用アイテムと売り上げの相関 ... 27
第 7 章 最適な「売り場」の提案 ... 32
第 8 章 最後に... 34
8.1 まとめ ... 34
8.2 今後の課題 ... 34
謝辞 ... 35
参考文献 ... 36
1
第1章 はじめに
アルバイト先である洋服店では、店員が毎日マネキンとなって自店の服を着て、声を出し、ア ピールしながら販売をしている。しかし、それだけではなく品物の場所や気温天気によっても 売れるものは変動する。そこで、いただいたデータや気象データをもとに、どんな日にどんな 服を着て、どんなことをアピールしていく、いわばどのような「売り場」にし、売り上げにつ なげることができるかを考える。
2
第2章 使用データ
2.1 店舗の概要
本研究では、オフィス街の中心にある駅構内のアパレルショップのデータを使用する。
営業時間 平日 10:00~22:00 休日 10:00~21:00
規模 10~15 坪
ターゲット 20 代後半から 40 代までの女性
店員数 7 人 1 日 4 人程が出勤し、常に 2 人以上が同時に勤務
服装のルール 勤務中は販売中の服を着用
同時に勤務している人とは被らない
ブランドについて 10 代後半から 30 代の女性向けファッションブランド 今回は立地が他店舗と少し違うため高い層となっている 国内には訳 150 店舗あり、海外にも 40 店舗ほど展開している。価格帯はロアモデレートと呼 ばれる範囲内で、一般市民から見て、高すぎず安すぎずの適度な価格だが、本研究で対象の店 舗の場合、周辺店舗の価格帯が高いので、比較的安いと感じていただくことが多い
2.2 売り上げデータ概要
対象期間 2016 年 10 月 2 日~2016 年 11 月 1 日
客単価 3,840 円
利用可能データ ・購入商品
・店員着用商品
・店員着用日
・購入日
3
2.3 アイテムについて
今回使用するアパレル商品を表 2-1 に示した。カテゴリー別に分類で分けた。また、流行品 か、仕事着にできるか、使いやすい定番アイテムなのかも明記した。このアパレル以外にも、
ストールやスヌード、ポンチョなどの防寒具の売り上げデータも利用する。また、この店舗で は、シューズやアクセサリー、ポーチなども販売している。
表 2-1 使用する商品とその分類分け
商品 分類 流行 仕事 定番
オフショルPO ○
リブオフショル ○
リブVPO ○
サカリバPO
スキッパー ○ ◎ ○
オーバーシャツ ○ ○
袖変形ブラウス ○
オフショルブラウス ○
ノーマル ○
ドルマンニット ○
Vネックニット ○
クルーネックニット ○
袖広がりニット 柄スキニー カラースキニー 裏起毛スキニー リボンベルト ノーマル
スカーチョ ○
プリーツスカンツ ○
ハイウエストワイドP プリーツワイドパンツ デニムワイドパンツ
ワイドスカンツ ○
コーデュロイワイドP
コーデュロイSK ○
フレアSK ○
デニムSK 柄ロングSK プリーツSK
チュールプリーツSK 柄プリーツSK
セットアップ ○ ○
VネックシャツOP ケーブルニットOP
リブ袖広がりOP ○
ドルマンOP ロングCD カーデガン
リブロングCD ○
ドルマンCD
ライダースJK ○
Gジャン MA-1
チェスター ○
○
◎
○
○
○
○ ワンピース(OP)
カーデガン
アウター
○
○
○
○
○ プルオーバー
○
○ スキニーパンツ
テーパードパンツ
ビックシルエット パンツ
ミニスカート
ロングスカート シャツ
薄手ニット
4
2016 年の 10 月は暖かいこともあり、秋服といっても前半は 9 月ごろの晩夏の流行りものが 多く出ていた。まずトップスは、オフショルダーが人気の流行物であった。また、T シャツの ようなものよりも、少ししっかりとした、スキッパーシャツと呼ばれるような、しっかりしす ぎないシャツも流行していた。そしてボトムスは昨シーズンからも人気だった、スカーチョや スカンツ、ワイドパンツなどの大きめのシルエットのものや、ロングスカートも流行であるた め、長いボトムが流行っていた。トップスボトムス共通して、縦のラインがあるものが秋から の流行りの一つでもあったため、リブやテレコ素材、プリーツの入ったボトムも多かった。ま た店舗の立地上、顧客には OL が多いため、仕事着として着ることのできるものが売れることが 多い。
2.4 気象データ概要
本研究では、気象庁ホームページに記載されている、過去の気象データから、2016 年 10 月と 11 月 1 日の日ごとの平均気温、最低気温のデータを使用している。
表 2-2 10 月 1 日から 11 月 1 日までの平均気温と最低気温
日付 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
曜日 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火
平均気温 19.4 23.1 22.7 24.9 24 26 21.4 21.2 22.3 18.4 17.6 17.9 16.5 15.6 16.7 17.4 17.5 20.9 20.8 21.9 18.2 16.7 18.1 14.9 14 19.1 19 12.2 15.5 11.9 14.3 13.4 最低気温 17.6 18.6 20.1 19.7 21.5 21.4 19 18.2 18.6 17.4 16.2 13.7 15.3 12.6 11.8 12.7 15.7 16.7 18.4 17 15.4 14.7 14.7 11.9 10 12.6 13.2 10.1 11.6 9.6 9.8 11.7
5
第3章 回帰分析
3.1 回帰分析とは
回帰分析はある一つの変数の値を予測したい、という場面で使われる手法である。回帰分析 とは、ある変数yを他の𝑛個の変数𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛によって説明する関係式
𝑦 = 𝑓(𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛) あるいはこれだけでは説明できない残差項εを含めた、
𝑦 = 𝑓(𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛) + ε
を特定する方法論で、特に 𝑓(𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛) = 𝑏 + 𝑎1𝑥1+ ⋯ + 𝑎𝑛𝑥𝑛 で表される場合に限定 したものを線形回帰という。
説明される変数 y を説明する変数が x 1 つだけの場合に単回帰と呼ばれる。
線形回帰の単回帰は
𝑦 = 𝑏 + 𝑎𝑥
という関係式を仮定して、すでに得られている 𝑙 個の (𝑥, 𝑦) のデータの組
(𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑙, 𝑦𝑙) から切片 𝑏と傾き𝑎 を特定するものである。この関係はあくまでも仮 定であり、正しい場合でも得られているデータが 𝑙 個の有限な手がかりしかないことから、特 定された 𝑏 と 𝑎 が真の値 (𝑏∗, 𝑎∗) からずれてしまう。その意味でパラメータをできるだけ誤 差を少なくして特定する試みを推定と呼び、特定された値 (𝑏∗, 𝑎∗) は推定値と呼ばれる。
パラメータの推定は適当な目的関数を設定したうえで最適化によって決定される。最もよく 使われる基準が最小二乗法と呼ばれるもので、単回帰モデルに対する最小二乗法は、
min𝑏,𝑎 {∑(𝑏 + 𝑎𝑥𝑖− 𝑦𝑖)2
𝑙
𝑖=1
: 𝑎, 𝑏 ∈ 𝑅} (3.1)
という制約なしの最小化問題の解 (𝑏∗, 𝑎∗) を用いて、線形関数 𝑦 = 𝑏∗+ 𝑎∗𝑥 を推定する。
(3.1)の目的関数は、各データ 𝑥𝑖 に対する関数値 𝑏 + 𝑎𝑥𝑖 と実際の値 𝑦𝑖 の差(残差)
𝜀𝑖 ≔ 𝑦𝑖− (𝑏 + 𝑎𝑥) を 2 乗した 𝜀𝑖2をすべてのデータについて和をとった、∑𝑙𝑖=1𝜀𝑖2 である。これ は 1 つの直線に対してデータと縦方向( 𝑦 方向)の差を一辺とする正方形の面積であるため、
(3.1)はこのような面積の合計値が一番小さくなるような面積を見つける問題である。
なお、推定する線形関数 𝑦 = 𝑏 + 𝑎𝑥 としては、 𝑥 が変数で 𝑏, 𝑎 はパラメータであるが、回 帰分析では関数形を特定するのが目的であるため、最小化問題(3.1)では、パラメータ 𝑏, 𝑎 が決 定係数となり、(𝑥𝑖, 𝑦𝑖) はデータとして与えられている。
6
先程述べた単回帰から、重回帰分析への拡張は簡単である。回帰分析とは、ある変数yを他の
𝑛個の変数𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛によって説明する関係式を特定する方法論と先程も述べた。重回帰分
析は、説明変数(独立変数)と呼ばれる変数𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛 が、単回帰では1つであったことに対 し、多数ある。つまり、単回帰は 𝑦 と 𝑥 の間の関係式が求められ、さらに重回帰なら 𝑦 と 𝑥1 , 𝑥2, 𝑥3, … 𝑥𝑛の間の関係式を求めることができる手法である。
3.2 エクセルを用いた回帰分析
(3.1)の最小化問題は凸な 2 次関数の制約なし最小化問題となるため、Excel ソルバーでも非 線形評価(NLP)用の「GRG」アルゴリズムを用いて停留点を見つけると最適解を得る。しか し、この問題は解析的に解けることが知られていて、ソルバーを用いるまでもない。Excel で は「データ分析」アドインの「回帰分析」を用いることで簡単に計測できるばかりではなく、
推定値に関する様々な統計的な情報をまとめて得ることができる。データが表 3-1 のようにセ ル範囲 A1:B32 に与えられていたとする。列 A にはシャツの売り上げ数(個)、列 B には最高気温 (℃)、行 1 にはそれぞれのタイトルが入っている。
表 3-1 回帰分析データ例
7
回帰分析ダイアログボックスに以下のようにデータ範囲を入力し、必要に応じてチェックを 入れる。
・「入力 Y 範囲」としてセル範囲 A1:A32 を指定
・「入力 X 範囲」としてセル範囲 B1:B32 を指定
・指定した範囲にデータのタイトルを含むために、「ラベル」にチェックを入れる これにより、タイトルを分析対象とせずに指定した範囲のラベルとなる
・「出力オプション」では分析結果を出力する場合を選択することができる ここでは新規のワークシートを選択した。
・「残差」と「正規確率」のすべての項目にチェックをしておくと追加的な情報が得る ことができる
OK をクリックすると分析結果が出力される。出力結果は表 3-2 に示す。
図 3-1 回帰分析ダイアログボックス
8
表 3-2 分析結果例
セル B17:B18 をみると、切片の係数 𝑏 が -9.26256、平均気温 𝑥 の係数 𝑎 が 0.681309 と出力 されているため 7、 𝑦 = 𝑏 + 𝑎𝑥 に代入して 𝑦 = −9.26256 + 0.681309𝑥 という関係式が推定さ れたということになる。
セル B5 は、セル B4 の相関係数 R の 2 乗の重決定係数 R2 を示している。これは、
𝑦𝑖 , 𝑖 = 1, … , 𝑙 の分散のうち、モデルの部分𝑏∗+ 𝑎∗𝑥𝑖, 𝑖 = 1, … , 𝑙 の分散でどれくらい説明できる かを 0 以上 1 以下の数値で示していて、1 に近いほど回帰直線の当てはまりが良いことを表 す。数学的な性質として推定に使用するパラメータ( 𝑏, 𝑎 )の数が多いほど、この値は大きくな ってしまうことから、パラメータの増えるほど小さい値になるように補正をかけたものがセル B6 の補正 R2 である。今回は 0.5 をこえているので、関係性があるということがわかる。
セル E17:E18 の P-値はモデルが正規性の過程を満たしていることを前提として、推定パラメ
ータ( 𝑏, 𝑎 )が 0 である場合に、推定された値(𝑏∗, 𝑎∗)をとる確率を表している。したがって、P-
値がものすごく低い場合には、該当の推定値が 0 でないとみなす。今回 P-値が 0.05 以下であ ったため、有意な結果であると言える。
9
「回帰分析」ダイアログボックスで「観測値のグラフの作成」をチェックしておくと、
図 3-2 のように、𝑥 と 𝑦 のデータの散布図と、最小二乗法によって得られた回帰直線上の点が 描画される。
-2 0 2 4 6 8 10 12 14
0 5 10 15 20 25 30
シャツの売り上げ数(個)
平均気温(℃)
平均気温(℃) 観測値グラフ
シャツの売り上げ数(個)
予測値: シャツの売り上げ数(個)
図 3-2 観測値グラフ
また、「回帰分析」ダイアボックスにて「残差グラフの作成」や「正規確率グラフの作成」に ちぇくを入れておけば、図 3-3 のような 𝑥 データに対する残差や、図 3-4 に表した 𝑦 データの 分布と正規分布との分移転比較が出力される。
10
-5 -4 -3 -2 -1 0 1 2 3 4 5
0 5 10 15 20 25 30
残差
平均気温(℃)
平均気温(℃) 残差グラフ
図 3-3 残差グラフ
0 2 4 6 8 10 12 14
0 20 40 60 80 100 120
シャツの売り上げ数(個)
サンプル百分位数
正規確率グラフ
図 3-4 正規確率グラフ
11
第4章
データマイニング
4.1 データマイニングとは
データマイニングとは、統計的手法を用いて、様々なデータの中から各情報の相関や法則性な どを探し出すための分析技術・手法である。例えば、顧客データを利用すれば購買履歴から商 品の併売傾向を探し出すことができる。例えば、過去の購買履歴から「おむつを買った客はビ ールもよく買う」「雨の日は肉の売り上げがいい」といったようなデータの関連性を発見する ことができる。そこで発見された相関関係を利用し、おむつとビールを並べて置けば売り上げ 増加が見込める、雨の日に肉のセールを行えば…といった考えを作ることができる。得られる データが正しいかの精度はデータマイニングを行った者のスキルに依存してしまうが、良い情 報を探し出すことが出来れば、施策に無駄な情報を省いたり、潜在的なニーズを掘り起こすこ とが可能である
・データマイニングの手順
1. データを解析可能な形に整える
データマイニングで使用するデータの多くは解析することを目的に集められたも のではないため、解析を行う前にデータ整理をする必要がある。ここでいう「デ ータ整理」は、値の入っていないデータの補完や例外ケースの除外、数値の単位 をそろえる、などの作業のことである。
2. 解析を行う
3. ルールやパターンなどを見つける
4. 得られたデータやパターンを有効的に活用する
4.2 アソシエーション分析とは
アソシエーション分析とは、アソシエーションルールと呼ばれる事象間のつながりの強さに 関する規則を、知識として発見する分析で、データマイニングの手法の 1 つである。ある事象 が発生した時に、別な事象が発生する事後確率が高いような事象の組み合わせを求める。
12
例えばスーパーマーケットのデータに対しては、どの商品が同時に購入されているか、どの 組み合わせが頻繁に現れるか、というルールを抽出することが出来る。この分析の結果、乳製 品がパンと同時購入される頻度が高いことが分かれば、売り場を近くに置いたり、パンの購入 者に対して、乳製品の割引くキャンペーンを行うことで、売り上げ増加を期待することができ る。アソシエーション分析の中でも、POS や購買データの分析を行う手法をバスケット分析と 呼ぶ。この分析では、商品の組み合わせなど、頻出する何かの関連、規則を相関ルールとして 表す。
相関ルールの評価指標
データベースの中から相関ルールを検出する際、評価指標が必要となる。多く用いられ ている指標として以下の 3 つがある。
信頼度(confidence)
仮にルールの前提が起きたと仮定したときに、結論が起こる確率。この数値が高 いほどルールの前提と結論の結びつきが高い。
支持度(support)
ルールの前提と結論が同時に起こる確率。つまり、「ルールそのものが起こる確 率」。重要なルールは、信頼度だけでなく、サポートもそれなりに大きいことが 求められる
リフト(lift)
前提または結論のどちらかのデータの中での出現回数が非常に多い場合に前提と 結論の間の結びつきの強さを見ることが出来る。
𝐿𝑖𝑓𝑡(𝐴 → 𝐵) =𝑃(𝐵 𝐴⁄ )
𝑃(𝐵)
例 1)𝐿𝑖𝑓𝑡(パン→乳製品) =パンを買った時に乳製品を購入する確率 乳製品を購入する確率
例 2)𝐿𝑖𝑓𝑡(店員がシャツ着用→シャツ) =店員がシャツを着用していた時にシャツを購入する確率 シャツを購入する確率
リフトは、前提が存在することで結論が起こる確率がどれだけ大きくなるのかの 比を表しており、リフトが 1 の場合は、まったく前提の存在が効いていないこと になる。リフトが 1 より大きければ大きいほど、その効果は大きくなる。一方、
リフト値が 1 より小さい場合には、前提が結論を疎外してることがわかる。
今回この分析を行う際に、NTT データ数理システムの Visual Mining Studio(VMS)というソフト を利用した。
13
第5章
気象データと売り上げの相関
5.1 気温と売れる商品の相関性
本章では、気象データと関わりの深そうな商品の売り上げ個数についての相関性をもとめる。
まず、表 2.1 に表した中でも、暖かい日に売れたと感じたシャツ類と平均気温について考え る。
表 5-1 シャツの売り上げ個数と平均気温
日付 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
曜日 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月
平均気温 23.1 22.7 24.9 24 26 21.4 21.2 22.3 18.4 17.6 17.9 16.5 15.6 16.7 17.4 17.5 20.9 20.8 21.9 18.2 16.7 18.1 14.9 14 19.1 19 12.2 15.5 11.9 14.3
表 5.1 では、上段から日付、曜日、平均気温、シャツの売り上げ個数を表している。これをグ ラフにしたものが下の図 5.1 である。横軸が日付で、縦軸が温度とシャツの売り上げ個数とな
っている。
0 5 10 15 20 25 30
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
平均気温とシャツの売上個数
シャツ 平均気温
図 5-1 平均気温とシャツの売り上げ個数の関係 1
2 つの線の動きが似ていることから、さらに深く関係を見出すために、別のグラフで表した。
14
y = 0.6813x - 9.2626
-2 0 2 4 6 8 10 12 14
0 5 10 15 20 25 30
シャツの売り上げ個数
平均気温
図 5-2 平均気温とシャツの売り上げ個数の関係 2
図 5.2 では縦軸にシャツの売り上げ個数、横軸に平均気温をとり、それぞれの気温ごとのシャ ツの売り上げ個数を示している。気温が高いほうが売り上げ個数も高いことが多い。ここか ら、3 章で説明した回帰分析を行い平均気温とシャツの売り上げ個数を y=0.6813x-9.2626 とい う一次式で近似を得た。その結果を次に示す
15
表 5-2 平均気温とシャツの売り上げ個数の単回帰分析結果
概要
回帰統計 重相関 R 0.735445 重決定 R2 0.540879 補正 R2 0.524482 標準誤差 2.331334
観測数 30
分散分析表
自由度 変動 分散 観測され
た分散比 有意 F
回帰 1 179.2834 179.2834 32.98611 3.66E-06 残差 28 152.1833 5.435118
合計 29 331.4667
係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 -9.30123 2.263454 -4.10931 0.000313 -13.9377 -4.66475 -13.9377 -4.66475 平均気温 0.68314 0.118945 5.743353 3.66E-06 0.439494 0.926787 0.439494 0.926787
残差出力 確率
観測値 予測値:
シャツの売り 上げ個数
残差 標準残差 百分位数
シャツの 売り上げ 個数 1 6.479316 -1.47932 -0.64577 1.666667 0
2 6.20606 3.79394 1.656174 5 0
3 7.708969 0.291031 0.127044 8.333333 0 4 7.094142 2.905858 1.268498 11.66667 0
5 8.460423 4.539577 1.981668 15 0
6 5.317977 3.682023 1.607319 18.33333 1 7 5.181349 -1.18135 -0.5157 21.66667 1
8 5.932804 -1.9328 -0.84373 25 1
9 3.268556 -0.26856 -0.11723 28.33333 1 10 2.722044 0.277956 0.121337 31.66667 2 11 2.926986 -0.92699 -0.40466 35 2 12 1.970589 0.029411 0.012839 38.33333 2 13 1.355763 2.644237 1.154293 41.66667 2 14 2.107217 -2.10722 -0.91987 45 2 15 2.585416 0.414584 0.180979 48.33333 2 16 2.65373 -1.65373 -0.7219 51.66667 3 17 4.976407 -0.97641 -0.42623 55 3 18 4.908093 -2.90809 -1.26947 58.33333 3 19 5.659547 -3.65955 -1.59751 61.66667 3 20 3.131928 -1.13193 -0.49412 65 4 21 2.107217 -2.10722 -0.91987 68.33333 4 22 3.063614 -2.06361 -0.90083 71.66667 4 23 0.877565 4.122435 1.799573 75 4 24 0.262738 1.737262 0.758369 78.33333 5 25 3.746754 -0.74675 -0.32598 81.66667 5
26 3.67844 -3.67844 -1.60575 85 8
27 -0.96691 1.966915 0.85862 88.33333 9 28 1.287449 -0.28745 -0.12548 91.66667 10 29 -1.17186 1.171857 0.511552 95 10 30 0.46768 -0.46768 -0.20416 98.33333 13
16
-2 0 2 4 6 8 10 12 14
0 5 10 15 20 25 30
シャツの売り上げ個数
平均気温
平均気温 観測値グラフ
シャツの売り上げ個数 予測値: シャツの売り上げ個数
図 5-3 観測値グラフ(シャツ)
予測値のグラフは図 5-3 のようになった。表 5-2 では決定係数 R2 が 0.54 と、0.5 以上の高い 数値となった。そのことからこの 2 つの間に相関があることが分かった。次に、寒くなったと 感じた日に何が売れていたか考えたところ、表 2.1 で記した中でも、カーディガンやアウタ ー、マフラーなどの羽織ものの売り上げが上がったように思えた。そのことから今度は平均気 温と羽織ものの相関や最低気温と羽織ものの相関性を、それぞれ求める。
表 5-3 羽織ものの売り上げ個数と平均気温
日付 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
曜日 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火
平均気温 23.1 22.7 24.9 24 26 21.4 21.2 22.3 18.4 17.6 17.9 16.5 15.6 16.7 17.4 17.5 20.9 20.8 21.9 18.2 16.7 18.1 14.9 14 19.1 19 12.2 15.5 11.9 14.3 13.4
羽織もの 8 2 5 3 4 11 4 6 14 11 18 14 17 7 10 13 20 5 5 15 17 7 21 18 10 16 40 13 20 24 14
17
0 5 10 15 20 25 30 35 40 45
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1
羽織ものと平均気温
平均気温 羽織もの
図 5-4 羽織ものの売り上げ個数と平均気温の関係 1
変動はあるが、全体的に温度が高い時に羽織ものはあまり売れず、低い時に売れている。こち らも関係を別のグラフで示すと図 5-5 のようになり、平均気温と羽織ものの売り上げ個数の相 関は y = -1.6827x + 44.049 の式で近似できることがわかる。
y = -1.6827x + 44.049
0 5 10 15 20 25 30 35 40 45
0 5 10 15 20 25 30
羽織りもの売数
平均気温
図 5-5 羽織ものの売り上げ個数と平均気温の関係 2 ここでも回帰分析を行い、その結果を次に示す。
18
表 5-4 羽織ものの売り上げ個数と平均気温の単回帰分析結果
概要
回帰統計 重相関 R 0.74869 重決定 R2 0.560537 補正 R2 0.545384 標準誤差 5.299208
観測数 31
分散分析表
自由度 変動 分散 観測され
た分散比 有意 F
回帰 1 1038.73 1038.73 36.9897 1.27E-06 残差 29 814.3666 28.08161
合計 30 1853.097
係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 42.07752 4.93203 8.531482 2.13E-09 31.99039 52.16466 31.99039 52.16466 平均気温 -1.58928 0.261312 -6.08192 1.27E-06 -2.12372 -1.05483 -2.12372 -1.05483
残差出力 確率
観測値 予測値:
羽織もの 残差 標準残差 百分位数 羽織もの
1 5.365253 2.634747 0.505696 1.612903 2 2 6.000963 -4.00096 -0.76792 4.83871 3 3 2.504557 2.495443 0.478959 8.064516 4 4 3.934905 -0.9349 -0.17944 11.29032 4 5 0.756353 3.243647 0.622564 14.51613 5 6 8.067022 2.932978 0.562937 17.74194 5 7 8.384877 -4.38488 -0.8416 20.96774 5 8 6.636674 -0.63667 -0.1222 24.19355 6 9 12.83485 1.165151 0.223631 27.41935 7 10 14.10627 -3.10627 -0.5962 30.64516 7 11 13.62949 4.370513 0.838848 33.87097 8 12 15.85447 -1.85447 -0.35594 37.09677 10 13 17.28482 -0.28482 -0.05467 40.32258 10 14 15.53662 -8.53662 -1.63846 43.54839 11 15 14.42412 -4.42412 -0.84914 46.77419 11
16 14.2652 -1.2652 -0.24283 50 13
17 8.86166 11.13834 2.13782 53.22581 13 18 9.020587 -4.02059 -0.77169 56.45161 14 19 7.272384 -2.27238 -0.43615 59.67742 14 20 13.1527 1.847296 0.354558 62.90323 14 21 15.53662 1.463382 0.280872 66.12903 15 22 13.31163 -6.31163 -1.21141 69.35484 16 23 18.39731 2.602686 0.499542 72.58065 17 24 19.82766 -1.82766 -0.35079 75.80645 17 25 11.72236 -1.72236 -0.33058 79.03226 18 26 11.88128 4.118716 0.790519 82.25806 18 27 22.68836 17.31164 3.322683 85.48387 20 28 17.44375 -4.44375 -0.8529 88.70968 20 29 23.16514 -3.16514 -0.6075 91.93548 21 30 19.35088 4.64912 0.892322 95.16129 24 31 20.78123 -6.78123 -1.30154 98.3871 40
19
ここでも決定係数 R2 が 0.56 と、0.5 以上であったため、平均気温と羽織ものの売れ行きの間 に相関があることが分かった。また、平均気温に対する羽織ものの売り上げ個数の予測値を次 の図 5-6 で示す。
図 5-6 観測値グラフ(平均気温と羽織もの)
また、今回の羽織ものは寒くなった時に欲しくなるものであるため、最低気温との相関も求め た。
表 5-5 羽織ものの売り上げ個数と最低気温
日付 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
曜日 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火
最低気温 18.6 20.1 19.7 21.5 21.4 19 18.2 18.6 17.4 16.2 13.7 15.3 12.6 11.8 12.7 15.7 16.7 18.4 17 15.4 14.7 14.7 11.9 10 12.6 13.2 10.1 11.6 9.6 9.8 11.7 羽織もの 8 2 5 3 4 11 4 6 14 11 18 14 17 7 10 13 20 5 5 15 17 7 21 18 10 16 40 13 20 24 14
0 5 10 15 20 25 30 35 40 45
0 5 10 15 20 25 30
羽織もの
平均気温
平均気温 観測値グラフ
羽織りもの 予測値: 羽織もの
20
図 5-7 羽織ものの売り上げ個数と最低気温の関係 1
y = -1.6056x + 37.124
0 5 10 15 20 25 30 35 40 45
0 5 10 15 20 25
羽織もの売数
最低気温
図 5-8 羽織ものの売り上げ個数と最低気温の関係 2
図 5-7 や表 5-5 をみると、誤差はあるが、やはり最低気温との動きも真逆の低い時に羽織もの が売れるようになっていた。よって先ほどと同じように最低気温との関係図は図 5-8 のように 表せ、y=-1.6056x+37.124 の一次式に近似できる。ここでも回帰分析を行った。その結果を次 に示す。
0 5 10 15 20 25 30 35 40 45
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
羽織ものと最低気温
最低気温 羽織もの
21
表 5-6 羽織ものの売り上げ個数と最低気温の単回帰分析結果
概要
回帰統計 重相関 R 0.707765 重決定 R2 0.500931 補正 R2 0.483722 標準誤差 5.647163
観測数 31
分散分析表
自由度 変動 分散 観測され
た分散比 有意 F
回帰 1 928.2736 928.2736 29.1082 8.46E-06 残差 29 924.8231 31.89045
合計 30 1853.097
係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 36.38293 4.515186 8.057903 6.92E-09 27.14834 45.61752 27.14834 45.61752 最低気温 -1.56602 0.290261 -5.3952 8.46E-06 -2.15967 -0.97237 -2.15967 -0.97237
残差出力 確率
観測値 予測値:
羽織もの 残差 標準残差 百分位数 羽織もの
1 7.255035 0.744965 0.134174 1.612903 2 2 4.906011 -2.90601 -0.52339 4.83871 3 3 5.532418 -0.53242 -0.09589 8.064516 4 4 2.713589 0.286411 0.051585 11.29032 4 5 2.870191 1.129809 0.203487 14.51613 5 6 6.628629 4.371371 0.787316 17.74194 5 7 7.881442 -3.88144 -0.69908 20.96774 5 8 7.255035 -1.25504 -0.22604 24.19355 6 9 9.134255 4.865745 0.876356 27.41935 7 10 11.01347 -0.01347 -0.00243 30.64516 7 11 14.92851 3.071486 0.553197 33.87097 8 12 12.42289 1.577112 0.284049 37.09677 10 13 16.65113 0.348869 0.062834 40.32258 10 14 17.90394 -10.9039 -1.96388 43.54839 11 15 16.49453 -6.49453 -1.16971 46.77419 11 16 11.79648 1.203518 0.216762 50 13 17 10.23047 9.769534 1.759564 53.22581 13 18 7.568239 -2.56824 -0.46256 56.45161 14 19 9.760661 -4.76066 -0.85743 59.67742 14 20 12.26629 2.733714 0.492362 62.90323 14 21 13.3625 3.637502 0.655141 66.12903 15 22 13.3625 -6.3625 -1.14593 69.35484 16 23 17.74734 3.252658 0.585827 72.58065 17 24 20.72277 -2.72277 -0.49039 75.80645 17 25 16.65113 -6.65113 -1.19792 79.03226 18 26 15.71152 0.288478 0.051957 82.25806 18 27 20.56617 19.43383 3.500174 85.48387 20 28 18.21715 -5.21715 -0.93965 88.70968 20 29 21.34918 -1.34918 -0.243 91.93548 21 30 21.03598 2.964024 0.533842 95.16129 24 31 18.06055 -4.06055 -0.73133 98.3871 40
22
ここでも決定係数 R2 が 5 以上であり、相関があるといえるが、平均的な気温のほうがわずかに 高い数値であったため、最低気温より、平均気温のほうが相関が高いことが分かった。また、
予測値のグラフを図 5-9 に示す。
0 5 10 15 20 25 30 35 40 45
0 5 10 15 20 25
羽織もの
最低気温
最低気温 観測値グラフ
羽織もの 予測値: 羽織もの
図 5-9 観測値グラフ(羽織ものと最低気温)
以上の結果から、羽織ものやシャツは平均気温との関係性が高いことが分かった。しかし、だ んだん寒くなってくると売れる羽織ものが、最低気温より平均気温との関わりの方が深いとい う結果になった。そこで、「寒いから売れた」という考えから、「寒くなったから売れた」と 考えを転換し、前日との温度差についても分析した。
表 5-7 羽織ものの売り上げ個数と平均気温と前日との温度差
日付 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
曜日 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火
平均気温 23.1 22.7 24.9 24 26 21.4 21.2 22.3 18.4 17.6 17.9 16.5 15.6 16.7 17.4 17.5 20.9 20.8 21.9 18.2 16.7 18.1 14.9 14 19.1 19 12.2 15.5 11.9 14.3 13.4 温度差 3.4 -0.4 2.2 -0.9 2 -4.6 -0.2 1.1 -3.9 -0.8 0.3 -1.4 -0.9 1.1 0.7 0.1 3.4 -0.1 1.1 -3.7 -1.5 1.4 -3.2 -0.9 5.1 -0.1 -6.8 3.3 -3.6 2.4 -0.9
羽織もの 8 2 5 3 4 11 4 6 14 11 18 14 17 7 10 13 20 5 5 15 17 7 21 18 10 16 40 13 20 24 14
23
-10 0 10 20 30 40 50
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 1
温度差と羽織ものの売り上げ個数
温度差 羽織もの
図 5-10 羽織ものの売り上げ個数と前日との温度差の関係 1
y = -1.3873x + 12.363
0 5 10 15 20 25 30 35 40 45
-8 -6 -4 -2 0 2 4 6
羽織ものの売り上げ個数
温度差
図 5-11 羽織ものの売り上げ個数と前日との温度差の関係
24
表 5-7 や図 5-10 をみると関係があるように思えるが、図 5-11 の関係図からは関係性が感じら れなかった。
5.2 前日との温度差と羽織ものとの関係
自らがストールなどを不意に買ってしまうときを考えた。前日よりも寒くなったと感じたこ とだけでなく、今寒くて耐えられないと感じたときのこの 2 つどちらも考えられた。よって、
この気温に関する 2 つと、羽織ものの売れ行きについての関係性を図るため、重回帰分析をし た。その結果を表 5-8 に、そこから得られた予測値のグラフを図 5-12 に示した
0 5 10 15 20 25 30 35 40 45
0 5 10 15 20 25 30
羽織もの
平均気温
平均気温 観測値グラフ
羽織りもの 予測値: 羽織りもの
図 5-12 重回帰分析の観測値グラフ(羽織もの)
25
表 5-8 羽織ものの売り上げ個数と平均気温、前日との温度差の重回帰分析結果
概要
回帰統計 重相関 R 0.769974 重決定 R2 0.592859 補正 R2 0.563778 標準誤差 5.190895
観測数 31
分散分析表
自由度 変動 分散 観測され
た分散比 有意 F
回帰 2 1098.626 549.3128 20.38615 3.44E-06 残差 28 754.4711 26.9454
合計 30 1853.097
係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 38.87658 5.286787 7.353536 5.24E-08 28.04709 49.70607 28.04709 49.70607 平均気温 -1.42287 0.279247 -5.09538 2.14E-05 -1.99488 -0.85086 -1.99488 -0.85086 気温差 -0.58636 0.393287 -1.49092 0.147163 -1.39197 0.219252 -1.39197 0.219252
残差出力 確率
観測値 予測値:
羽織もの 残差 標準残差 百分位数 羽織もの
1 4.014723 3.985277 0.79469 1.612903 2 2 6.812039 -4.81204 -0.95955 4.83871 3 3 2.157194 2.842806 0.566874 8.064516 4 4 5.255492 -2.25549 -0.44976 11.29032 4 5 0.709312 3.290688 0.656185 14.51613 5 6 11.12448 -0.12448 -0.02482 17.74194 5 7 8.829068 -4.82907 -0.96295 20.96774 5 8 6.501645 -0.50165 -0.10003 24.19355 6 9 14.98263 -0.98263 -0.19594 27.41935 7 10 14.30321 -3.30321 -0.65868 30.64516 7 11 13.23135 4.768651 0.9509 33.87097 8 12 16.22018 -2.22018 -0.44272 37.09677 10 13 17.20758 -0.20758 -0.04139 40.32258 10 14 14.4697 -7.4697 -1.48951 43.54839 11 15 13.70824 -3.70824 -0.73945 46.77419 11 16 13.91777 -0.91777 -0.18301 50 13 17 7.145031 12.85497 2.563365 53.22581 13 18 9.339579 -4.33958 -0.86534 56.45161 14 19 7.070792 -2.07079 -0.41293 59.67742 14 20 15.14993 -0.14993 -0.0299 62.90323 14 21 15.99424 1.005761 0.200555 66.12903 15 22 12.30178 -5.30178 -1.05721 69.35484 16 23 19.55221 1.447788 0.288698 72.58065 17 24 19.48416 -1.48416 -0.29595 75.80645 17 25 8.709379 1.290621 0.257358 79.03226 18 26 11.90074 4.09926 0.817419 82.25806 18 27 25.50485 14.49515 2.890427 85.48387 20 28 14.88715 -1.88715 -0.37631 88.70968 20 29 24.05536 -4.05536 -0.80866 91.93548 21 30 17.12231 6.877685 1.371455 95.16129 24 31 20.33788 -6.33788 -1.26382 98.3871 40
26
決定係数 R2 は 0.59 で、平均気温と羽織ものについての単回帰分析で出た数値よりもわずかだ が、0.03 高い数値となった。これにより、羽織ものは平均気温との関係性だけでなく、さらに 気温の前日比が関係することが分かった。
よって羽織ものは、気温が低い日に売り上げが伸び、それが前日より寒い場合それ以上に売り 上げが上がるという相関性を得ることが出来た。