• 検索結果がありません。

博士学位申請論文審査報告

N/A
N/A
Protected

Academic year: 2021

シェア "博士学位申請論文審査報告"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

平成17年10月4日

博士学位申請論文審査報告

早稲田大学大学院 経済学研究科委員長 森 映雄 殿

審査委員会

主任審査委員 野口 和也 審査委員 博士(イエール大学) 小暮 厚之 審査委員 博士(筑波大学) 近藤 康之 審査委員 西郷 浩 論文提出者 樋田 勉

提出論文

「ノンパラメトリック・スムージング理論とその応用」

論文提出日 2005年7月11日

審査判定:

上記論文について審査委員会は論文提出者に対する口頭試問(2005年9月2日)を実施したうえで,

慎重に審査をおこなった.その結果,下記のとおり全員一致で上記論文を博士学位論文に値するものと の結論を得た.

1. 論文の構成と概要

--- 1 はじめに

2 多峰性検定を用いた「平成9 年全国物価統計調査」の価格分布についての検討 2.1 価格分布の多峰性検定

2.1.1 電気冷蔵庫(指定商標B 銘柄番号147 東芝GR-M40K) の価格分布 2.1.2 養毛剤(指定商標A 銘柄番号293 サクセス薬用トニック) の価格分布

2.1.3 ビール(指定商標A 銘柄番号135 サッポロ<生>黒ラベル24 缶) の価格分布 2.1.4 即席カレー(指定商標A 銘柄番号95 ハウスバーモントカレー) の価格分布 2.2 おわりに

2.3 補論

2.3.1 Silverman 検定

2.3.2 Fisher, Mammen and Marron の検定 3 多峰性検出のための視覚的方法

3.1 はじめに

3.2 「全国物価統計調査」価格分布の分析

3.2.1 即席カレー(指定商標A 銘柄番号95 ハウスバーモントカレー) の価格分布

3.2.2 パーソナルコンピュータ(指定商標A 銘柄番号251 NEC PC9821 NW133/D14) の価格分 布

(2)

3.2.3 ビール(指定商標A 銘柄番号134 サッポロ<生>黒ラベル1 缶,指定商標A 銘柄番号135 サッポロ<生>黒ラベル24 ) の価格分布

3.3 二変量モード・フォレスト

3.3.1 二変量モード・フォレストの作成

3.3.2 Wand and Jonesの二次元混合型正規分布への適用

3.3.3 標本サイズの影響についての検討

3.3.4 間欠泉データへの適用:

3.4 「全国物価統計調査」の二次元価格分布分析への適用可能性: 3.4.1 ビール1 缶,ビール24 缶の擬似価格データの作成: 3.4.2 電気冷蔵庫指定商標A,B の擬似価格データの作成: 3.5 おわりに:

3.6 補論:

4 有限母集団における累積分布関数の推定        4.1 はじめに

4.2 分布関数推定量の精度の検討 4.2.1 推定量の精度

4.2.2 母集団の定義 4.2.3 精度の比較 4.2.4 条件付き性質:

4.3 ジャックナイフ分散推定量の精度の検討

4.3.1 ジャックナイフ分散推定量

4.3.2 分散推定量の精度 4.3.3 母集団の定義 4.3.4 精度の比較 4.3.5 条件付き性質 4.4 おわりに

4.5 補論

4.5.1 Horvitz-Thompson 推定量

4.5.2 Chambers and Dunstan の推定量: 4.5.3 Rao, Kovar, and Mantel の推定量 4.5.4 Wang and Dorfman の推定量 4.5.5 Kuo の推定量:

4.5.6 Kuk の推定量

4.5.7 Dorfman and Hall の推定量:

4.5.8 Chambers, Dorfman, and Wehrly の推定量 5 おわりに       

--- 本論文ではノンパラメトリック・スムージング理論の一つである,ノンパラメトリック・カーネル推 定とその応用について取り上げたものである.カーネル推定は,観測値の背後に滑らかな関数が存在す ることを仮定し,その関数を推定する方法であり,密度推定や回帰関数の推定に利用される.そして,

カーネル密度推定は密度関数を推定するための方法で,密度関数の形を視覚的に把握することや,モー ドの数や位置を調べるためにも利用できる.カーネル密度推定量のモード数はバンド幅の値によって変 化する.カーネル関数として,正規密度関数を利用すると,推定値に表れるモードの数は,バンド幅の 非増加関数になることが明らかにされている.この性質を利用して,分布のモードの数を検定する多峰 性検定が提案されている.

2 章:多峰性検定を用いた「平成9 年全国物価統計調査」の価格分布についての検討

(3)

2章では「平成9年全国物価統計調査」の個票データから,銘柄が指定されている品目について,多 峰性検定の適用可能性の検討と多峰性の要因分析がおこなわれている.多峰性検定としてSilverman検 定,Fisher et al. の検定を利用し,Silverman検定のブートストラップの段階で,標本抽出構造を模し たリサンプリングを取り入れた検定をおこなっている.多峰性検定の結果,価格分布の多くは多峰分布 であった.多峰性検定によって価格分布のモード数を決めることができる場合,価格分布のヒストグラ ムを描く際に,この結果を利用し,多峰性検定のモード数とヒストグラムのモード数が等しくなるよう にすることは,多峰性検定の利用法の一つとして考えられるとしている.また,多峰性の要因として,

業態や「ディスカウント販売」の有無など様々な属性を利用して層別を行うことにより,多峰性を取り 除くことができることが示されている.価格分布には複数のモードがあり,左右に歪みのあるケースも 多く見られることから,著者は,価格について議論する際には平均価格だけでなく,分位点や分布関数 を利用することが望ましいとしている.

 本章の分析から,1990年代以降出店が活発化した,「ロードサイド」に立地する大規模な「量販専門 店」が経営戦略として「ディスカウント販売」を行い,それぞれの銘柄の平均価格を引き下げるという 傾向が見て取れる.これらの「量販専門店」では広告の実施と価格の関係は小さく,常に安値で販売し ている.大規模店舗であっても,「駅周辺」,「住宅地周辺」や「商店街」に立地する店舗は,「ロードサ イド」に立地する店舗よりも価格が高い傾向があり,特に「スーパー」はこの傾向が強く,集客の容易 さが価格決定に影響を与えていることが考えられる.また,「量販専門店」,「スーパー」では,系列店 舗数が「10〜49 店」の店舗が「10 店舗未満」や,「50店以上」の店舗よりも低価格であるという傾向 も検出されている.「百貨店」はメーカーの希望小売価格周辺で販売しており,業態内の価格のばらつ きは小さい.また,値引き販売を経営戦略としないという点で特徴があるが,「駅周辺」よりも「幹線 道路周辺」の店舗のほうが安い傾向があり,ここでも集客の容易さと価格の関係が考えられると論じて いる.

続いておこなわれている大規模店舗の多峰性の要因分析は,小規模店舗よりも困難であった.これは,

大規模店舗の多くが複数の系列店舗をもち,系列店の本部が低コストで大量に仕入れを行い,経営戦略 によって価格付けが行われることが多いためと著者は考えている.また,他の理由として大規模店舗で は,店舗の立地環境,「ディスカウント販売」の有無,系列店舗数など,本部の経営・出店戦略に関係 すると考えられる属性が,価格形成に影響を与える要因として抽出されていることも示唆している.

 小規模店舗では,「コンビニエンスストア」の価格分布は,他の業態の価格分布と異なる特徴を持つ.

「コンビニエンスストア」の分布は,ほとんどの店舗が同じ価格で,他の業態よりも高く販売している 銘柄が多く,平均価格や分位点推定値の精度は高い.「コンビニエンスストア」は,店舗の立地環境や 競合店の有無による影響は他の業態ほどはっきりと現れないが,「競合店がコンビニエンスストア」の 場合,価格が高い傾向が見られる.また,駐車場がない店舗比率が非常に高い.これらのことから「コ ンビニエンスストア」では,いつでも,すぐにいけるところで,同じものが買えるという利便性が,商 品にサービスとして付加されているためと解釈している.

小規模店舗では「量販専門店」の数は多くはないが,他の業態よりも低価格なケースが多い.「スー

(4)

パー」,「一般小売店」では,経営戦略として「ディスカウント販売」をしているかどうかが,価格形成 の大きな要因となっており,「量販専門店」,「スーパー」では,系列店舗がある店舗は低価格の傾向が あるのに対して,「一般小売店」では,「住宅地周辺」に立地する店舗や,店舗面積が小さい店舗,パー ト・アルバイト比率が低い店舗の価格が高い傾向があり,従来型の小規模な個人商店が多く含まれると 考えている.「一般小売店」では,「競合店が量販専門店」の場合は低価格で,「競合店がコンビニエン スストア」,「競合店が百貨店」の場合は高価格の傾向が見られる.著者は,このように「一般小売店」

では,店舗を取り巻く経営環境が価格形成に大きな影響を与えており,従って,古くからある「一般小 売店」が,「量販専門店」などによる価格破壊など,最近の外部環境の変化にある程度対応してはいる ものの,対応し切れていない,と論じている.

これらの結果から,店舗規模,業態など様々な要因が,店舗の価格形成に影響を与えていることを知 ることができる.本研究では「商業統計調査」で調査が行われている年間商品販売額や商品の仕入れ先 など,価格形成に影響があると考えられる店舗属性のいくつかを利用していない.このような属性を利 用することができれば,店舗の価格形成メカニズムをより詳細に検討できると考えられる.これらの点 が今後の課題である.

3章多峰性検出のための視覚的方法

 カーネル推定量はデータの視覚化に優れており,視覚的データ解析手法の開発へ応用されることも多 い.一次元データのためのモード・ツリー(mode tree),モード・フォレスト(mode forest)は,その代表 的なものである.

第3章では,モード・ツリーとモード・フォレストについて取り上げ,多峰性検定でp値を評価する 際に補助的に利用し,「全国物価統計調査」の価格分布の分析に援用し,価格分布の多峰性の検出と多 峰性の要因の分析がおこなわれている.

 モード・フォレスト,モード・ツリーは一次元データの分析手法であるが,多次元データでは分布の 構造はより複雑になりうるので,多峰性の検討はさらに重要である.著者はモード・フォレストを二次 元に拡張し,二変量モード・フォレストを考案した.「全国物価統計調査」では,一つの店舗で複数の 銘柄価格が調査されている.著者は多峰性検定のp値を解釈する際に,モード・ツリーとモード・フォ レストを援用してビール1缶と24缶,パーソナルコンピュータ,即席カレーの価格分布を分析してい る.モード・ツリーとモード・フォレストは,多峰性検定によってモード数を決定できない銘柄につい ても利用することが可能であり,また,多峰性検定のp値を解釈する際にも有益な情報を提供すること が明らかであるから,多峰性検定と補完的に利用することを推奨している.多峰性検定を利用する場合 に,視覚的な方法を援用することにより,多峰性検定とは異なる角度からデータを見ることができ,デ ータ解析の方法として非常に有益であるとの結論を得ている.

本章で行った価格分布の分析から,大規模店舗では「百貨店」の価格分布は単峰で,販売価格は高く 業態内の散らばりは小さいことが分かる.「百貨店」以外の店舗では,「幹線道路周辺」に立地する店舗 や,「ディスカウント販売」を行っている店舗,「スーパー」,「量販専門店」,「競合店が量販専門店」で ある店舗が低価格の傾向を見て取れる.小規模店舗では,「コンビニエンスストア」の販売価格は高く,

(5)

この業態内での価格のばらつきは非常に小さいのに対し,「コンビニエンスストア」以外の店舗では,「量 販専門店」や「ディスカウント販売」を行っている店舗,「競合店がスーパー」,「競合店が量販専門店」

であるような店舗の販売価格が安い.反対に,店舗面積が狭い店舗,パート・アルバイト比率が低い店 舗,「ディスカウント販売」を行っていない店舗,競合店がない店舗,「住宅地周辺」に立地する店舗の 販売価格は高いことが論じられている.

大規模店舗の価格差の要因は小規模店舗よりも分析が困難である.大規模店舗の多くは,複数の系列 店を持ち,本部が一括して仕入れを行い,経営戦略によって小売価格が決められることが多いためと考 えられる.また,小規模店舗では,競合店の有無やパート・アルバイト比率など,店舗の置かれた環境 によって価格が決められる傾向が強いと考えられる.

3.3節では,モード・フォレストが二次元データを扱うことができるように拡張し,二変量モード・

フォレストが提案されている.二変量モード・フォレストでは二次元カーネル推定量を利用する.作図 手順は以下のとおりである.はじめに大きさnの標本から,大きさkのリサンプリング標本を抽出する.

適当なバンド幅行列Hを用いて二次元のカーネル密度推定を行う.推定した二次元密度推定値のなかで,

分布の山が存在する部分を記録する.これをB回繰り返す.バンド幅行列を一定の範囲内で変化させな がら計算を繰り返すことにより,バンド幅の変化とともに,分布の山が存在する位置がどのように変わ るのかを視覚的に示す.

二次元データについては現在まで多峰性を検定する方法は提案されておらず,視覚的な方法の役割は 大きい.著者は,二変量モード・フォレストが二次元分布の多峰性を検討するための手段としてどの程 度有効であるかを,Wand and Jones (1993)の二次元分布の中からいくつかの分布を選び計算を行って いる.モード・フォレストの計算例からは,この手法が視覚的にモードの位置と数を探るための方法と して,有益であることが明らかになった.また,3.4節では,「全国物価統計調査」の二次元価格分 布を分析するために,二変量モード・フォレストを利用可能であるか,擬似的に価格データを作成し検 討を行っている.3.4節で示された計算結果から,二変量モード・フォレストが二次元価格分布の分 析のために役立つことが期待される.

4章:有限母集団における累積分布関数の推定

「全国物価統計調査」をはじめ多くの経済統計は,標本調査に基づいて作成されている.第4章では,

有限母集団から標本抽出を行う場合に,累積分布関数を推定するための手法について取り上げており,

分布関数の推定量として最も基本的な経験分布関数と,完全な補助変数が利用できる場合の分布関数推 定量の性質を検討している.補助変数が利用できる場合,補助変数と特性値の関係をモデル化して利用 することにより,特性値の母集団分布関数のよりよい推定量を得ることができる場合がある.補助変数 を利用する推定量では,パラメトリックモデルの利用が一般的であるが,モデルの定式化の段階で,パ ラメトリックモデルよりも柔軟なモデルを利用したい場合や,パラメトリックモデルの定式化が失敗し た場合に,定式化の失敗によるバイアスを減らすことができるという意味でロバストな推定量を作成す るために,カーネル推定が利用されている.著者は4章では,カーネル推定を利用する意義について述 べ,カーネル推定を利用する推定量の性質や可能性についても検討している.また,補助変数を利用す

(6)

る分布関数推定量の実際の官庁統計における意義と,厚生労働省「国民生活基礎調査」の所得分布推定 への応用にについて論じている.

有限母集団における累積分布関数推定量の推定精度の評価では,著者は多数の推定量に関してシミュ レーション実験を行い,全体的な精度および分位点における精度,条件付き性質の比較・検討を行って いる.また,主な推定量の分散をジャックナイフ法によって推定することが可能であるかを検討してい る.その結果,分布関数推定量の精度の比較では,補助変数を利用しない推定量は補助変数を利用する 推定量よりも精度が劣ることが示されている.また,条件付きRME( relative mean plot )プロットにお いても,補助変数の母平均を正負の境とする強い負のトレンドを示している.詳細について著者のまと めた点を述べると以下のようになる.

Chambers-Dunstan推定量はモデルの定式化が正しいとき,全体的な精度,分位点における精度,条

件付きRMEともに,最も優れた性質を示した.一方,モデルの定式化が誤っているケースでは,すべ て の 点 で 非 常 に 悪 い 結 果 と な っ た . ノ ン パ ラ メ ト リ ッ ク 型 Chambers-Dunstan 推 定 量 も

Chambers-Dunstan推定量と似た結果を示したが,条件付きRMEは,モデルの定式化が正しい場合で

も負のトレンドを示し,系統的なバイアスの存在を示唆する結果となった.Rao-Kovar-Mantel推定量 は,母集団 (Ⅰ), (Ⅱ)とも,良いパフォーマンスを示した.母集団 (Ⅱ)では,n=50のとき相対的に最 も優れた結果を示したが,標本サイズを大きくしたときの精度の改善はDorfman-Hall推定量,ノンパ ラメトリック型 Rao-Kovar-Mantel推定量ほど見られなかった.Chambers-Dorfman-Wehrly推定量,

ノンパラメトリック型 Rao-Kovar-Mantel 推定量,Dorfman-Hall 推定量は精度,条件付き性質とも

Rao-Kovar-Mantel推定量と同じような結果となった.また,標本サイズを増やしたときの精度の向上

は他の推定量よりも大きい.特にノンパラメトリック型Rao-Kovar-Mantel推定量とDorfman-Hall推 定量は,母集団 (Ⅱ)の 標本サイズ n=200 では,すべての推定量の中で最も精度が高かった.

Wang-Dorman 推定量は本章で扱った母集団では,ウェイト w が 0.9 以上になることが多く,

Chambers-Dunstan 推定量とほぼ同じ結果であった.Kuo 推定量は,精度,条件付き性質ともに,特

に優れた性質は示さず,Dorfman-Hall 推定量の方が良い結果を示す.シミュレーション実験の結果,

モデルの定式化が正しい場合にはChambers-Dunstan推定量が最も優れているが,一般的な状況では,

モデルの失敗の影響を受けにくいRao-Kovar-Mantel推定量,CHAMBERS-DORFMAN-WEHRLY推 定 量,パ ラメ トリッ クモ デルを 利用 しない ノン パラメ トリ ック型 Rao-Kovar-Mantel 推定 量,

Dorfman-Hall推定量などが良いパフォーマンスを示している.

ジャックナイフ分散推定量の比較では,8 種類の分布関数推定量のジャックナイフ分散推定量を作成 し,シミュレーション実験による比較をおこなっている.シミュレーションは design-based,

model-basedの設定のもとでおこなわれ,相対バイアス,安定性,経験カバレッジの観点からの比較が

おこなわれている.design-based推定量のパフォーマンスはシミュレーション方法によって変化するこ とはほとんどなかったが,model-based推定量はmodel-basedシミュレーションではバイアスが小さく,

design-basedシミュレーションではバイアスが大きくなるという傾向が見られ,抽出率を考慮していな

いためと考えられる.

(7)

シミュレーション結果について見ると,補助変数を利用しない推定量とそのジャックナイフ分散推定 量による経験カバレッジは,補助変数を利用する推定量に劣る結果となった.とくに,条件付きカバレ ッジは明確なトレンドを示した.Kuo推定量は無条件の性質,条件付き性質ともに,他の補助変数を利 用 す る 推 定 量 と 比 べ 見 劣 り の す る 結 果 で , 条 件 付 き カ バ レ ッ ジ か ら は ト レ ン ド が 見 ら れ た . Rao-Kovar-Mantel推定量はdesign-basedシミュレーションでは,最もよい結果を示した.このことは,

シ ミ ュ レ ー シ ョ ン で 利 用 し た 母 集 団 が 線 形 モ デ ル の 当 て は め が 適 切 な ケ ー ス で あ り ,

Chambers-Dunstan推定量などmodel-based推定量と異なり抽出率を考慮しているためと考えられる.

Dorfman-Hall 推定量, ノンパラメトリック型 Rao-Kovar-Mantel 推定量などノンパラメトリック型

design-based 推定量は 90%点における精度が相対的に悪いが,無条件の性質,条件付き性質ともに,

全体的によいパフォーマンスを示した.model-basedシミュレーションでは,Chambers-Dunstan推定 量 が 全 体 的 に 最 も よ い 性 質 を 示 し た .Chambers-Dunstan 推 定 量 ,Wang-Dorman 推 定 量 は

model-based シミュレーションと design-based シミュレーションによる結果の差が大きく,シミュレ

ーションを行う際には注意が必要である.

また,ノンパラメトリック・カーネル推定を利用する推定量では,ジャックナイフ分散推定量のバイ アスが大きくなるケースが見られた.特に90%点における精度が悪い.利用した母集団散布図から,90%

点付近ではデータの散らばりが疎らになっていることが分かるので,変数変換によって精度を改善でき る可能性がある.

補助変数を利用する分布関数推定量の分散式の導出が困難な場合もある.ジャックナイフ推定量に関 するシミュレーションでは,ノンパラメトリック法などを利用する複雑な分布関数推定量についても,

ジャックナイフ法を利用して分散を評価できることを明らかにした.また,シミュレーションからは,

Dorfman-Hall 推定量, ノンパラメトリック型Rao-Kovar-Mantel 推定量などの推定量は,無条件,条 件付き性質ともによい性質を示すことが分かる.

2.論文の評価

2.1 予備審査における修正要求への対応

本論文は2004年度の予備審査において,修正要求を求められている.それは,論文全体を(1)全国物価 統計調査への多峰性検定の適用,(2)多峰性検出のための視覚的方法,(3)有限母集団における分布関数 の推定,を中心として再構成し,実証的な内容に改め,必要に応じてシミュレーションを追加・増加する,

などの要求であった.今回提出された論文ではこれらの点はすべて満たされている.

2.2 全体の評価

本論文はノンパラメトリック・スムージング理論の一つである,ノンパラメトリック・カーネル推定 とその応用について取り上げたものであり,全体として優れているばかりでなく,以下に述べるような 貢献を含んでいる.これらの貢献は以下の点に要約することができる.

2章および3章

・カーネル推定を利用する多峰性検定と,視覚的に多峰性を検討する方法を利用し,「全国物価統計調

(8)

査」の価格分布の分析を行い,価格分布の多峰性の主な要因を明らかにしたこと.

・モード・フォレストを2次元データに利用可能になるように拡張した「2変量モード・フォレスト」

を考案し,「全国物価統計調査」の擬似2次元価格分布を作成して,「2変量モード・フォレストが」

実際の経済統計分析の場で有益であるか検討したこと.

・多峰性検定の価格分布への応用はこれまでに前例が見られない.

・多峰性の要因を店舗の属性から抽出しようという研究はこれまでに少なく,かつ有効なアプローチ であると認められる.

・個票利用によるこのような研究はユニークなものである(公表された集計表から価格差の要因分析を 行ったものはある).

4章

・補助変数を利用する分布関数推定量の性質についての考察を主な推定量すべてに対して行い,性質を 比較し,明らかにしたこと.推定量の広範な比較はこれまでにあまり見られない(3,4 種類の比較 は先行研究あり).

・カーネル法を利用するノンパラメトリック型Rao-Kovar-Mantel推定量,Dorfman-Hall推定量にかん するシミュレーションは画期的なものである.

・分布関数のジャックナイフ分散推定量が良い性質を持つことをシミュレーション実験によって明らか にしたこと.Chambers-Dunstan 推定量,Rao-Kovar-Mantel 推定量以外についての研究はこれまで にほとんどおこなわれていない.

これらの点から,審査委員会は本論文が博士学位取得論文としてふさわしいとの結論に達した.

なお,2章の内容は「日本統計学会和文誌」に投稿し,修正条件付きで採択されている.また,3章 および4章は,群馬大学社会情報学部研究論集に査読を経て掲載された樋田氏の論文「カーネル密度推 定による適合度検定(2002)」および「有限母集団における累積分布関数の推定(2003)」を含むもので あることを付け加えておく.

以上

参照

関連したドキュメント

(13) 要指導医薬品を販売し、又は授与す る薬局にあっては、要指導医薬品を販

➂ブランチヒアリング結果から ●ブランチをして良かったことは?

ここから、われわれは、かなり重要な教訓を得ることができる。いろいろと細かな議論を

と歌を歌いながら止まっています。電気きかん車が、おけしようを

大きな要因として働いていることが見えてくるように思われるので 1はじめに 大江健三郎とテクノロジー

他方、今後も政策要因が物価の上昇を抑制する。2022 年 10 月期の輸入小麦の政府売渡価格 は、物価高対策の一環として、2022 年 4 月期から価格が据え置かれることとなった。また岸田

北区で「子育てメッセ」を企画運営することが初めてで、誰も「完成

しかしながら、世の中には相当情報がはんらんしておりまして、中には怪しいような情 報もあります。先ほど芳住先生からお話があったのは