ジニ係数の年次変化による信頼性について
―― ブートストラップによる分析 ――
横 山 佳 充
は じ め に
本稿では,不平等を評価する際に使用する不平等尺度の一つであるジニ係数 を取り上げ,その年次変化による信頼性に関して考察する。我が国における不 平等の評価に関して,不平等度が高まったか否かは,所得および資産の偏在を 語るうえで,重要なテーマであり,その尺度の一つとしてジニ係数が主に用い られているという実態がある。
本来,所得等の不平等を評価するうえで,ジニ係数は唯一の尺度ではなく,
ジニ係数が主に相対的な評価に基づいている尺度であり,必ずしもジニ係数の 値の減少が絶対的な社会厚生の向上を意味するものではないことから,他の尺 度も用いて不平等の評価を多角的に判断することが望ましいと考えられるが,
実際の実証研究の世界ではジニ係数が不平等評価の尺度として重用されてい る⑴。
実際に,国際比較を行う上ではOECD( , )などにおいても用いら れており,通常使用する際にはその計算結果の国際比較や時系列比較を行うこ とはできても,その信頼性に関しては議論されることはほとんどない。これ は,標本自体が大きいと認識されているか,もしくはジニ係数自体も少し複雑 な計算に基づくために,確率変数と意識していないために生じていることも考 えられる。
( ) 尺度に関する議論については,青木( ),Cowell( )およびSen( )を参 照のこと。
第 巻 第 ・ 号 年 月 −
本稿では,日本における『家計調査』の分析データを用いて,ジニ係数の分 布について考察し,年次変化によるジニ係数の変化が統計的な意味で比較可能 であるかどうかという観点から分析を行う。その際に,データに数理的な所得 分布をあてはめて,そのうえでジニ係数を導出するという方法も用いる。なお,
こうした所得を記述する分布としては複数の分布が提案されており,Klieiber
and Kotz( )等を参照願いたい。
本稿の構成は以下の通り。 節において使用するデータおよび尺度について 概観し, 節において,使用するモデルを考察する。 節においてブートスト ラップの結果を示し,ジニ係数の信頼区間や年次比較する際の可能性について 言及する。
データと不平等尺度について
. 我が国における所得分布に関する統計
我が国には所得の分布を捕捉できるいくつかの公的公表データがあるが,そ れについて整理しておく。
『全国消費実態調査』は消費実態の把握を目的とした,総務省統計局の統計 であり,抽出世帯は , 世帯と大きい。しかしながら,調査規模の大きさ の一方で,残念ながらその調査は 年に一度しか行われていない。したがって,
毎年の年次変化を確認したい場合には使用できない。
『国民生活基本調査』は厚生労働省の保健医療を中心とした国民生活に関す る調査であり, 万世帯を調査している。ただし,本稿の目的となる所得関 連の調査項目に関しては, 万世帯の調査である。大規模調査を 年おきに実 施し,この間は簡易調査という形で対応している。その際の調査世帯は . 万 世帯,さらに所得関係は 千世帯であるので,簡易調査の基本的な標本の大き さとしては『家計調査』とほぼ同等である。大規模調査の結果は 年に一度で はあるが,この値はOECDをはじめとするジニ係数の国際比較に用いられて いる。
これとは別に,厚生労働省においては概ね 年に一度,『所得再分配調査報 香川大学経済論叢
階級下限(万円) (以上) , , ,
階級上限(万円) (未満) , , , ,
世帯数分布
(抽出率調整) ,
(計)
集計世帯数 ,
(計)
年間収入(万円)(平均) , , ,
表 年所得分布
告書』が作成されており,最終的な集計客体数(抽出世帯数)は , 程度で 分析を行っている。しかしこれは,再分配面への分析という側面が強く,再分 配前の所得の定義も年金などの社会保障給付金を除いたものや,健康保険等に よる現物給付による再分配所得のジニ係数が計算されている。いくつかの所得 概念に基づくジニ係数の計算結果があるが,概してほかの資料による結果と比 較して大きな値になっている。
一方で総務省統計局で調査を行っている『家計調査』は家計の消費状況を把 握することを目的としたものであり,所得自体の分布の調査は本来の目的では ないが,所得状況の状態から消費の傾向を分析するために,所得分布状況を把 握できる表が存在している。調査は毎月行われ,年単位では所得状況の分布把 握も可能である。問題は,標本数が, , 個程度と小さく,各年の変化が信 頼性に足るといえるかどうかという点である。
. データ
本稿では,毎年の家計の年次変化を確認して,『家計調査』を用いることで,
その信頼性に対して検証することにする。使用する表は, 年から 年 までが「第 表 年間収入階級別 世帯当たり年平均 か月間の収入と支出(全 世帯)」であり, 年から 年までが「第 − 表 年間収入階級別 世 帯当たり か月間の収入と支出」である。
以下,後の分析において使用するデータの一部を示す。『家計調査』を用い て推定を行った結果のなかで 年のみの結果を与えることにしたい。必要 なデータの全体像を示したものが,表 である。
. ジニ係数
ジニ係数自体はGiniにより提案された不平等を計測する尺度であり,ロー レンツ曲線との親和性や,不平等の程度が直感的な意味からも から の数値 で表されることから,広く不平等の分析において用いられる。教科書的な定義 としてローレンツ曲線と完全均等線によって囲まれた面積の 倍ということで 図的な定義を行う場合もあるが,離散データを用いた場合の定義は,
"" "
#'#"!
%""
' !
%""
'&#%!#&& ⑴
となる。ただし,#%がi番目の所得である。なお,所得分布などを連続関数 として,分布関数などの形で定義できる場合,$$)%を所得分布を示す密度関 数とすると,累積密度関数を!$#%"#!#$$)%#)とした時,
!"$#%""!#)$$)%#)!"!#)$$)%#) ⑵
を定義し,
"""!#"
!
#!"$#%$$)%#) ⑶
で計算される。所得分布の形状が,特殊な分布に従う場合,その分布のパラメ ータの簡単な関数に集約できる場合もある。それらの古典的な例はパレート分 布や対数正規分布などであるが,陽表的にジニ係数を表記できない場合や複雑 な場合には,数値積分にてジニ係数を計算することになる。
所得分布モデル
. 多項分布に基づく仮定
政府の公開する所得の分布は通常,所得階級,階級値(階級の平均所得)と 階級に属する世帯数(相対度数)が与えられていることが多い。そこで,k階級 に区切られた第i階級の相対度数を用いて発生確率を(%とし,全体のサンプ ル数合計をnとする。その時,第i所得階級からの発生回数を#%とすると,
香川大学経済論叢
" % '
#! (!'
$% % ! &
#! ( &
$&# % !
'
#('
$&
#'#!((&
$'$!! %
ただし&
###
$
'
##% &
⑷ という多項分布によって表現できる。ここで,%!の表現は階乗であり,%!#%"%%!#&"("$"#!"!##である。この分布によって,乱数を発生させジニ 係数を計算する。これをモデル と表記する。
. 対数正規分布に基づく仮定
所得分布は経済社会の構成要因の中で,主要な関心事であり,古くはパレー ト分布をはじめ対数正規分布など様々な分布が提案されてきた。最近では,シ ン・マダラ分布やベータ分布が用いられることが多い。所得分布自体は過去の 研究から正に歪んだ分布であることが経験的にわかっているので,それを表現 できる分布が用いられる。
ここでは,前小節と同様に,モデル として,対数正規分布による仮定を考 える。所得分布を分析する上では,古くから高所得者の分布に関してはパレー ト分布,より一般の低所得者層をも含めた分析に関しては対数正規分布を用い ることが多い。本小節においては比較の対象として,古典的な対数正規分布を 用い,ジニ係数を求め,その分析を行う。対数正規分布は所得をxと置いた とき,その対数(#()''が正規分布に従う確率分布であり,その密度関数
&%(&は,
&%(&# #
$$
' %&+*!#
$ (!#
" % #$
$ %!!$"("$ ⑸
であり,μとσはパラメータである。さらに変換のヤコビアンが !(
!'
!!
!!
!!
!!## 'で あることを利用すると,x自体の密度関数"%'&は
"%'&# #
$$
' %'&+*!#
$ ()''!#
" % #$
$ %!""'"$ ⑹
である。ここで,ジニ係数の式⑶を用いると,
#$$$ $
*$
! " ⑺
である⑵。なお,ここで,$&#'は標準正規分布の累積分布関数を示す。
. 第 種一般化ベータ分布に基づく仮定 第 種一般化ベータ分布の確率密度関数は,
(&%'$ %%%+!#
&%+!&+!,'(#"&%#&'%)+",!""%"% ⑻ と表現される⑶。ここで!&+!,'はベータ関数であり,!&+!,'$'"#-+!#&#!-',!#'- である。この分布は,シン・マダラ分布,第 種ベータ分布およびダグム分布 を包括した分布であり,したがって,他の分布よりもより柔軟にデータに フィットする。推定方法は最尤法を用いる。
ジニ係数に関しては,パラメータが決まれば,それに応じて式⑼の公式があ る。しかしながら,これは超幾何関数を用いた複雑な表現になっている。本稿 においては,推定されたパラメータを用い,乱数を発生させることでジニ係数 のブートストラップ推定を行い,その信頼区間について考える。
#$ !&$+"##%!%,!##%'
!&+!,'!&+"##%!,!##%'
##
+%"$&#!+",!$+"##%&+"#!$&+",'&#'
#
! #
+"##%%"$&#!+",!$+"##%&+"#"##%!$&+",'&#'$ ⑼ ここで,%"$&#'は,
%"$&%#!%$!%%&&#!&$&%'$%
*$#
% &%#'*&%$'*&%%'*
&&#'*&&#'*
%*
*! ⑽
となる超幾何関数であり,&%'"$#で,&%'*$&)*!#$"&%")'である。
( ) 導出に関しては青木( )参照。
( ) なお,第 種一般化ベータ分布に関しては,McDonald( )参照。同文献において ジニ係数も導出されている。
香川大学経済論叢
モデル モデル モデル
パラメータ μ σ a b p q
推定値 * . . . . . .
ジニ係数 . . .
表 年の所得分布パラメータ推定値
*モデル は多項分布であり,それぞれのパラメータは比率で決定するため示して いない。
ブートラップによる分析
本節においては与えられたデータに基づき,ブートラップ推定によって推定 値を得ることを目的とする。本節では 種類の仮定に基づきブートストラップ 推定を行う。
ブートストラップ等のシミュレーションを行うにあたって,『家計調査』に おいては,実際のデータ収集作業においてデータの抽出率が異なるため,抽出 全体を , として補正した結果を示しているが,実質のデータ量としては 年に関しては , 個しかない。したがって,データ全体が,このデー タ数であるとして,各所得階層を按分してデータの実質量を各階層に割り振っ ている。
実際にこのデータを用いて 年において各モデルに基づいて推定を行 い,そのパラメータに基づいたジニ係数を計算した。各モデルの推定結果を表
に示している。
その時の分布の対数正規分布と第 種一般化ベータ分布のフィットを示した ものが図 である。それぞれのケースでブートストラップを行い,各モデルご とに生成した , 個のジニ係数を求めた。その結果,多項分布を用いてブー トストラップを行った結果,そのジニ係数の分布を示したものが図 である。
同じく対数正規分布と第 種一般化ベータ分布を用いた結果のジニ係数の分布 がそれぞれ,図 と図 である。
0.0000 0.0005 0.0025
0.0020
0.0015
0.0010
0 500 1000 1500 2000 2500
lognormal GB2
Income
(万円)
Density
Gini Coef.
Freq.
0.290 0.295 0.300 0.305 0.310 0.315 0
40 60 80 100
20
図 年の所得分布へのフィット
図 多項分布ヒストグラム 香川大学経済論叢
Gini Coef.
Freq.
0.295 0.300 0.305
0 50 100 150
Gini Coef.
Freq.
0.300 0.305 0.310 0.315
0 20 40 60 80 100 120 140
図 対数正規分布ヒストグラム
図 SB ヒストグラム
最終的に,ブートストラップの手法を用いて推定を行った結果を表 に示し ている。表には"""を各ブートストラップのb番目の推定値とみなして,B を ブートストラップ反復回数とすると,""#!"!"!#""",$#""%##!"!"$""!""%#,
()'*"$"%#""!"を 示 し て い る。ま た,"!!!#$と"!!&%$は,そ れ ぞ れ, . と
. のパーセンタイル点を表す。この表と,推定値を示した表 を見ると,
推定値,ブートストラップ平均推定値においても,モデル <モデル <モデ ル という順序を保持しているが,そのパーセンタイル信頼区間は重複してお り,この意味でこれらのモデル間の差異を強く主張するものではない。さらに これを,各モデルによって計算されたジニ係数の年次推移を確認するため,そ の推移を図 に示す。図 によれば,基本的には 年以降ではこうした関 係が成り立っており,それより以前はそうした関係は少し崩れているものの,
概して差異が小さい。なお,すべてのモデルにおいて標準誤差は . から
. の幅で推移しており,このことを考慮に入れた場合,各モデルの信頼区 間は期間中においても基本的に重複している⑷。
本稿はこれらの推定結果とともに,各年の年次変化の際の差異の有無を検証 するものであるが,以下では,使用するモデルをモデル に限定して分析を行 う。最終的に,各年の比較の結果を表 に示す。表の非対角下三角部分の数値 は各年のジニ係数の差異を比較した統計量が記述されている。統計量は,i行 の年数とj列の年数のブートストラップによる結果を用い,
( ) ただし,期間中最も大きな差異を示す 年のモデル の( . , . )とモデ ル の( . , . )の信頼区間のみは差異が生じている。
"" #"" ()'*"$"% "!!!#$ "!!&%$
モデル . . . . .
モデル . . . . .
モデル . . . . .
表 年ジニ係数ブートストラップ結果 香川大学経済論叢
Gini1(model1) Gini2(model2) Gini3(model3)
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 年 0.28
0.285 0.29 0.295 0.3 0.305 0.31
!!#!!"#
#!!
! "#!"#!"
! "#!
#
⑾
で計算した値を示し,表の非対角下三角部分に関しては,対応する年同士の両 側検定の有意性を,それぞれ, %, %そして %を基準として示してい る。
表 より,理解できることは, 年から 年それに加えて 年か ら 年で他の期間と有意に異なる傾向があるということである。しかしな がら,時間がある程度経過して差異が,統計的に有意であることが明確なケー ス以外に, 年または 年以内のジニ係数の差異が統計的に有意であるという ケースが存在することである。表 からは, 年以内に %有意水準で有意な ものが 件中 件, 年間同士の比較では 件中 %有意水準で 件であ る。以上の結果を踏まえれば,『家計調査』を用いてジニ係数による短期的な 予測を行う場合,不平等の変化を捉えるための迅速な情報として利用する価値 は十分にあると考えられる。
図 各モデルによるジニ係数の変化
お わ り に
本稿では,ブートストラップを用いて『家計調査』における毎年の年次変化 が,不平等度を検証するうえで有効に働いているかどうかを検証した。『家計 調査』では毎年の所得分布自体は把握できるものの,『全国消費実態調査』や
『国民生活基本調査』に比較すると必ずしも標本の大きさという点で,検証結 果に疑問が生じるためである。その結果,我々の計算においては標準誤差は
. 程度にとどまる。 年間のわずかなジニ係数の変化の場合にはその変化 は統計的な差異がないという場合もあるが,特定の 年の変化であってもそれ が大きい場合,統計的に差異が生じているというケースが散見された。
したがって,『家計調査』などの分析において毎年の年次変化を分析する際 には,大きくジニ係数が変化した場合を統計的有意と判断することができる。
この意味で,『家計調査』のジニ係数の調査結果をもとに,少なくとも不平等 の程度が異なると結論を示すことができる。他の統計資料が,大規模の標本調
− *** *** ***
− . − *** *** *** *
. . − *** *** *** * *
− . − . − . − *** *** * *** * *** *** *** *** *** *** ***
− . − . − . − . − *** *** ** *** ** *** *** *** *** *** *** ***
− . − . − . − . . − *** *** ** *** ** *** *** *** *** *** *** ***
− . . − . . . . − *
. . . . . . . − *** ***
− . − . − . . . . − . − . − ** * * ** ** **
− . . − . . . . . − . . −
− . − . − . . . . − . − . . − . − ** * * ** ** **
. . . . . . . − . . . . −
− . . − . . . . . − . . − . . − . −
. . . . . . . − . . . . − . . −
. . . . . . . − . . . . − . . − . −
. . . . . . . − . . . . . . . . −
. . . . . . . − . . . . . . . . . −
. . . . . . . − . . . . . . . . . − . −
表 ジニ係数に関する統計的差異
非対角上三角行列部分の *,**,***はそれぞれ, %, %, %で有意であることを示す。
香川大学経済論叢
査ではあるが,毎年の結果を比較できない現実からすれば,『家計調査』にお けるジニ係数に基づいた不平等の判断は機動性に富み,毎年の調査結果を持ち 合わせていない他の調査を補完でき,急激な変化があった場合,政策当局が早 急に対応する根拠を与えることができると考えられる。
参 考 文 献
[ ]青木昌彦( )『分配理論 第 版』(経済学全集),筑摩書房.
[ ]Cowell, F.( )Measuring inequality, Oxford University Press.
[ ]Klieiber, C. and S. Kotz( )Statistical Size Distributions in Economics and Actuarial Science, John Wiley, New York.
[ ]McDonald, J. B.( ) Some Generalized Function for the Size Distribution of Income , Econometrica, Vol. , No. , pp. − .
[ ]OECD( )Divided We Stand : Why Inequality Keeps Rising, OECD Publishing, Paris.
[ ]OECD( )In It Together : Why Less Inequality Benefits All, OECD Publishing, Paris.
[ ]Sen, A. K.( )On Economic Inequality., expanded edition with a substantial annexe by James E. Foster and Amartya K. Sen, Oxford : Clarendon Press(鈴村興太郎・須賀晃一訳
『不平等の経済学』東洋経済新報社, 年).