本節では
,
世界幸福度調査のデータを用いた, Pair analytics
の結果を述べる.
世界幸福度調査(World Happiness Report)
*13は,
国際連合が発行する,
主観報告値に基づく幸福度調査のレポートである
[89].
調査における国ごとの幸福度の順位は,
国民が主観的な幸福度を回答する世論調査により得られた
0
から10
のスコアから計算される.
調査報告では得られた幸福度の順位を,
以下 の6
つの説明変数(
M=6)
を用いて回帰分析し,
各説明変数の寄与を分析している[89].
• 人口あたり
GDP
の対数値(GDP per capita)
• 社会的支援
(Social support)
• 健康寿命
(Healthy life expectancy)
• 人生の選択肢の自由度
(Freedom to make life choices)
• 寛容さ
(Generosity)
• 腐敗の認識
(Perceptions of corruption)
分析対象のデータセットとして
, 2010
年から2018
年までの調査報告を取得した結果(T
=9)
を用いた.
データセットの6
つの説明変数に対応する属性値を[0,1]
の値域で正規化した結果に対 して,
時点ごとに次元削減を適用している.
全てのデータ取得期間に渡り欠損値を含まない96
ヶ 国を可視化対象とした(N
=96).
2012
年におけるデータセットの可視化結果を図29
に示す.
分析セッションは,
大学ランキング データを用いた分析(6.1
節)
の後に行われた.
分析者は,
データセットの各属性がランキングに 与える影響の理解と,
ランキングを再現するようなパラメータ調整を目的としてプロトタイプイ ンタフェースによる分析を開始した.
最初に,
分析者は散布図上のノード分布を確認した.
また,
ノード全体を囲って作成した凸包の形状を,
アニメーションを再生しながら観測し,
データセット の特性を把握しようと試みた.
結果として,
年度ごとの大きな傾向の変化は見られなかったが,
変 動が激しい国とそうでない国が混在していると判断した.
次に,
散布図上で同様の傾向を持つオブ ジェクトをスケッチベースの凸方で選択して,
アニメーションによる散布図上での空間的配置の 変化や,
詳細ビューを用いた国ごとの属性値が持つ傾向の比較を行った.
これらの分析結果に基づ き,
分析者はY
軸の上部にある国はカンボジアやインドネシアなどの東南アジア諸国であり,
時 点間で大きく座標が変化する傾向を確認した.
分析者はこれらの国々の特性を判断するために
,
オブジェクトをY
軸において値が小さくなる 方向に移動させた場合に,
重み付けが減少する属性がY
軸に大きく寄与すると考えた.
そのため,
選択した国々をY
軸の値が中程度の領域まで相対的操作で移動してαを調整した後に,
その結果 をωに還元した.
次に,
パラメータ調整により強調度合いが変化する属性を分析した.
移動後の散 布図ビュー・詳細ビューを確認すると,
政治的腐敗の認知や寛容さの強調度合いが低くなること を確認した.
また,
移動した国々は特に年度間で寛容さの変動が大きいことを平行座標より確認し た.
そのため, Y
軸で寛容さが強く重み付けされていることが,
座標の変動に影響していると推測 した.
また
,
前述の相対的操作とωへの確認結果より,
平均健康寿命や社会的支援に対する重みが増*13https://worldhappiness.report
加することも確認した
,
これらの結果に基づき,
分析者はY
軸は途上国の幸福度に対応するとい う仮説を構築した.
また, X
軸では寛容さがプラス方向に高く重みづけられていることや,
平均健 康寿命や人生の選択肢の自由度もプラス方向に重みづけられていること,
北欧諸国やカナダなど,
既存の世界幸福度調査のランキング上位と一致する国がX
軸の値が大きい範囲に確認できるこ とから, X
軸は先進国の幸福度に関連するという仮説を構築した.
Y軸の上位
• インドネシア
• タイ
• カンボジア
X軸の上位
• デンマーク
• ドイツ
• カナダ
図
29.
世界幸福度調査データセット(2012
年)
における可視化結果次に
,
分析者は日本の軌跡を表示し,
その時間的特性を観測した.
また,
日本がX, Y
軸の値が大 きい範囲に位置するように相対的操作を適用した後,
その結果をωに還元した.
その結果,
寛容 さに対する強調度合いがX, Y
軸について上昇する傾向を確認した.
また,
平行座標と併せて属 性値の傾向を確認すると日本は他の国と比較して寛容さが極端に低く,
近年のランキングが以前 よりも低いことを確認した.
同様の傾向は,
分析者によるニュース記事の調査からも裏付けられ た[104].
探索で得られた知識に基づき
,
分析者は散布図上の軌跡形状や詳細ビューにおける平行座標の 確認などを通して,
日本と近隣諸国の傾向を比較した.
また,
類似する国ごとにその動向情報を ニュースや地理的な位置関係から確認した.
例えば,
韓国との比較を行い,
全体的な属性値の傾向 は類似しているが,
人生の選択肢の自由度は日本の方が高いことを確認した.
上述の探索内容や可 視化された属性値の各軸に対する寄与度合いから,
分析者は寛容さが散布図の投影に大きな影響 を与えているという仮説に基づき,
寛容さの変化に着目して探索を行った.
その結果, 2016
年以降 で,
アメリカの寛容さが低下する傾向を確認した.
ヨーロッパ諸国を中心とした他の国々について も,
近年になるにつれ寛容さが低下する傾向を確認した.
また,
各時点において近接するノード集 合に関して,
スケッチベース入力を用いて凸包を作成し,
詳細ビューにおいて選択されたオブジェ クト集合の属性ごとの類似性を比較した.
その結果,
分析者はオーストラリアとニュージーランド のような,
地理的に近い国々が同様の傾向を持つことを確認した.
一方で,
人生の選択肢の自由度や寛容さなどの属性に関する時間的傾向はアメリカとカナダで類似するが
,
メキシコとは類似し ていないなど,
異なる事例も確認された.
この違いは,
それぞれの国に対応する軌跡のX
座標に明 確に表れていた.
分析者はアメリカ・カナダとメキシコの間で違いが大きい属性が寛容さである ことから,
寛容さの強調度合いがX
軸のオブジェクト配置に与える影響が大きいと解釈した.
分析者は幸福度上位の国に共通するパラメータを把握したいと考え
,
図30(a)
のように北欧諸 国などを選択した凸包を作成し,
それらに対して絶対的操作を適用し, X, Y
軸の値が大きい方向 にそれぞれ移動した.
操作適用後,
分析者はωの調整に基づき更新された散布図上で値が大きい 方向に移動する国を操作対象と類似する国,
反対方向に動く国を類似しない国と解釈しながら,
調 整結果をこれまでの探索で得られた知識と組み合わせて,
データに対する理解を深めていた.
次に
,
分析者は投影のX
軸は幸福度調査とある程度一致した結果を持つものの,
寛容さに大きく 左右されるため,
幸福度の一部の側面しか反映しないと考えた.
そのため,
上述のデータ探索から 得られた各パラメータに関する知識に基づき,
分析者は棒グラフの直接操作により,
個々の属性に 対する強調度合いを調整した.
例えば, X
軸で確認された幸福度上位の国が,
社会的支援や人生の 選択肢の自由度に関する属性値を共通して高く持つとの探索で得られた仮説に基づき,
それらを より強く重み付けた.
また,
初期時点の投影(
図30(a))
では寛容さの強調度合いのみが高く, GDP
などの他の属性値が低い国がX
軸の値が大きい範囲に表示されてしまうため,
寛容さの強調度合 いを引き下げた.
パラメータ調整後の散布図と属性の強調度合いを図30(b)
に示す.
分析者は,
図30(b)
の散布図より, X
軸の値が大きい領域に位置する国は北欧諸国やイギリス,
オーストリアなどのように
,
幸福度の順位が高い国と一致する傾向を確認した.
分析者によって調整されたパラメータの妥当性を検証するために
,
実際の調査報告におけるラ ンキング基準と比較した.
表4
に,
パラメータ調整前後でのX
軸における各属性の強調度合いと, 2019
年の調査報告における線形回帰分析で得られた,
幸福度ランキングに対する6
つの説明変数 の貢献度を表現する回帰係数[34]
を示す.
表において, 1
行目と2
行目は調整前後でのパラメー タω(X)における,
列に対応する属性の強調度合いである. 3
行目は調整前後で強調度合いの差分(2
行目-1
行目)
を示している.
回帰分析で得られた,
幸福度ランキングの順位を説明する回帰係数 の,
列に対応する属性(
説明変数)
ごとの値を4
行目に示している. 3
行目の符号と4
行目の回帰係 数を比較すると,
調整後に強く重み付けられた社会的支援や人生の選択肢の自由度(
表中で 自由 度”
と表記)
が,
ランキングの正方向の順位に寄与する傾向が確認できる.
また,
強調度合いを低く したものの,
プラス方向にしていた寛容さはランキングの正方向の順位に寄与し,
調整後に重み付 けを低くした人口あたりGDP
や政治的腐敗の認識(
表中で 腐敗の認識”
と表記)
などの属性値 の大小が順位に与える影響は少ない(
人口あたりGDP)
か,
負方向(
政治的腐敗の認識)
であるこ とが確認できる.
一方で,
健康寿命に関しては,
強調度合いを大きくしたものの,
幸福度への影響 は確認できなかった.
この理由として,
平均寿命が高い国と低い国の特徴は,
社会的支援や政治的 腐敗の認識のような他の属性によって説明されてしまうことが報告されている[34].
これらの結 果より,
分析者はプロトタイプインタフェースを利用して,
データセットの特性を正確に理解し,
調査報告と一致するランキングを生成するようなパラメータ調整を行えたといえる.
以上の分析事例より
,
提案フレームワークを用いて, 2.4.1
節で示した指標構築プロセスにおけ る,
各属性の有効性検証のための探索的分析を支援できたと考える.
表
4.
パラメータ調整前後のX
軸における各属性の強調度合いと,
調査報告における回帰 係数の比較強調度合い・係数値 人口あたりGDP 社会的支援 健康寿命 自由度 寛容さ 腐敗の認識
調整前 0.0359 -0.0256 -0.0226 0.137 0.963 -0.228
調整後 -0.189 0.622 0.345 0.415 0.136 -0.812
差分(調整後-調整前) -0.225 0.648 0.368 0.278 -0.827 -0.583
順位への影響[34] 0.318 2.422 0.033 1.164 0.635 -0.540
𝜔
𝑡(Y)𝜔
𝑡(X)𝜔
𝑡′(Y)𝜔
𝑡′(X)幸福度上位の国:
北欧諸国, カナダ, オーストラリア
(a) (b)
GDP 社会的 人生選択の自由度 寛容さ 支援
政治的 腐敗の 認知 平均寿命
寛容さ
図
30.
世界幸福度調査データセット(2018
年)
におけるパラメータ調整結果: (a)
パラメー タ調整前(b)
パラメータ調整後
ドキュメント内
首都大学東京
(ページ 78-82)