• 検索結果がありません。

世界各国の寿命の原因解明――非線形解析による 社会的決定要因の分析 利用統計を見る

N/A
N/A
Protected

Academic year: 2021

シェア "世界各国の寿命の原因解明――非線形解析による 社会的決定要因の分析 利用統計を見る"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

社会的決定要因の分析

著者

鈴木 孝弘, 田辺 和俊

著者別名

SUZUKI, T., TANABE, K.

雑誌名

東洋大学紀要, 自然科学篇

58

ページ

67-81

発行年

2014-03

URL

http://id.nii.ac.jp/1060/00006646/

Creative Commons : 表示 - 非営利 - 改変禁止 http://creativecommons.org/licenses/by-nc-nd/3.0/deed.ja

(2)

世界各国の寿命の原因解明――非線形解析による

社会的決定要因の分析

鈴木孝弘

a

・田辺和俊

b

Determinants of Life Expectancy of Many Countries in the

World by Using Support Vector Machine

Takahiro S

UZUKIa

, Kazutoshi T

ANABEb Abstract

 Social determinants of life expectancy attract much attention worldwide, and several papers were presented on statistical analysis of determinants using linear regression method (OLS). In this study, a large-scale experiment has been done to analyze determinants of life expectancy of 161 countries using 42 explanatory variables of 5 fields and a non-linear regression support vector machine (SVM) technique. The SVM model developed shows that just 13 factors represent life expectancy of 161 countries with a higher accuracy of determination coefficient of 0.926 than previous works. It also shows that the health factors such as infant mortality rates and health expenditures most significantly contribute to life expectancy.

Keywords: life expectancy; determinant analysis; support vector machine

1. はじめに

 近年,経済のグローバル化の進展によって絶対的な貧困層が減少しつつある中,次の重 要な課題は健康問題と考えられ,健康の社会的決定要因が世界的に注目されている。現 在,社会的な最下層に近いほど,平均寿命は短く,多くの疾病が見受けられ,世界の最長 寿国と最短寿国とでは 40 歳以上の健康格差が存在している。20 世紀後半以降,人類の健 康や病気が遺伝等の先天的要因だけでなく,経済,社会,文化,環境等の後天的要因に よっても影響されることが広く認められるようになった。WHO は 2003 年,健康の社会  a東洋大学自然科学研究室:〒 112-8606 東京都文京区白山 5-28-20

  Natural Science Lab., Toyo University, 5-28-20 Hakusan, Bunkyo-ku, Tokyo 112-8606, JAPAN  b東洋大学現代社会総合研究所:〒 112-8606 東京都文京区白山 5-28-20

(3)

的決定要因に関する意識の向上を目的として, Social Determinants of Health: The Solid

Facts の第 2 版を公表した(WHO, 2003)。2008 年には最終報告書 Closing the gap in a

generation: Health equity through action on the social determinants of health を公表した (WHO, 2008)。これらの報告書では,健康の社会的決定要因として,社会格差,ストレ ス,幼少期,社会的排除,労働,失業,社会的支援,薬物依存,食品,交通の 10 項目を 挙げている。

 健康の社会的決定要因については , Table 1 に掲げるように幾つかのレビューがある (Christensen & Vaupeld, 1996; 近藤 , 2005; 川上他 , 2006; Skolnik, 2008; 近藤 , 2010; 杉澤,

2012; Mehrara & Nasibparast, 2012)。また,統計学的手法を用いて , その決定要因を解析

した先行研究があるが,平均寿命を目的変数,幾つかの指標を説明変数とし,線形重回帰 (ordinary least squares, OLS)により決定要因を探索している。しかし,それらの論文に よって解析対象の国と説明変数の種類が異なるため,決定要因の種類やその影響度につい て全く異なる結果が報告されている(Table 1 参照)。解析対象の国については,1 カ国 (例えば日本のみ),OECD 加盟国,被援助国,あるいは地域(例えばアフリカのみ)の ように対象を限定した研究が多く,世界中の多様な国を解析した研究は少ない。最多の国 を解析しているのは Bergh & Nilsson (2009)であるが,92 カ国を対象としているにすぎ ず,また説明変数が国民 1 人当たりの国内総生産(GpC),人口比率,教育年数,医師数 等で説明能力に欠けているためか,平均寿命の予測値と実測値との回帰決定係数がきわめ て低く,統計的に有意であるとはいえない。また,これまでは説明変数についても経済指 標(GDP や GpC)のみ,あるいは経済指標と健康指標(医療費や乳児死亡率)のみのよ うに,少数の変数に限定した論文が多く,多数の候補指標の中から変数最適化により決定 要因を探索した論文は見当たらない。このように解析対象や説明変数を限定した研究から 得られている結果は一般性の点で疑問がある。  また,先行研究では解析手法として OLS 等の線形回帰分析を用いているが,各種の指 標と平均寿命との関係は一般に線形ではなく,複雑な相関関係を示す指標が多いと考えら れる。このような複雑な相関関係を探る一つの対処策と考えられるのが,人工ニューラル ネットワーク(ANN)(時永 , 2000; 田辺 , 2003; 岡本 , 2006)のような新しいデータマイニ ングの手法の適用である。しかし,ANN は解析能力が高い反面,過学習や局所解など多 くの問題がありモデルが一義的に決まらず,最適なモデルの構築が難しいことが指摘され ている。一方,近年注目されているサポートベクターマシン(SVM)(Cristianini &

Shaw-Taylor, 2000; 小野田 , 2007; 阿部 , 2011)は ANN と同様の非線形解析手法であるが,ANN

と比較して飛躍的な高速処理が可能であり,また,局所解の問題がない。しかし,これま で ANN や SVM 等の非線形回帰手法を平均寿命の決定要因解析に適用した研究は見当た らない。

(4)

Table 1. Summary of literature review on statistical determinant analysis of life expectancy Countries analyzed Explanatory variable Authors

47 less developed countries

economic variables, health expenditures, health personnel and facilities, social indicators, power and sanitation utilities

Grosse & Perry (1982)

86 developing countries GNP per capita, poverty rate, public health spending Anand & Ravallion (1993) 24 developed and

developing countries

newspaper, electric power, protein intake, GDP, school life years, imports, mortality rate, hospital beds, physicians

Furukawa (1996)

68 recipient countries sanitary toilet facilities, safe drinking water, literacy, GDP, access to basic medicines, measles vaccine inoculation rate.

Furukawa (2005)

19 OECD countries GpC, pharmaceutical expenditure, health expenditure, senior population rate, tobacco consumption, alcohol consumption, butter consumption, vegetable consumption, dummy

Shaw et al. (2005)

91 developing countries GpC, literacy rate, health expenditure, urban population rate, total fertility rate, rate of population without access to water, number of physicians, undernourished people rate, area dummy

Kabir (2008)

65 African countries GpC, undernourishment prevalence, safe water access, education, HIV prevalence, malaria risk, tuberculosis incidence

Desbordes & Azemar (2008)

92 developed and developing countries

globalization index, GpC, urban population, average year of education, number of physicians, nutritional status, dependency ratio, government consumption, Gini coefficient

Bergh & Nilsson (2009)

83 developed and developing countries

per capita income, human capital stock, infant mortality, hospital beds, urbanization, political instability, area dummy

Castello-Climent (2011)

29 developed and developing countries

GpC, foreign direct investment, population density, education, hospital beds, employment rate, food supply

Doytch et al. (2012)

21 European countries GpC, health expenditure, food availability, employment ratio, education Index, immunization rate, urban population ratio, CO2 emission

Bayati et al. (2013)  そこで本研究では,世界中の 161 カ国の平均寿命のデータを目的変数とし,健康,経 済,政治・社会,教育・文化,地理・環境の 5 分野の 42 種の指標を候補説明変数として 用いて SVM により解析し,変数最適化により多数の指標の中から平均寿命の決定要因を 探索する実証分析を行った。筆者の知る限り,平均寿命の決定要因について本研究のよう な大規模データを用いて精密な解析を行った先行研究は見当たらない。

(5)

2.

 方法

2.1 平均寿命および各種指標のデータ

 平均寿命は 161 カ国のデータを WHO,国連(UN),世界銀行(WB)等のホームペー ジから入手した。161 カ国の内訳は Table 2 に示すように,先進国 40 カ国,途上国 121 カ 国(先進国・途上国の定義は WB による)を含み,また,最長寿国の日本(平均寿命 83.9歳)から最短寿命国のスワジランドおよびギニアビサウ(平均寿命 50 歳)まで様々 な平均寿命の,かつ世界の全地域の国々が網羅されている。本研究ではこれら 161 カ国の 平均寿命を一括して解析し,決定要因を探索したが,先進国と途上国,あるいは地域別の ように分割して解析する方法も考えられる。しかし,次に記すように,説明変数として 42種もの指標を出発候補として採用したので,統計モデルの頑健性(説明変数の 3 倍以 上のデータが必要であるとされる)の点から,一括モデルを採用した。したがって,この 平均寿命のデータの解析から得られる決定要因は一般性の高いものになると期待できる。

Table 2. Distribution of 161 countries

LE range Developed countries Developing countries Africa America Asia Europe Oceania

45.1−50.0 0 2 2 0 0 0 0 50.1−55.0 0 8 8 0 0 0 0 55.1−60.0 0 15 15 0 0 0 0 60.1−65.0 0 14 12 0 2 0 0 65.1−70.0 0 14 4 2 7 0 1 70.1−75.0 0 34 5 8 10 8 3 75.1−80.0 14 33 3 15 15 13 1 80.1−85.0 26 1 0 1 6 18 2  説明変数は,先行研究では多種多様な指標が用いられているが,WHO 等の報告や多く の論文で検証されていること,世界中の多数の国についてデータが入手可能であること等 の選択理由から,Table 3 に示す 42 種の候補指標を採用した。なお,乳児死亡率を説明変 数に取り上げた理由は,WHO の報告書(2003)等において平均寿命と乳児死亡率が健康 水準を表す指標として国際比較に用いられているからである。しかし,Fig. 1 に示すよう に,161 カ国全体での両者の相関係数は -0.932 と高いが,平均寿命 70 歳以下の 54 カ国で は相関係数は -0.740 に低下するが,他の変数との組み合わせによって意義がある可能性も ある。  以上の指標の内,人口当たりの数値が算出できるものはその数値を用いた。これらの指 標の記述統計量を Table 4 に示す。指標の中には分布の偏りがかなり大きいものがあるの で,各指標は対数を用いて 0 と 1 の間にできるだけ均一に分布するよう正規化して解析に 用いた。この操作の有効性を示すものとして,軍事費について対数処理前後の散乱図を

(6)

Table 3. Dependent and explanatory variables

No Variable Definition and unit Field Source

Life expectancy Expected number of years of life remaining at birth

WHO, UN, WB 1 Infant mortality rate Number of infants dying before reaching

one year of age, per 1,000 live births in a year

Health UN, WB

2 Birth rate Average annual number of births during a year per 1,000 persons

Health WB, OECD 3 Suicide rate Total rate deaths officially recorded as

suicides per 100,000 population

Health WHO, OECD 4 Health expenditure Sum of public and private health

expenditures per capita

Health WHO, WB 5 Hospital beds Number of hospital beds per 1,000

population

Health WHO, WB 6 Physicians Number of physicians per 1,000 population Health WHO, WB 7 Smoking prevalence Percentage of men and women ages 15 and

over who smoke daily

Health WHO, WB 8 Alcohol consumption Alcohol consumption among adults (age

15+) in litres per capita per year

Health WHO, OECD 9 Calorie intake Daily calorie intake per capita in 103kcal Health FAO

10 Fat intake Average daily fat intake per capita in gram Health FAO 11 Obesity Rate of adults of body mass index over 30 Health WHO, OECD 12 Marriage rate Number of marriages per 1,000 population Health UN, OECD 13 Divorce rate Number of divorces per 1,000 population Health UN, OECD 14 Religion Rate of population who say religion is

important

Health Gallup 15 Gross domestic

product

Per capita gross domestic product in 103$ Economy IMF, WB

16 GDP growth rate Annual percentage growth rate of GDP at market prices based on constant local currency

Economy IMF, WB

17 Tax rates Total taxation as % of GDP Economy IMF, WB 18 Wealth Wealth per capita in 103$ Economy Credit Suisse

19 Household consumption expenditure

Household final consumption expenditure per capita in 103$

Economy WB, OECD

20 Gini coefficient Measure of inequality of income Economy UN, WB 21 Poverty rate Poverty headcount ratio at national poverty

line per population

Economy UN, WB 22 Unemployment rate Rate of the number of unemployed

individuals to all individuals currently in the labor force

Economy IMF, UN

23 Senior worker Rate of economically active population ages 65 and over

Economy ILO 24 Grain self-sufficiency

rate

Proportion of domestic grains among those consumed in the country

(7)

No Variable Definition and unit Field Source 25 Motor vehicle Motor vehicles including cars, buses, and

freight vehicles per 1,000 population

Economy UN, WB 26 Military expenditure Military expenditure per capita in $ Political CIA, WB 27 Armed forces Rate of armed forces personnel to total

labor force

Political WB 28 Murder Rate Murder rate per 100,000 population Social UN, WHO 29 Crime rate Crime rate per 100,000 population Social UN, ICPO 30 Education

expenditure

Public expenditure on education per capita in $

Education UN, WB 31 Literacy rate Literacy rate of people ages 15 and above Education UN, WB 32 Intelligence quotient Ratio of tested mental age to chronological

age

Education Eutimes 33 School life

expectancy

School life expectancy, primary to tertiary education

Education UN 34 School enrollment,

tertiary

Percentage of high school graduates that successfully enroll into university

Education UN, WB 35 Internet Internet users per 100 population Culture UN, WB 36 Latitude Average latitude of country Geography WB 37 Urban population Rate of people living in urban areas Environment UN, WB 38 Terrestrial protected

area

Rate of terrestrial protected areas to total land area

Environment UN, WB 39 Forest area Forest areas per capita in m2 Environment FAO, WB

40 Water access Rate of population with access to improved water source

Environment WHO, WB 41 Electricity access Rate of population with access to electricity Environment UN, WB 42 Air pollution Country level of PM10 in μg/m3 Environment WHO, WB

For more detailed definition of variables, see homepages of data sources.

Fig. 1. Scatter plot of life expectancy versus infant mortality rate Table 3. (continued)

6

31 Literacy rate Literacy rate of people ages 15 and above Education UN, WB 32 Intelligence quotient Ratio of tested mental age to chronological age Education Eutimes 33 School life expectancy School life expectancy, primary to tertiary education Education UN 34 School enrollment, tertiary Percentage of high school graduates that successfully enroll into university Education UN, WB 35 Internet Internet users per 100 population Culture UN, WB

36 Latitude Average latitude of country Geography WB

37 Urban population Rate of people living in urban areas Environment UN, WB 38 Terrestrial protected area Rate of terrestrial protected areas to total land area Environment UN, WB 39 Forest area Forest areas per capita in m2 Environment FAO, WB

40 Water access Rate of population with access to improved water source Environment WHO, WB 41 Electricity access Rate of population with access to electricity Environment UN, WB 42 Air pollution Country level of PM10 in μg/m3 Environment WHO, WB

For more detailed definition of variables, see homepages of data sources.

40 50 60 70 80 90 0 20 40 60 80 100 120

Infant mortality rate

Li fe e xp ec tan cy

Fig. 1. Scatter plot of life expectancy versus infant mortality rate

以上の指標の内,人口当たりの数値が算出できるものはその数値を用いた。これらの指 標の記述統計量をTable 4 に示す。指標の中には分布の偏りがかなり大きいものがあるので, 各指標は対数を用いて0 と 1 の間にできるだけ均一に分布するよう正規化して解析に用い た。この操作の有効性を示すものとして,軍事費について対数処理前後の散乱図を Fig. 2 に示す。平均寿命との相関係数は処理前は0.389 と低いが,処理後は 0.642 と,かなり上 Li fe e xp ec ta nc y

(8)

Table 4. Descriptive statistics of explanatory variables

No Explanatory variable Mean St. Dev. Min Max Skewness

1 Infant mortality rate 32.1 29.3 2.4 117.4 1.01

2 Birth rate 21.8 10.6 8.2 50.9 0.71 3 Suicide rate 9.7 7.1 0.1 35.1 1.06 4 Health expenditure 1.2 1.5 0.0 9.0 2.07 5 Hospital beds 3.2 2.6 0.0 14.0 1.24 6 Physicians 1.6 1.4 0.0 5.4 0.59 7 Smoking prevalence 21.7 8.1 6.0 44.2 0.30 8 Alcohol consumption 5.9 4.7 0.0 21.1 0.60 9 Calorie intake 2.9 0.5 1.6 3.8 0.01 10 Fat intake 80.6 36.5 12.0 167.5 0.56 11 Obesity 16.2 9.8 1.0 57.9 0.52 12 Marriage rate 5.9 2.7 0.2 16.7 0.98 13 Divorce rate 1.5 1.1 0.0 6.9 1.45 14 Religion 75.9 22.2 21.6 99.5 -0.86

15 Gross domestic product 16.5 17.4 0.4 103.9 1.82

16 GDP growth rate 3.7 2.9 -1.8 23.2 2.23

17 Tax rates 29.7 11.9 6.6 70.3 0.83

18 Wealth 39.3 71.7 0.1 426.8 2.51

19 Household consumption expenditure 4.1 5.5 0.0 26.8 1.86

20 Gini coefficient 40.3 9.2 24.2 68.6 0.69

21 Poverty rate 28.2 19.4 2.8 80.0 0.82

22 Unemployment rate 12.5 11.0 0.6 68.6 2.22

23 Senior worker 36.4 24.1 0.9 83.5 0.35

24 Grain self-sufficiency rate 73.4 56.3 0.0 264.0 0.90

25 Motor vehicle 218.1 220.6 2.0 797.0 0.89 26 Military expenditure 37.6 67.9 0.0 568.9 4.45 27 Armed forces 1.3 1.5 0.0 9.0 2.40 28 Murder Rate 10.1 10.8 0.7 65.2 2.00 29 Crime rate 2.7 3.2 0.0 13.6 1.63 30 Education expenditure 87.1 94.2 1.1 459.5 1.53 31 Literacy rate 83.6 18.8 22.4 99.9 -1.31 32 Intelligence quotient 84.6 11.5 59.0 106.0 -0.23

33 School life expectancy 11.5 2.7 3.9 17.9 -0.56

34 School enrollment, tertiary 32.6 26.3 0.8 102.4 0.56

35 Internet 43.0 29.6 1.3 97.8 0.13

36 Latitude 26.4 17.3 0.0 64.0 0.28

37 Urban population 56.3 23.1 10.7 100.0 -0.12

38 Terrestrial protected area 12.6 10.0 0.0 53.7 1.16

39 Forest area 12.8 31.8 0.0 282.9 5.75

40 Water access 86.8 16.1 40.0 100.0 -1.29

41 Electricity access 74.1 33.7 3.0 100.0 -0.92

(9)

74 鈴木孝弘・田辺和俊 8 42 Air pollution 47.4 31.9 6.0 166.0 1.52 40 50 60 70 80 90 0 200 400 600 Military expenditure Li fe e xp ec tan cy 40 50 60 70 80 90 0 1 2 3 Log(Military expenditure) Li fe e xp ec tan cy

Fig. 2. Scatter plot of life expectancy versus military expenditure before and after logarithmic transformation

2.2 サポートベクターマシンによる解析

SVM のソフトウエアは LIBSVM ver.2.89(Chang & Lin)の回帰機能(εSVR),カーネ

ル関数はRBF を用いた。候補説明変数の中から決定要因を探索するためには SVM の 3 種

のモデルパラメータ,g(RBF カーネルの gamma),c(cost),p(loss function のε),およ

び説明変数の最適化が必要である。そこで,Leave-One-Out Cross-Validation Test(LOOCVT)

と,感度分析法(Tanabe et al., 2013)(各指標の感度を計算し,その感度の低い指標を順次 削除しながらSVM 解析を行って予測値と実測値の平均二乗誤差(RMSE)が最小となる点 を探索する方法)の2 つを組み合わせた以下の手順を用いた。 ① 全データを10 群に分割し,第 1 群を予測セット,その他の群をまとめて学習セットと する。 ② 学習セットについてLOOCVT により 3 つのパラメータ g

c

p をグリッドサーチして RMSE の最小点を探し,このモデルに予測セットの指標値を入力して平均寿命の予測値 を求める。 ③ 第2 群以下の各群を予測セットとして以上の操作を繰り返し,全データの RMSE を求め る。 ④ 各指標の感度を求めるために,当該指標は実際の数値に設定し,その他の指標は平均値

Fig. 2.  Scatter plot of life expectancy versus militar y expenditure before and after logarithmic transformation Fig. 2に示す。平均寿命との相関係数は処理前は 0.389 と低いが,処理後は 0.642 と,か なり上昇している。なお,説明変数が 42 種もあるため,変数間の相互相関係数は紙面の 都合上,割愛せざるを得ない。ただし,SVM による解析では OLS と異なり,変数間に強 い相関がある場合でも解析可能であり,多重共線性問題は発生しない。

2.2

 サポートベクターマシンによる解析

 SVM のソフトウエアは LIBSVM ver.2.89(Chang & Lin)の回帰機能(εSVR),カーネ ル関数は RBF を用いた。候補説明変数の中から決定要因を探索するためには SVM の 3 種のモデルパラメータ,g(RBF カーネルの gamma),c(cost),p(loss function の ε),お よ び 説 明 変 数 の 最 適 化 が 必 要 で あ る。 そ こ で,Leave-One-Out Cross-Validation Test (LOOCVT)と,感度分析法(Tanabe et al., 2013)(各指標の感度を計算し,その感度の 低い指標を順次削除しながら SVM 解析を行って予測値と実測値の平均二乗誤差(RMSE) が最小となる点を探索する方法)の 2 つを組み合わせた以下の手順を用いた。 ①全データを 10 群に分割し,第 1 群を予測セット,その他の群をまとめて学習セットと する。 ②学習セットについて LOOCVT により 3 つのパラメータ g,c,p をグリッドサーチして RMSEの最小点を探し,このモデルに予測セットの指標値を入力して平均寿命の予測 値を求める。 ③第 2 群以下の各群を予測セットとして以上の操作を繰り返し,全データの RMSE を求 める。 ④各指標の感度を求めるために,当該指標は実際の数値に設定し,その他の指標は平均値 に設定したデータを予測セットとしてモデルに入力し,出力値を求める。 ⑤当該指標の設定値を説明変数,出力値を目的変数とする単回帰分析を行い,回帰直線の Li fe e xp ec ta nc y Li fe e xp ec ta nc y

(10)

傾きをその指標の感度とする。 ⑥全指標の中で感度の絶対値の最も小さい指標を取り除き,以上の操作を繰り返す。 ⑦指標数とパラメータ g,c,p の組み合わせの中で,全データの RMSE が最小になる指 標の組み合わせを決定要因とする。

3

 結果と考察

 以上の方法により,全 42 種の候補指標から出発して SVM モデルを最適化した結果, 指標 13 種で予測値と実測値との RMSE が最小となった。したがって,この 13 種の指標 が世界 161 カ国の平均寿命の決定要因となる。Fig. 3 に示すように,161 カ国全体での平 均寿命の RMSE は 2.39,回帰決定係数(R2)は 0.926 であり,各国の平均寿命が先行研究 よりはるかに高い精度で再現されている。ただし,先進国では予測値と実測値の一致が概 ね良いが,途上国では誤差が先進国より大きい。この原因は途上国の中に誤差が大きい国 が幾つかあるためであり,特にスワジランド,南アフリカ共和国,レソト,ジンバブエの 4カ国は RMSE の 3 倍以上の誤差がある。これらの国については用いたデータ(平均寿 命または各種指標)の信頼性に問題がある可能性が示唆される。 9 ⑤ 当該指標の設定値を説明変数,出力値を目的変数とする単回帰分析を行い,回帰直線の 傾きをその指標の感度とする。 ⑥ 全指標の中で感度の絶対値の最も小さい指標を取り除き,以上の操作を繰り返す。 ⑦ 指標数とパラメータg

c

p の組み合わせの中で,全データの RMSE が最小になる指標 の組み合わせを決定要因とする。

3 結果と考察

以上の方法により,全42 種の候補指標から出発して SVM モデルを最適化した結果,指 標13 種で予測値と実測値との RMSE が最小となった。したがって,この 13 種の指標が世161 カ国の平均寿命の決定要因となる。Fig. 3 に示すように,161 カ国全体での平均寿命RMSE は 2.39,回帰決定係数(R2)は0.926 であり,各国の平均寿命が先行研究よりは るかに高い精度で再現されている。ただし,先進国では予測値と実測値の一致が概ね良い が,途上国では誤差が先進国より大きい。この原因は途上国の中に誤差が大きい国が幾つ かあるためであり,特にスワジランド,南アフリカ共和国,レソト,ジンバブエの4 カ国RMSE の 3 倍以上の誤差がある。これらの国については用いたデータ(平均寿命または 各種指標)の信頼性に問題がある可能性が示唆される。 40 50 60 70 80 90 40 50 60 70 80 90

Observed life expectancy

Pr ed ic te d lif e e xp ec ta nc y

Fig. 3. Scatter plot of observed versus predicted life expectancy of developed countries (filled circle) and developing countries (open circle)

Fig. 3.  Scatter plot of observed versus predicted life expectancy of developed countries (filled circle) and developing countries (open circle)

ex

pe

ct

an

(11)

 非線形解析手法である SVM により得られた以上の結果に対し,同じデータを用いて OLSにより解析(最適指標の選択は逐次減少法を採用)すると,R2は 0.794 と SVM の場 合よりかなり低くなる。また,OLS を用いて多数国を解析している先行研究でも R2は 0.7 以下である。これらの結果から,各種指標と平均寿命との関係は非線形性が高いため, OLSでは精度の良い結果を得ることが難しく,平均寿命推算モデルを作成するためには SVM等の非線形解析手法を用いることが必須であると結論できる。  決定要因 13 種を含む 42 種の説明変数について感度分析法で得られた感度を Table 5 に 示す。決定要因 13 種のすべてについて考察することは紙面の関係から割愛せざるを得な いので,ここでは以下の 2 点のみ考察する。第 1 は健康指標の重要性であるが,Table 5 のように,乳児死亡率をはじめとする健康指標が 6 種も入り,それらの感度から推定され る影響度の合計が過半であることから,長寿には健康が最も重要であるという当然の結果 が導かれる。しかし,本研究ではこれら 6 種の指標以外に,摂取カロリー,脂肪摂取量, 肥満度,喫煙率,飲酒量,婚姻率,離婚率,信仰度の 8 指標も候補説明変数に取り上げた が,これらの指標はいずれも決定要因にはならなかった。一方,先行研究における平均寿 命の決定要因は解析対象が先進国,途上国であるかにより異なっている。我が国の平均寿 命の決定要因については,各都道府県の平均寿命のデータを用いて分析した研究が幾つか あり,例えば鈴木(2003)は健康分野の説明変数として喫煙率,飲酒率,医師数,病院数 等を用いて解析し,平均寿命の決定要因として男性では飲酒率と病院数,女性では老人 ホーム定員数を示した。また,Shaw et al.(2005)は OECD19 カ国の平均寿命を解析し, 決定要因としてタバコ,アルコール,脂肪,野菜の摂取量を挙げた。一方,Kabir(2008) は途上国 91 カ国の平均寿命の解析から,栄養不足度,医師数,医療費,出生率等を決定 要因としている。これらの結果は,先進国では喫煙,飲酒,肥満等の生活習慣因子の影響 が大きいが,途上国では医療水準因子の影響が大きいことを示唆する。したがって,本研 究において生活習慣因子が平均寿命の決定要因にならなかったのは,先進国と途上国を含 む 161 カ国を解析したが,途上国の比率が高いため,と考えられる。  第 2 は経済指標の影響度として,所得格差と健康との関係に関する相対所得仮説(近 藤 , 2005; 川上他 , 2006; 近藤 , 2010)を考察する。経済指標については最初,所得と平均 寿命の関係が調べられ,貧困国ほど寿命が短いという関係があると報告された。しかし, この関係は貧困国のみに成立し,先進国では所得が向上しても寿命は伸びないことが判明 した。そこで,次に見出されたのが,所得格差の大きい国ほど寿命が短いという相対所得 仮説である。しかし,この仮説については多くの反証が出されており,結論が出ていな い。本研究の結果では,Fig. 4 に示すように,世界 161 カ国の平均寿命に対して GpC の 相関係数は 0.772 と高いが,感度は 0.026 ときわめて低く,指標 42 種の内で上から 28 位 である。一方,ジニ係数は平均寿命との相関係数(-0.416, Fig. 4)も感度(-0.010 で 40 位)もきわめて低く,相対所得仮説を支持する結果ではない。この仮説の成否について は,さらに多くの国および説明変数のデータを用いた検証が必要である。ただし,国民所 得は平均寿命に対する直接的影響は低いが,他の要因である健康,政治,環境,生活・文 化等の分野の水準の向上に大きな影響を与えることは明らかである。すなわち,GpC に 対して教育費(相関係数 0.913),医療費(0.833),軍事費(0.717)等,相関の高い指標が

(12)

Table 5. Sensitivities of 42 explanatory variables

No Explanatory variable Field Sensitivity

1 Infant mortality rate Health -0.636

2 GDP growth rate Economy 0.234

3 Wealth Economy 0.225

4 Suicide rate Health -0.190

5 Hospital beds Health -0.110

6 Urban population Environment -0.090

7 Health expenditure Health 0.078

8 Birth rate Health -0.078

9 Tax rates Economy -0.077

10 Physicians Health 0.069

11 Intelligence quotient Education 0.060

12 Military expenditure Political -0.046

13 Terrestrial protected area Environment -0.046

14 Marriage rate Health 0.043

15 Divorce rate Health -0.042

16 Water access Environment 0.042

17 Calorie intake Health -0.041

18 Fat intake Health 0.038

19 Electricity access Environment 0.035

20 Armed forces Political 0.034

21 Grain self-sufficiency rate Economy -0.031

22 Air pollution Environment -0.030

23 Forest area Environment -0.029

24 Poverty rate Economy -0.028

25 Crime rate Social -0.027

26 Household consumption expenditure Economy 0.026

27 Senior worker Economy 0.026

28 Gross domestic product Economy -0.026

29 Literacy rate Education -0.024

30 Murder Rate Social -0.024

31 Unemployment rate Economy -0.023

32 School life expectancy Education 0.020

33 Internet Culture 0.019

34 Education expenditure Education 0.019

35 Obesity Health -0.017

36 Latitude Geography -0.016

37 Alcohol consumption Health -0.013

38 Religion Health -0.013

39 Smoking prevalence Health 0.013

40 Gini coefficient Economy -0.010

41 Motor vehicle Economy -0.005

42 School enrollment, tertiary Education -0.002         Bold letters : Determinants of life expectancy.

(13)

78 鈴木孝弘・田辺和俊 多数存在する。したがって,経済的要因は平均寿命に対して直接的影響は低いが,間接効 果は大きいといえる。 12 ジニ係数は平均寿命との相関係数(-0.416, Fig. 4)も感度(-0.010 で 40 位)もきわめて低 く,相対所得仮説を支持する結果ではない。この仮説の成否については,さらに多くの国 および説明変数のデータを用いた検証が必要である。ただし,国民所得は平均寿命に対す る直接的影響は低いが,他の要因である健康,政治,環境,生活・文化等の分野の水準の 向上に大きな影響を与えることは明らかである.すなわち,GpC に対して教育費(相関係 数0.913),医療費(0.833),軍事費(0.717)等,相関の高い指標が多数存在する。したが って,経済的要因は平均寿命に対して直接的影響は低いが,間接効果は大きいといえる。 40 50 60 70 80 90 0.9 1.1 1.3 1.5 1.7 1.9 Log(GpC) Li fe e xp ec tan cy 40 50 60 70 80 90 1.3 1.5 1.7 1.9 Log(Gini) Li fe e xp ec tan cy

Fig. 4. Scatter plot of life expectancy versus Log(GpC) (left) and Log(Gini) (right)

4 結論

世界161 カ国の平均寿命を目的変数,健康,経済,政治・社会,教育・文化,地理・環 境の5 分野の 42 種の指標を説明変数として用い,サポートベクターマシン SVM モデルを 学習し,感度分析法により指標を最適化した。その結果,13 種の指標で世界 161 カ国の平 均寿命が回帰決定係数(R2)0.926 という先行研究よりはるかに高い精度で再現できるこ と,および,13 種の指標の中では乳児死亡率や医療費等の健康要因の影響度が全体の過半 を占めることが明らかになった。 しかし,本研究の結果にも幾つかの課題がある.第1 は本研究の結論の一般性の検証で ある。すなわち,WHO の報告書や先行研究によれば,平均寿命を決定している要因には 本研究で取り上げた指標以外に,住居,家族・友人,余暇・趣味・ボランティア活動等, 様々な要因が挙げられている。しかし,これらの要因は少数の国しか指標の数値がないた

Fig. 4. Scatter plot of life expectancy versus Log(GpC) (left) and Log(Gini) (right)

4 結論

 世界 161 カ国の平均寿命を目的変数,健康,経済,政治・社会,教育・文化,地理・環 境の 5 分野の 42 種の指標を説明変数として用い,サポートベクターマシン SVM モデル を学習し,感度分析法により指標を最適化した。その結果,13 種の指標で世界 161 カ国 の平均寿命が回帰決定係数(R2)0.926 という先行研究よりはるかに高い精度で再現でき ること,および,13 種の指標の中では乳児死亡率や医療費等の健康要因の影響度が全体 の過半を占めることが明らかになった。  しかし,本研究の結果にも幾つかの課題がある.第 1 は本研究の結論の一般性の検証で ある。すなわち,WHO の報告書や先行研究によれば,平均寿命を決定している要因には 本研究で取り上げた指標以外に,住居,家族・友人,余暇・趣味・ボランティア活動等, 様々な要因が挙げられている。しかし,これらの要因は少数の国しか指標の数値がないた め,多数の国を統一的に扱う本研究では採用できなかった。したがって,これらの指標の データを何らかの方法で入手して解析を行い,その結果を検証することは今後の課題であ る。  本研究の結果では,平均寿命に対する経済的指標の直接的効果は低いが,間接効果は大 きいことが明らかになった。健康の社会的決定要因については階層構造を形成すると考え られており(近藤 , 2005; 川上他 , 2006; 近藤 , 2010),このような階層構造を考慮した平均 寿命の決定要因の分析は本研究の結果の展開として重要なテーマであるので,今後の課題 として検討していきたいと考えている。 Li fe e xp ec ta nc y Li fe e xp ec ta nc y

(14)

参考文献

Anand, S., Ravallion, M.(1993). Human development in poor countries: on the role of private incomes and public services. J. Econ. Perspect, 7, 133-150.

Bayati, M., Akbarian, R., Kavosi, Z. (2013). Determinants of life expectancy in eastern Mediterranean region: a health production function. Int. J. Health Policy Manage., 1, 65-71. Bergh, A., Nilsson, T.(2009). Good for living? On the relation between globalization and life

expectancy. World Dev., 38, 1191-1203.

Castello-Climent, A.(2011). Channels through which human capital inequality influences economic growth. J. Hum. Cap. 4, 394-450.

Chang C.C., Lin C.J. LIBSVM: a library for support vector machines, http://www.csie.ntu. edu.tw/∼cjlin/libsvm/, accessed 2011/12/1.

Christensen, K., Vaupeld, J.W.(1996). Determinants of longevity: genetic, environmental and medical factors. J. Intern. Med., 240, 333-341.

CIA, United States Central Intelligence Agency Factbook, https://www.cia.gov/library/ publications/the-world-factbook/rankorder/rankorderguide.html, accessed 2013/2/1. Credit Suisse, Global Wealth Databook, http://www.cfainstitute.org/learning/products/

publications/contributed/pages/global_wealth_databook_2012_-_credit_suisse.aspx, accessed 2013/2/1.

Cristianini, N., Shaw-Taylor, J.(2000). An introduction to support vector machines and other kernel-based learning methods. London : Cambridge University Press: 大北剛(訳). サポー トベクターマシン入門 . 東京:共立出版 , 2005.

Desbordes, R., Azemar, C.(2008). Public governance, health and foreign direct investment in sub-Saharan Africa. J. Afr. Econ., 18, 667-709.

Doytch, N., Kelly, I.R., Dave, D.M.(2012). Global health and the economy. Hum. Biol. Rev. 1, 100-122.

Eutimes, The European Union Times, http://www.eutimes.net/2009/11/iq-by-country/, accessed 2013/2/1.

FAO, United Nations Food and Agriculture Organization Statistics Division, http://faostat. fao.org/site/567/default.aspx#ancor, accessed 2013/2/1.

Gallup, Gallup Global Reports, http://www.gallup.com/poll/142727/religiosity-highest-world-poorest-nations.aspx#2, accessed 2013/2/1.

Grosse, R.N., Perry, B.H.(1982). Correlated of life expectancy in less developed countries. Health Policy Educ., 2, 275-304.

ICPO, International Criminal Police Organization Online Databases, http://www.uia.be/s/ or/en/1100039431, accessed 2013/2/1.

ILO, International Labour Union LABORSTA, http://laborsta.ilo.org/, accessed 2013/2/1. IMF, International Monetary Fund World Economic Outlook Database, http://www.imf.org/

(15)

Kabir, M. (2008). Determinants of life expectancy in developing countries . J. Dev. Areas, 41, 185- 204.

Mehrara, M., Nasibparast, S.(2012). Determinants of health status in developing countries: a Bayesian econometric approach. Int. J. Soc. Sci Tom., 1, 1-7.

OECD, Organisation for Economic Co-operation and Development Statistics, http://www. oecd.org/statistics/, accessed 2013/2/1.

Shaw J.W., Horrace W.C., Vogel R.J. (2005). The determinants of life expectancy: an analysis of the OECD health data. South Econ. J., 71, 768-783.

Skolnik R.(2008). Essentials of global health. Chapter 2: Health determinants, measurements, and trends. Sudbury MA, USA: Jones and Bartlett Publishers.

Tanabe, K., Kurita, T., Nishida, K., Lu i , B., Ami , D., Suzuki, T. (2013). Improvement of carcinogenicity prediction performances based on sensitivity analysis in variable selection of SVM models. SAR QSAR Environ Res., 24, 565-80.

UN, United Nations Development Program Human Development Report, http://hdr.undp. org/en/, accessed 2013/2/1.

WB, World Bank World Development Indicators, http://data.worldbank.org/indicator; World Bank Global Development Network Growth Database http://econ.worldbank.org/ WBSITE/EXTERNAL/EXTDEC/EXTRESEARCH/0,,contentMDK:20701055∼ pagePK:64214825∼piPK:64214943∼theSitePK:469382,00.html, accessed 2013/2/1. WHO, World Health Organization World Health Statistics, http://www.who.int/gho/

publications/world_health_statistics/en/index.html, accessed 2013/2/1.

World Health Organization, Social determinants of health: the solid facts, http://www.euro. who.int/__data/assets/pdf_file/0005/98438/e81384.pdf: 健康の社会的決定要因:確かな 事 実 の 探 究 第 2 版 , http://www.tmd.ac.jp/med/hlth/whocc/pdf/solidfacts2nd.pdf, accessed 2013/8/1.

World Health Organization (2003). The World Health Report 2003: Shaping the future. Geneve: World Health Organization.

World Health Organization, Closing the gap in a generation: health equity through action on the social determinants of health, http://whqlibdoc.who.int/hq/2008/WHO_IER_ CSDH_08.1_eng.pdf:一世代のうちに格差をなくそう:健康の社会的決定要因に対する 取り組みを通じた健康の公平性 , http://sdh.umin.jp/translated/2008_csdh.pdf, accessed 20138/8/1. 阿部重夫 (2011). パターン認識のためのサポートベクトルマシン入門 . 東京:森北出版. 岡本大輔 (2006). AI による企業評価 . 東京:中央経済社. 小野田崇 (2007). サポートベクターマシン . 東京:オーム社. 川上憲人 , 小林廉毅 , 橋本英樹(編)(2006). 社会格差と健康―社会疫学からのアプロー チ . 東京:東京大学出版会 . 近藤克則 (2005). 健康格差社会―何が心と健康を蝕むのか . 東京 : 医学書院 . 近藤克則 (2010). 幸福・健康の社会的決定要因―社会疫学の視点から . 科学 , 80, 290-294.

(16)

杉澤秀博(2012). 健康の社会的決定要因としての社会関係:概念と研究の到達点の整理 . 季刊・社会保障研究 , 48, 252-265. 鈴木健二(2003). 各種社会指標と都道府県別生命表の関係 . 厚生の指標 , 50, 30-35. 田辺和俊(2003). Neurosim/L によるニューラルネットワーク入門 . 東京:日刊工業新聞 社 . 時永祥三 (2000). 複雑系による経済モデル分析 . 福岡:九州大学出版会. 古川俊之(1996). 寿命の数理 . 東京:朝倉書店 . 古川雅一(2005). 社会経済的環境を考慮した , 被援助国データによる出生時平均余命及び 乳児死亡率の決定要因分析 . 日衛誌 , 60, 335-344.

Table 1. Summary of literature review on statistical determinant analysis of life expectancy
Table 2. Distribution of 161 countries LE range Developed
Table 3. Dependent and explanatory variables
Fig. 1. Scatter plot of life expectancy versus infant mortality rateTable 3. (continued)
+6

参照

関連したドキュメント

非自明な和として分解できない結び目を 素な結び目 と いう... 定理 (

Research Institute for Mathematical Sciences, Kyoto University...

解析の教科書にある Lagrange の未定乗数法の証明では,

在させていないような孤立的個人では決してない。もし、そのような存在で

世世 界界 のの 動動 きき 22 各各 国国 のの.

(今後の展望 1) 苦情解決の仕組みの活用.

• パフォーマンス向上コーディネーター( PICO )を発電所各部に 配置した。 PICO は、⽇々の不適合/改善に関するデータのスク

These two kinds of oil behave similar characteristics, but it can be shown that the difference of the pressure increasing rate or P-T curves are come from the difference of