第 4 章 研究方法
4.3 分析の方法
4.3.2 PLS- SEM(部分最小二乗―構造方程式モデリング)
PLS-SEM
は、1977年Herman Wood
が主成分(principal component)を基盤として開発し たモデルで、測定誤差を最小化し、潜在変数(latent variable)間の予測力を最大化する ため、反復的な推定を続ける方法を使用している(Hair et al. 2014)。
構造方程式モデリング(SEM, Structural Equation Modeling)は、理論検証(
theory testing)のための分析ツールとして広く使われている( Steenkamp and Baumgarter,2000)。
理論ベースの研究モデル(conceptual model)によって、潜在変数間の因果関係を表す。
構造モデル(研究モデル
)を、柔軟かつ多様に設定できるだけではなく、潜在変数、測定
変数(measurement variable)及び測定誤差(measurement error)の間の関係を同時に考
慮し、因果関係を推定する方法である(Kaplan, 2009)。
構造方程式モデリングにおいての関係を推定するアプローチは、パラメータ推定に共分 散を用いる
Covariance based-SEM
と部分最小二乗法(Partial Least Square)を用いるPLS-SEM
の2種類である(Hair et al., 2010; Hair et al., 2011; Hair et al., 2014, pp.14)。
PLS-SEM
は、回帰ベースのアプローチである一方で、本質的にノンパラメトリックで、即ち、残差の仮定(
assumptions)をしない( Hair et al., 2017a)。PLS-SEM
は、サンプ ルサイズが小さい場合においても、複雑なモデルを効率的に分析でき、分析対象のデータ に対して、どのような仮定(たとえ、データ分布の観点においても)もしない(Cassel et al., 1999)。
CB-SEM
の場合は、推奨されるサンプルサイズが、200~ 800
個が必要とするが、PLS-SEM
の場合は
30~100
個でもブートストラップ(bootsrap)法26を用いることで、有意味な統計分析ができる(
Hair et al., 2014, pp.54)。但し、Hair
らは、PLS
経路モデルのため には、最小限のサンプルサイズ(minimum sample size)が10
倍数法則(10 times rule) に従う必要があると論じている。即ち、構造モデルにおいて特定の潜在変数(particular
latent variable)に向かう潜在変数の経路の中で、一番多く受ける矢印の数に対して 10
倍は、最小限に求められると提示している(
Hair et al., pp.20, pp. 75)。
26
ブートストラップ(bootstrap)法とは、統計量やモデルのパラメータの標本分布を推定する簡単で効果的な方法として、標
本そのものから、追加標本を復元抽出して、統計量またはモデルのパラメータを再計算する方法で、データまたは標本統計量が正規分 布に従っているという仮定が必要ない(Bruce and Bruce, 2018, pp.59)。Hair et al.(2014, pp.20)は、特定モデルの検定力の分析において、最小限に必要とす
るサンプルサイズを確認するため、G*Powerのようなプログラムを使用することを奨めて いる。本論文の仮説検定で使うサンプルサイズを考慮すると、PLS-SEM による仮説検定は、2 つの手続きをある
(図 5)。まず、潜在変数を測定する測定変数との関係を表す測定モデル
(measurement model,① )の評価、及び外生潜在変数と内生潜在変数との関係を表す構造
モデル(structure model,②)の評価がある。
PLS-SEM
を採用し、分析に用いる統計プログラムはSmartPLS 3.0(version 3.2.8, Ringle et al., 2015)である。また、記述統計は SPSS 22
を用いて分析を行う。図 5 PLS-SEMの構造および評価の手続き
(
1)測定モデルの評価
測定モデルを評価するためには、信頼性(reliability)と妥当性(
validity)を評価す
る必要がある(Hair et al., 2017a)。信頼性とは、潜在変数を観察する測定変数を用いて測定する上で、どれだけ一貫してい るかの度合いを表す概念である。具体的にいうと、同一な個人に対して、同一な条件のも とで、同一なテストを何回も実施した時、一貫して同一な結果が得られる程度として定義 する(中島
et al., 1999; 岡田, 2011; Shin, 2018)。 PLS-SEM
において信頼性は、潜在 変数の内的整合性(internal consistency reliability)で評価する。内的整合性は、Cronbach’s Alpha、合成信頼度(CR, Composite reliability)、Dijkstra-Henseler's rho_A(ρA)の指標で評価する。
1) Cronbach’ s Alpha
の統計的な定義Cronbach
′s α = [ 𝑀
𝑀 − 1 ] [1 − ∑
𝑀𝑖=1 𝑖𝑠
2𝑠
𝑡2]
M
は、質問の項目数(i=1,…, M)、𝑠
𝑖は各質問項目の分散、𝑠
𝑡は各質問項目を合計した 尺度得点の分散である。Cronbach’s alpha
は、質問項目の数に敏感に反応するため、内 的一貫性を過少評価する傾向があるという限界から、Cronbach’s alpha を使用するより、合成信頼度を使用することを推奨している(
Hair et al., 2014,2017a)。
2) 合成信頼度( composite reliability, CR)の統計的な定義 𝑝
𝑐= (∑
𝑀𝑖=1𝑙
𝑖)
2(∑
𝑀𝑖=1𝑙
𝑖)
2+ ∑
𝑀𝑖=1𝑣𝑎𝑟(𝑒
𝑖)
𝑙
𝑖は、特定の潜在変数の測定変数 𝑖に対する標準化された外部負荷量(standardizedouter loading)を意味し、𝑒
𝑖は、測定変数 𝑖の測定誤差(measurement error)を表す。そして、
𝑣𝑎𝑟(𝑒
𝑖)
は、測定誤差の分散を示し、1 − 𝑙
𝑖2に定義される。M
は、測定変数の数 を表す(Hair et al., 2014, 2017a; Shin, 2018)。妥当性(validity)とは、ある測定変数が目的とする潜在変数を、実際に測れているか どうかの程度を意味する(村山
, 2012)。潜在変数を図る的確な道具であるかどうかを判
断する。妥当性は、収束的妥当性(convergent validity)と弁別的妥当性(discriminantvalidity)で評価する。
収束的妥当性は、測定モデルでの潜在変数を測定する測定変数同士の相関関係が高けれ ば、収束的妥当性があるといえる。
収束的妥当性の評価は、①外部負荷量(outer loading)の適合性、②
AVE(平均分散抽
出,average variance extracted)を用いる。ここで外部負荷量は分析の始まる段階では知
ることができず、PLS Algorithm
を通じて推定される(Hair et al., 2014, pp.77)。3) AVE(平均分散抽出, average Variance Extracted)
AVE
基準は、潜在変数に負荷する測定変数の値を2
乗して、その値の全体平均、即ち、負荷量の
2
乗の総計を測定変数の数で割った値を言う。AVE
の算出式は以下の通りである。AVE = [ ∑
𝑀𝑖=1𝑙
𝑖2𝑀 ]
𝑙
𝑖は、特定の潜在変数の測定変数 𝑖に対する標準化された外部負荷量の2
乗の合計を 意味し、Mは、測定変数の数である。4) Fornell-Larcker
基準Fornell-Larcker
基準は、各潜在変数のAVE
を2
乗した値と、潜在変数同士の相関関係 を比較して、弁別妥当性を評価する。各潜在変数のAVE
の平方根が、潜在変数同士の相関 関係の一番高い値より、大きければ弁別妥当性があると判断する(各潜在変数の√𝐴𝑉𝐸
𝑌1>
相関係数の値 )( Hair et al., 2017a)。
<例 1>Fornell-Larcker
基準による分析Y
1Y
2Y
3Y
4Y
1√𝐴𝑉𝐸
𝑌1Y
2𝐶𝑂𝑅𝑅
𝑌1𝑌2√𝐴𝑉𝐸
𝑌2Y
3𝐶𝑂𝑅𝑅
𝑌1𝑌3𝐶𝑂𝑅𝑅
𝑌2𝑌3√𝐴𝑉𝐸
𝑌3Y
4𝐶𝑂𝑅𝑅
𝑌1𝑌4𝐶𝑂𝑅𝑅
𝑌2𝑌4𝐶𝑂𝑅𝑅
𝑌3𝑌4√𝐴𝑉𝐸
𝑌35) HTMT(heterotrait-montrait ratio)基準
HTMT
による弁別的妥当性の受容基準(Henseler et al., 2015)は、以下の通りに3つ
ある。①HTMT.85
:
一番保守的な基準で、臨界値を0.85
にする(Clark and Watson, 1995;
Kline, 2011)。
②HTMT.90
:
中間程度の基準で、臨界値を0.90
にする(Gold et al., 2001)。
③HTMT推論
:
一番自由な方法で、ブットストラッピング信頼区間利用法。HTMT
推論は、ブートストラッピングを通じて、信頼区間の下限線と上限線を推定し、判断する基準であ る。信頼水準
95%(α=0.05)において、信頼区間(confidence interval)の中に1を含
まなければ、弁別妥当性が確保できたと判断する。しかし、1を含んでいる場合は、弁別 妥当性が不足していると判断する(Hair et al., 2017a)。<例 2>は、HTMT
アプローチについて説明した図である。<例2> HTMT
アプローチHenseler et al.(2015)は、多特性多方法行列(multitrait-multimethod:MTMM
27)を適
用したシミュレーション研究で、一般的な研究状況においてFornell-Larcker
基準は、弁 別的妥当性が信頼できる評価基準ではないと論じている。Henseler らは、HTMT
による弁 別的妥当性を評価する方法を提案した。HTMT
は、弁別的妥当性の評価基準として、潜在変数を構成する測定変数間の相関関係 の有形として、M-H 相関関係とH-H
相関関係の比率で計算できる(Hair et al., 2017a;
Shin, 2018)。
上記の<例2
>をみると、特性( Trait)は、潜在変数を表す。数字は、測定変数間の相関
関係であり、行列の対角線は、測定値の信頼係数である。①
heterotrait-heteromethod correlations (H-H
相関関係):異なる特性、異なる方
法により測定した相関関係②
monotrait-heteromethod correlations (M-H
相関関係:同一な特性、異なる方法 により測定した相関関係HTMT
の計算公式は、以下の通りである(Hair et al., 2017a;Henseler et al., 2015; Shin, 2018)。
27
MTMM
行列とは、複数の特性、すなわち構成概念(潜在変数)を、複数の方法によって、測定したMTMM
データから計 算される相関行列、あるいは共分散行列のことである(久保・豊田, 2013)。HTMT(潜在変数 Y
1, Y
2)=
𝐻−𝐻相関関係の平均値√(𝑌1のM−H相関関係の平均値)×(𝑌2のM−H相関関係の平均値)
=
0.341√(0.712)×(0.409)
=
0.3410.291
=
0.632(
2)構造モデルの評価基準
測定モデルで信頼性と妥当性が確保できたら、構造モデルが適合であるかどうかを確認 する。構造モデルとは、潜在変数間の関係を表す。構造モデルで、潜在変数の配列は、観 察された理論、論理、実証経験に基づく(
Hair et al., 2014)。構造モデルが適合である
と確認できれば、次のステップとして仮説検定を実施する。PLS-SEM
は、CB-SEM とは異なって、一つのgoodness-of-fit
の基準がなく、CB-SEM
に おいての適合度(fit)の統計量は、実際とモデルに適用された共分散行列間の差異により
発生する。その半面、PLS-SME は、独立変数の観測値(測定変数の場合)または近似値(潜在変数の場合)と研究モデルによる予測値間の差異により発生すると指摘している
(
Hair et al., 2014, 2017a)。
構造モデルは、「多重共線性(multicollinearity)」、「決定係数(R²)」、「効果サ
イズ(
f²)」、「予測的適合性( Q²)」および「経路係数の有意性と適合性の評価(仮説検
定
)」というプロセスを通じて評価する。
1) 多重共線性( multicollinearity)
多重共線性とは、潜在変数間の相関関係が高いことを意味する。相関関係が高いと回帰 係数の分散を増加させ、潜在変数と測定変数の間に有意な関係があるにもかかわらず、有 意でないように見せるとか、相関が高い項の係数の符号を誤る場合もあるとされている
(Hair et al., 2014)。多重共線性の判断は、「内部
VIF (Variation Inflation
Factor)値」を用い、この値が 5
未満であれば、多重共線性がないと判断できる(Hair etal., 2017a; Shin, 2018)。 VIF
は、R2を基に計算され、数式は以下の通りである。𝑉𝐼𝐹
𝑖= 1
1 − 𝑅
𝑖2𝑅
𝑖2は、𝑥
𝑖を𝑥𝑖以外の測定変数に回帰した時の決定係数である(栗原・丸山, 2017)。
2) 決定係数( R²)
決定係数
R²は、モデルの予測力(predictive power)、即ち、説明力を意味する。PLS-SEM
は経路モデルにおいて、内生潜在変数のR
2を極大化することが目的で、すべての内生 潜在変数に対して算出される。PLS-SEM
の構造モデルにおいてのR
2は、モデルの予測力を測定した値で、特定の内生潜在変数の実際の値と予測値の間の相関関係を二乗して計算される。つまり、
R²は、内生潜
在変数に対する外生潜在変数の複合効果の影響を表す。また、内生潜在変数に関連付けら れた全ての外生潜在変数によって説明される内生潜在変数の分散量を意味する(Hair etal., 2017a)。 Hair
らは、判断する基準として、分野により異なるが、R²が0.25
であれ ば‘弱い説明力(weak value)’、0.5 であれば‘中間の説明力(moderate value)’、0.75
であれば‘強い説明力(substantial value)’であると評価する(Hair et al.,2011; Henseler et al., 2009; Hair et al., 2017a; Shin, 2018)。
R²の計算式は、以下の通りである。
𝑅
2= 1 −
∑ (𝑦∑ (𝑦𝑖 𝑖−𝑓𝑖)2𝑖−𝑦̅)2 𝑖
(1)
ただし、(1)の決定係数は、外生潜在変数の数を多くすると、R²が高くなる傾向がある ことから、複雑なモデルへの偏りを回避するための基準として、調整された決定係数
(adjusted coefficient of determination, adjR2
)を使用する。調整された R²の計算式
は、以下の通りである(Hair et al., 2017a)。R
𝑎𝑑𝑗2= 1 − (1 − 𝑅
2)
𝑛−1𝑛−𝑘−1
(2)
nは、サンプルサイズ、kは、内生潜在変数の予測に使用される外生潜在変数の数である。