(3) 指導において,アンケートを用いて,学習者に
英語力を自己評価させることがある。この自己評 価を通して,学習者は自分の学習を内省すること ができる。しかし,アンケートに回答するだけで は,全ての学習者が適切に自己評価できるとは限 らない。特に,アンケートの項目数が多い場合,
自己評価はより困難になる。
そこで本稿では,アンケートへの回答結果を学 習者にわかりやすくフィードバックする方法とし て,「学生自己評価アンケート」(投野編,2013)の 結果を,潜在プロファイル分析を用いて整理した 筆者の研究を紹介する。
アンケートに回答させる=自己評価,ではない 本学生自己評価アンケートは,学習者の英語力 に対する自己評価を,読む,聞く,書く,話す
(発表,やりとり)の5 領域別に測定する尺度で ある。尺度項目は
Pre-A1
からC2
までの12段階 に分かれており,このアンケートに回答すること で,学習者は自分の英語力が,どのCEFR-J
レベルに該当するか自己評価することができると考 えられる。「ゆっくりと話されれば,日常の身近 な単 語を聞き と る こ と が で き る。」の よ う に
CAN-DO
形式で記述されている(投野編,2013 の付録CD-ROM)。しかし,このアンケートは,各領域22項目,計 110個もの項目から構成されている。そのため, 学習者にただ回答させただけでは,自分の英語力 がどれくらいなのか,学習者が適切に自己評価し, 把握するのは難しい。また,教員が110項目もあ るアンケートを確認し,学習者 1 人 1 人に回答結
果をフィードバックするのも効率的だとはいえな い。よってこのアンケートから得られた自己評価 結果を学習者にわかりやすくフィードバックする ためには,統計分析の力を借りる必要がある。
その分析手法,本当にベストな選択肢ですか?
ここで筆者が直面した課題は,110項目のアン ケートデータをどうやって分析するかであった。
まず筆者が思いついたのは,因子分析とクラスタ ー分析だが,これらの分析手法は本当にベストな 選択肢だといえるだろうか。
例えば,因子分析を使えば,
A
レベル因子,B
レベル因子,
C
レベル因子のようなものがある か検討することができる。しかし,CEFR
レベルは,あくまで言語コミュニケーション能力を
A
,B
,C
という便宜的なレベルに分けたものであり,A
,B
,C
レベルという因子があることを想定し たものではない。そのため,因子分析は学生自己 評価アンケートを分析する最適な統計手法だとは いえない。また,クラスター分析を使えば,
A
レベルクラスター,
B
レベルクラスターなどのように,変 数群に類似した値を示す観測変数からなるクラス ターを特定することができる。しかし,クラスタ ー数の選択プロセスが恣意的であり(Lubke &Muthén,2005),分析結果の再現可能性が低いこと
が指摘されている(Pastor et al., 2007)。そのため, クラスター分析も最適な分析法とは言いがたい。
そこで筆者が思いついたのは,筆者が修士課程 の時に,自己決定理論(
self-determination the- ory
)という動機づけ理論の専門書(Ryan & Deci,自己評価結果の学習者へのフィードバック
─潜在プロファイル分析を用いた自己評価アンケート分析
Baba Shotaro
馬場正太郎
(東京外国語大学大学院博士後期課程)
第 35 回 英語教育研究
最前線
(5) (4)
2017)を読んだ時に知った,潜在プロファイル分 析という統計手法の活用であった。
潜在プロファイル分析とは
潜在プロファイル分析(
latent profile analysis
) とは,潜在混合分布モデル(latent mixture mod- el
)の一種であり,量的な観測変数群の背後に想 定される複数の母集団をプロファイルという潜在 変数として位置づけ,標本がどのプロファイル(i.e.,母集団)に所属するのかを確率的に表すた めの分析法である(竹林,2014)。
学生自己評価アンケートの分析に置き換えれば, この学習者は
A1
プロファイル,あの学習者はB1
プロファイル,などのように目には見えない(i.e.,潜在的な)母集団(i.e.,プロファイル)に, 学習者(i.e.,標本)がどれくらいの確率で所属す るのか検討する多変量解析だといえる。
潜在プロファイル分析の利点は,
AIC
やBIC
などの情報量規準や,プロファイルの分類の正確 さの指標である
Entropy
を算出したり,異なる プロファイル数の比較について検定をおこなった りすることで,クラスター分析よりも客観的にプ ロファイル数を判断できるところにある(Marsh et al.,2009; Morin et al.,2016; Pastor et al.,2007)。 潜在プロファイル分析を使用した先行研究を調べ たところ,外国語学習動機づけプロファイル(e.g., Oga-Baldwin & Fryer,2018)など,筆者が関心を 寄せる領域で広く使用されており,学生自己評価 アンケートの分析にも使用できると感じた。そこで,筆者は,潜在プロファイル分析を使い, 学生自己評価アンケートデータから,学習者の
CEFR-J
レベルを推定できるか検討することにし た。具体的には,読む,聞く,書く,話す(発表,やりとり)の5 領域のいずれか1 領域の回答全て が無回答だったデータを除いた,高校生2
,
525名 分のデータを分析に使用し,2020年11月におこな われたCEFR-J
シンポジウム2020(以下「CEFR- Jシンポ」とする)では, 5 領域のうち,やりと りデータの分析結果を(馬場,2020b),同年12月 の関東甲信越英語教育学会第44回オンライン研究 大会(以下「KATE大会」とする)では残りの4 領域の分析結果を報告した(馬場,2020a)。潜在プロファイル分析の手順
本稿では統計ソフトウェア
Mplus
(Muthén &Muthén, 1998 2017)を用いた潜在プロファイル分 析の手順をごく簡単に説明する。心理尺度の場合,
尺度によって最大値や最小値,単位が揃っていな いことがある。この場合,因子得点や尺度得点を,
平均値が0 ,標準偏差が1になるように標準化す る必要がある。学生自己評価アンケートの場合,
全ての項目が4 件法で測定され,単位は揃ってい たことから,得点は標準化せず,投野編(2013)
付録の
CD-ROM
内のファイルの数値(i.e., 生デ ータ)をそのまま使用した。適切なプロファイル数を判断する指標として, 先行研究では主に以下の3 種類が報告されている。 1つ目は,ブートストラップ法による尤度比の 差の検定(Bootstrap loglikelihood ratio test, BLRT) の結果である。
BLRT
では,プロファイル数がk
− 1 個のモデルと
k
個のモデルの尤度比の差の検 定結果が出力され,検定結果が有意であった場合,プロファイル数が
k
− 1 個のモデルを棄却し,k
個のモデルを採択すると判断する。
2つ目は,
AIC
(Akaikeʼs Information Criterion),BIC
(Bayesian Information Criterion),SSA-BIC
(sample size adjusted Bayesian Information Crite- rion)という情報量規準である。これらの値が小 さいモデルほど,いいモデルだと判断する。 3つ目の指標は,分析対象者が当該のプロファ イルに適切に分類されている度合を示す
Entropy
である。
Entropy
は0から1までの値を取り,値 が1に近いモデルほどいいモデルだと判断する。 これらの指標を算出するために,推定法,ラン ダムスタートの初期値,出力する最適解の数,ブ ートストラップのサンプリング回数,反復回数を それぞれ設定する。分析設定の詳細については,マニュアル(Asparouhov & Muthén,2012; Geiser, 2010; 竹林,2014),潜在プロファイル分析を使用し た先行研究(e.g., Morin & Marsh,2015),
Col- lins and Lanza
(2010)の解説などを参考にして 欲しい。筆者の研究では,まず
BLRT
を使って適切な プロファイル数の範囲を特定し,その後,情報量 規準を使い,最適なプロファイル数を判断した。CUTTING-EDGE RESEARCH 英語教育研究最前線[ 1 ]
(5) また,
Entropy
もプロファイル数を判断する際の参考にした。
CEFR-J シンポと KATE 大会で発表した成果 潜在プロファイル分析の結果,読む,聞く,書 く,話す(発表,やりとり)の5 領域について, それぞれ異なるプロファイル数に分かれることが 明らかにされた。例えば,やりとりの分析結果か ら,高校生の英語力に対する自己評価は,10個の プロファイルに分けることができることが明らか にされた(馬場,2020b; 図 1 )。この図 1のような 形に潜在プロファイル分析の結果をまとめてから 学習者にフィードバックすることで,どれくらい 英語を使えるプロファイルに自分が所属している かが視覚化的にわかりやすくなり,自分の英語力 をより正確に把握しやすくなると考えられる。
なお,やりとりの分析結果については,
CEFR- J
のリソースページ(http://www.cefr-j.org/down load.html)に筆者の発表動画がアップされている。 本稿を読んで潜在プロファイル分析に興味を持た れた方は,そちらも是非ご覧いただきたい。慣れない分析手法にチャレンジする意義と注意点 慣れない分析手法にチャレンジする意義がある とすれば,今までの統計学習の仕方や研究で使用 してきた分析手法が適切だったのか内省できる点 と,今後データ分析する際に使える統計手法のレ パートリーが増え,自分の研究計画がより洗練さ れる点にあると思う。
国内でまだ十分知られていない分析手法を実践 するのには,かなりの勇気が必要である。なぜな ら,生半可な気持ちで取り組めば,その分析手法 を誤った形で世間に広めてしまう恐れがあるから
である。少なくとも潜在プロファイル分析は,ほ とんどの英語教育関係者が知らないと思われたた め,この分析手法を使う際は,関連の研究をかな り読みこんだ。その過程で,今まで学習した統計 分析の手法を内省し,理解が不十分だった点を見 つめ直すことができた。
また,今まで知らなかったジャーナルを知るこ と も で き た。そ れ は,本稿で も引用し て い る
Structural Equation Modeling: A Multidisci- plinary Journal
である。このジャーナルでは, 潜在プロファイル分析など,分析モデルに潜在変 数を組み込んだ統計手法を広く扱った論文が多数 掲載されている。元々は潜在プロファイル分析の 勉強のために読み始めたジャーナルであったが, 博士論文でも,潜在プロファイル分析や構造方程 式モデリングを使用するため,このジャーナルを 購読することにした。このように,慣れない分析 法の勉強をする過程で,自分の研究を遂行する上 で有用なジャーナルの存在を知ることができたの は大きな収穫であった。一方,慣れない分析手法に手を出すときには, いくつか注意が必要である。第 1に,分析手法に 慣れるのに想定以上の時間がかかってしまう場合 があるという点である。筆者の研究では,シンタ ックスの設定を誤ると, 8 分程度で完了する分析 が2 時間以上かかってしまうということがわかっ た。 1つの領域につき2 時間なので, 5 領域合わ せると,10時間も浪費する計算になる。統計分析 のテキストにこうした失敗事例が書かれているこ とは決して多くはない。まだ広く普及していない 分析手法を使うときは,少しでも分析にかかる時 間を短縮して,分析結果の考察や学習者へのフィ ードバック活動により多くの時間を割けるよう, 成功事例だけでなく失敗事例も積極的に公表する ことが大切である。
また,統計分析によっては,コンピュータの知 識が一定程度必要になることも注意点として挙げ られる。本稿で取り上げた研究を行った際,シン タックスの設定を試行錯誤したり,
Mplus
開発者 のウェブサイトを調べたりした結果,分析の際に 使用するCPU
のプロセッサ数を指定することで, 分析時間を短縮できることを知った。パソコンを 図 1 やりとりに関する潜在プロファイル分析の結果注)紙幅の都合により,Pre-A1レベルは省略している。
CUTTING-EDGE RESEARCH 英語教育研究最前線[ 1 ]
(6)
自作した経験があった筆者は,ちょうど所有して いたパソコンが事故で壊れてしまったこともあり,
CPU
のプロセッサ数が32個あるパソコンを新た に自作した。英語教育関係者が読む統計分析の解 説書に,分析に必要なパソコンのスペックが書か れていることは必ずしも多くはない。プロセッサ 数を増やしたからといって全ての分析が速くなる わけではないが,少なくとも潜在プロファイル分 析を使おうとしている場合は,プロセッサ数にも 気を配りながらパソコンを選ぶ必要があるだろう。 今後やってみたいこと本稿で取り上げた研究では,高校生のデータの 分析結果しか発表できなかったため,中学生や大 学生でも同じ
CEFR-J
プロファイルが見られる かについても今後研究成果にまとめたい。 その際,サンプルサイズやシンタックスの設定 を変えることで,分析の所要時間がどれくらい変 わるのか,シミュレーション研究もしてみたい。 幸運なことに,口頭発表後,Ryzen Threadripper 3990X
という,コア数が64個,プロセッサ数は128 個もあるCPU
を搭載したコンピュータを使う機 会に恵まれたので,口頭発表の時に使用したCPU
と分析所要時間を比較し,どのくらいのデータサ イズだとどのくらいのスペックのパソコンであれ ば効率的に分析ができるのか検証してみたい。
その上で,本稿ではできなかった潜在プロファ イル分析の理論的な解説や分析事例の体系的なレ ビューを行い,分析法のチュートリアルを論文に まとめたい。
◆引用文献
Asparouhov, T., & Muthén, B. (2012). Using Mp- lus TECH11 and TECH14 to test the number of latent classes. Mplus Web Notes, 14, 1 17.
馬場正太郎(2020a).「潜在プロファイル分析と潜在 クラスを用いたCEFR-Jレベルの推定─読む,聞 く,書く,発表の4 領域分析と分析結果の統合」
関東甲信越英語教育学会第44回オンライン研究大 会
馬場正太郎(2020b).「潜在プロファイル分析を用い たCEFR-Jレベルの推定」CEFR-J 2020シンポジ ウム
Collins, L. M., & Lanza, S. T. (2010). Latent class
and latent transition analysis: With applications in the social, behavioral, and health sciences.
John Wiley & Sons.
Geiser, C. (2010). Data analysis with Mplus. Guil- ford Press.
Lubke, G. H., & Muthén, B. (2005). Investigating population heterogeneity with factor mixture models. Psychological Methods, 10 (1), 21 39.
Marsh, H. W., Lüdtke, O., Trautwein, U., & Morin, A. J. S. (2009). Classical latent profile analysis of academic self-concept dimensions: Synergy of person- and variable-centered approaches to theoretical models of self-concept. Structural Equation Modeling, 16 (2), 191 225.
Morin, A. J. S., & Marsh, H. W. (2015). Disentan- gling shape from level effects in person-centered analyses: An illustration based on university teachersʼ multidimensional profiles of effective- ness. Structural Equation Modeling: A Multidis- ciplinary Journal, 22 (1), 39 59.
Morin, A. J. S., Meyer, J. P., Creusier, J., & Biétry, F. (2016). Multiple-group analysis of similarity in latent profile solutions. Organizational Research Methods, 19(2), 231 254.
Muthén, L. K., & Muthén, B. O. (1998 2017). Mplus user’s guide (8th ed.).
Oga-Baldwin, W. L. Q., & Fryer, L. K. (2018). Schools can improve motivational quality: Pro- file transitions across early foreign language learning experiences. Motivation and Emotion, 42 (4), 527 545.
Pastor, D. A., Barron, K. E., Miller, B. J., & Davis, S. L. (2007). A latent profile analysis of college students achievement goal orientation. Contem- porary Educational Psychology, 32 (1), 8 47.
Ryan, R. M., & Deci, E. L. (2017). Self-determi- nation theory: Basic psychological needs in moti- vation, development, and wellness. Guilford Press.
竹林由武(2014).「潜在混合分布モデル」小杉考司・
清水裕士(編)『M-plusとRによる構造方程式モ デリング入門』(pp. 228 244)北大路書房
投野由紀夫(編)(2013).『CAN-DOリスト作成・
活用─英語到達度指標CEFR-Jガイドブック』大 修館書店