批判的思考力を測定する英語テストの開発パイロット・スタディ

(1)

JACET Journal 64 (2020) 205–225

批判的思考力を測定する英語テストの開発：パイロット・スタディ

The Development of an English Test for Measuring Critical

Thinking Skills: A Pilot Study

HIRAI, Akiyo

University of Tsukuba MAEDA, Hiroki

OKA, Hideaki KATO, Takeshi

Graduate School, University of Tsukuba NAKANO, Emi

Igusa Junior High School

Abstract

Critical thinking ability is a generic ability that should be developed through both English and Japanese language educational curricula. However, there has been no attempt to test this abil-ity for Japanese EFL learners. Thus, we have developed a multiple-choice-items test called the English Critical Thinking Test (ECTT), which measures not only English ability but also three subcomponents of critical thinking skills: logical thinking (consistency), analytical skills (which we name analysis), and drawing appropriate conclusions using inductive and deductive reason-ing (inference). The target level of the test is from A2 to B1 level of the Common European Framework of Reference (CEFR). To evaluate the validity of the test, we built a validity argu-ment based on the framework proposed by Chapelle, Enright, and Jamieson (2008), which consists of six inferences (domain definition, evaluation, generalization, explanation,

extrapola-tion, and use), and examined eventually 22 items, using item analysis, factor analysis,

multi-dimensional scaling, and correlational analysis. As a result, three factors of “Consistency & In-ference,” “English ability & Consistency,” and “Analysis & Calculation” were extracted and the ECTT moderately correlated with the English Proficiency Test (EPT) (r = .43), which provides support for the ECTT measuring English proficiency as well as critical thinking skills.

Keywords: critical thinking test, validity, consistency, analysis, inference

はじめに

様々な情報が価値を持つようになる情報化社会において、求められる教育は刻々と変化している。2009 年に発足した the Assessment and Teaching of Twenty-First Century Skills Project（ATC21S）は、これからの時代で求められる「21世紀型スキル」を提案した。その中で、コミュニケーションやチームワークなどのスキルに加えて、「思考の方法」として批判的思考力を挙げている（Griffin, McGaw, & Care, 2012）。

(2)

日本国内においても、批判的思考力はこれからの社会を生き抜くために必要な認知スキルであるため、教科教育の中で育まれるべきとして、その育成と評価に関心が高まっている（石井, 2015; 文部科学省, 2011, 2012, 2016）。楠見・田中・平山（2012）は、大学の初年次教育に、読解、討論、発表、ライティングを支えるスキルとして批判的思考力を育成することが大切であるとしている。中学校や高等学校でも、理科教育や創作論文を通して批判的思考力を育むことを目的とした授業開発がいくつか報告されている（e.g., 清水・大澤 , 2015; 菊島・寺本・柴原, 2018）。グローバル化が進む中、英語で書かれた資料に目を通し、諸外国の人々と英語で議論や交渉ができる人材が求められており、高校・大学レベルの段階で使用言語を問わず批判的思考を発揮できるようにすることが重要になってきた（e.g., 文部科学省, 2012; 2016）。よって、英語教育においても、高校生を対象とした批判的思考力を育成する英語の教材開発や授業展開例が報告され始めている（大井, 2008; 竹田, 2016; 峯島・今井, 2017）。このように授業実践に関する研究が進められている一方で、批判的思考力を測定･評価する国内での研究は、焦点がまだ十分に当てられていない。海外では、批判的思考力の測定を目的としたテストが開発されており、コーネル批判的思考テスト（Ennis & Millman, 1985）やカリフォルニア批判的思考力テスト（California Critical Thinking Skills Test: CCTST; Facione, 1990）、ワトソン・グレーザー批判的思考テスト（Watson & Glaser, 2002）などがある。しかし、いずれも英語母語話者を対象としており、外国語として英語を学ぶ（English as a Foreign Language: EFL）日本人にとっては英語のレベルがかなり高く、かつ有償で入手しづらいなど、日本でのそのままの利用が困難である。そこで、日本人 EFL 学習者を対象とする英語力および批判的思考力を測定する英語版批判的思考テストの開発を試みた。研究の最終目標は、このテストを完成させることであるが、本研究の目的はパイロット段階として、開発した試作テストの妥当性を検証し、開発課題を明らかにすることである。 主な批判的思考力テスト カリフォルニア批判的思考力テスト 批判的思考力テストで代表的なものに、オンライン環境で受験可能なカリフォルニア批判的思考力テスト（CCTST）がある。このテストは批判的思考に関する専門家間で合意があったとされる Facione （1990）における批判的思考の定義に基づき作成されたものである。 CCTSTは、批判的思考力の下位概念として7つのスキル（分析、解釈、推論、評価、説明、帰納、演繹）を測定するとしている（CCTST, n.d.）。しかし、それぞれの項目が想定されている 7 つの構成概念のどの構成概念を測定しているかの判断が困難で、1 つの項目に対し複数の構成概念が対応していると考えられ、項目の成否の解釈が不明瞭である。また、これに関して、因子分析等による構成概念の詳細な研究報告は見当たらなかった。しかし、批判的思考力の育成を目的とする教育課程を受講した前後で CCTST の点数を比較した際、受講後の点数が高くなったこと、および批判的思考力と高次元の推論（higher-order reasoning）の尺度を評価の要素に含んでいる大学レベルの標準化テスト（Grade Record Examination: GRE）との間に高い相関（r = .72, p < .001）があったことから、構成概念妥当性が担保されているとしている（Insight Assessment, 2016）。さらに、ワトソン・グ レーザー批判的思考テストの得点との間にも有意な相関（r = .41, p < .001）が確認されている （Facione, 2000）。また、CCTSTとGrade Point Average （GPA）との相関分析では、批判的思 考力が成績評価でどの程度考慮されるかによって、r = .20 からr = .46の値と低から中程度の

(3)

相関が報告されている（CCTST, n.d., p. 69）。一方で、Vendrely （2007）の調査では、CCTST とGPA間の相関はみられなかった（r = .10, p > .05）。これらの結果から、様々な要因が絡む 成績評価からは批判的思考力を説明することは難しいことが伺える。日本人を対象に CCTST を使用する上での限界点として、筆者らが 1 フォームを受験した際、英語が難しく規定時間内では到底終了できるものではないことがあげられる。そのため、このテストをそのまま日本人英語学習者を対象として、英語力と批判的思考力を同時に測定するテストとして使用することは現実的ではない。また、日本からは入手が困難で受験コストも高額となる。 日本語版批判的思考テスト 日本人を対象にした批判的思考力の測定に関する研究はまだ少ないが、高見・木下（2017）では、批判的思考を促す授業を考案する中で、生徒の批判的思考力の変容を「他者との関わりによる批判的な気づき」「探究的・合理的な思考」「多面的な思考」「反省的な思考」「健全な懐疑心」の 5 つの因子を反映した全 34 項目から構成される質問紙によって調査している。テスト開発に関わる研究では、平山・田中・河崎・楠見（2010）がコーネル批判的思考テスト（Ennis & Millman, 1985）を日本語訳し、内的整合性および難易度を調整したテストと批判的思考態度尺度、および認知能力を測定する京大 SX との関係を調査している。結果として、日本語版コーネル批判的思考能力テストの成績と京大 SX 内にある文章推理課題の成 績（r = .35, p < . 05C、および乱文構成課題の成績（r = .36, p < . 05）の間に有意な相関がある ことが報告されているが、いずれもそれほど高い相関関係とは言えない。一方、Benesse が行った研究（野澤・伊藤・須永・堂下・村田 , 2016）では、「情報の明確化」「情報の分析」「推論」の 3 つの構成概念を想定した批判的思考力テストと 5 種類のテスト（論述テスト、汎用読解テスト、教科書型読解テスト、短答式・語彙読解テスト、語彙テスト）との関連を調査している。結果として、5つのテストの中では論述テストが最も近い能力を測定していた。ここで用いられた論述テストは、複数の根拠から論理的に主張を展開する「資料活用課題」、妥当でない根拠を指摘する「課題解決課題」、論構造を明確にして論理的に反論する「反論課題」から構成されている。また、Benesse i-Career （n.d.）は Global Proficiency Skills （GPS） -businessやGPS-Academicといったテストにおいて、批判的思考力、創造的思考力、協働的思考力といった3つの思考力をその測定対象としている。このテストでは、批判的思考力として「情報を抽出して吟味する力」が求められるとして、ある主張の背景にある考えを選択肢の中から選び出す問題が例として掲載されている。しかしながら、これらのテストを利用した研究結果は報告されていない。このように、日本国内においては日本語を用いて批判的思考力を測定する取り組みが徐々になされてきているが、英語学習者が英語を使いながら批判的思考力を発揮するテストへの取り組みはまだ見られない。 批判的思考力の定義 具体的な批判的思考力を測定することを目的とするテストを取り上げたが、研究者によって批判的思考力の解釈は多様であり、テストや研究間で一貫していない（道田 , 2001; 2003）。そのような状況で、楠見（2010）はこれまで行われてきた批判的思考に関する研究で用いられている定義から類似点をまとめ、批判的思考を次の4つの側面から定義している。（1）合理的な思考であり、規準に従う思考

(4)

（2）相手を批判する思考とは限らず、自分の推論過程を意識的に吟味する内省的な思考（3）人の話を聞いたり、文章を読んだり、観察したり、議論をしたり、自分の考えを述べる時に、何を信じ、主張し、行動するのかの決定を支えている能動的・主体的思考（4）目標や文脈に応じて実行される目標志向的思考まず、（1）の「合理的な思考」という側面は、Ennis （1987）が言及しており、道理や理屈にかなう論理的･理性的な思考である（道田, 2003）。また、ここでの「規準」とは帰納や演繹、誤の認識などの論理操作のことで、この規準に基づき問いを立て、意思決定を行う（楠見, 2010）。次の（2）については、批判的思考に「批判的」という言葉があるために、相手に批判的になることと考えられがちだが、むしろ自分の思考や推論過程を吟味することを意味する。 Brookfield （1987）では、批判的思考力を身につけている者は、一般的に言われていることや常識を鵜呑みにせず、内省的で懐疑的（reflectively skeptical）であるとしている。つまり、批判的思考とは、早急に判断を下すことなく内省的に熟考することである。（3）は、Ennis （1987）における「何を信じ、行動するかを決定する合理的で内省的な思考」という定義に基づいている。この側面は（1）と（2）の側面を包括した広義の定義であるため、現在、最も多く引用されている（楠見, 2010）。（4）について、批判的思考とは明確な目的を持って行うもの（purposeful）であるとされている（Facione, 1990）。つまり、目標志向的思考を備えている者は、適切な状況下で批判的思考を使用し、そうではない状況では使用しないという判断が下せると考えられる。そのため、目的意識や目標設定は、批判的思考の技能や態度を育成する上で極めて重要だと言われている（糟屋 , 2010）。このように批判的思考はさまざまな側面から構成されており、単一の能力から構成される概念として定めることは容易ではない。しかしながら、ある目標に向かって自分の推論過程を吟味しながら内省的に思考する能力という解釈は研究者間で概ね一致している。 批判的思考のプロセスと批判的思考スキル 批判的思考がどのような要素から構成されるかを考える上で重要となるのが批判的思考のプロセスである（e.g., Ennis, 1987; Zechmeister & Johnson, 1992; 楠見, 2010; 2018）。Figure 1は、楠見（2018）から引用した批判的思考のプロセスのモデルである。このモデルでは、まず、テキストや図表などで情報や課題が提示されると、「明確化」「推論の土台の検討」「推論」のプロセスを経て、「行動決定」がなされる。そして、最終的にそれが実際の行動や発言として表出される。最初の「明確化」では、情報にアクセスし、必要な情報を取り出す。日常生活にれている情報や発言に対し、受け手はまず、その意図や根拠・証拠、その論理的な流れを正しく理解しようとする。そのために、情報が持つ論理構造や結論、理由などを分析的に吟味し、把握する。次の「推論の土台の検討」において、得られた情報の導出過程が首尾一貫したものかを判断していく。具体的には、（a）情報内に隠れた前提を明確にする、（b）信頼するに足りる証拠を用いているかを検討する、あるいは（c）科学的手法やその実験から出た結果を評価する（楠見・道田 , 2016）ことを行う。そして、最後に行われるのが「推論」である。推論は、信頼できる複数の事例や結果から、客観的な結論を導こうとする帰納的、および三段論法などを使用する演繹的推論によって誤りのない結論を導こうとするプロセスである（楠見・子安・道田, 2011）。

(5)

この 3 つのプロセスは、必ずしも順に使われるのではなく、例えば、楠見・田中・平山（2012）のモデルでは、「明確化」に関連するスキルは、「推論の土台の検討」および「推論」が行われる際に必要なスキルとなっている。批判的思考のプロセスは、常に「メタ認知」（Figure 1左上）によってモニタリングおよびコントロールされ、批判的思考の使用者が、その状況や課題に応じて、適切なスキルを選択し、行動決定するまで行われると考えられる。そして、これらのプロセスを可能にしているのが、その分野に特化した領域固有知識やスキルと、様々な批判的思考場面に応用できる汎用的な（領域普遍）知識とスキル（Figure 1左下）である。 英語版批判的思考テスト（ECTT）を構成する測定領域と項目の作成 高い妥当性および信頼性を伴うテストを作成するためには、測定すべき構成概念を定義することが不可欠である。そこで、今回作成する英語版批判的思考テスト（the English Critical Thinking Test: ECTT）の測定領域（target domain）を、Figure 1のモデルにある（a）明確化、（b）推論の土台の検討、および（c）推論という一連の批判的思考のプロセスに必要なスキルとした。しかし、複雑で包括的な思考能力プロセスのすべてのスキルをカバーすることはできない。そこで、CCTSTに使われているテスト項目とその背後にある7つの構成概念を参考にして、測定領域を英文を読む際において、特に重要でかつ選択形式で測定できると思われる一貫性、分析、および推論スキルの3つに絞った。その理由として、まず、テキストを正確に把握するに当たっては、文と文の結束性（cohesion）や文章構造の一貫性（coherence）を手がかりに文章の論理構造の流れを把握し、情報の意味を明確にすることが重要と考える。よって、この結束性と一貫性のスキルをまとめて「一貫性」とした。これは、CCTSTの構成概念の「解釈」、およびモデル（Figure 2）の特に「明確化」プロセスに関わるスキルと考えた。次に、CCTSCTの「計算」と「分析」をまとめて、「分析」スキルとした。文章と図表を使って「計算」をする行為であっても、そこから必要な情報を「分析」し、抜き出すことであると考えたからである。情報を分析するスキルは、Figure1 の「明確化」に関わり、かつ分析した情報が信頼できるものか、矛盾したところはないかなど、必要な情報の真偽を評価・判断する「推論の土台の検討」プロセスにも関わるとした。最後に、CCTST にある「推論」「演繹」「帰納」の間に重なる部分が大きいため、作問にあたってはそれらをまとめて「推論」スキルとした。これは、Figure 1の Figure 1. 批判的思考のプロセス（楠見, 2018）

(6)

「推論」部分に相当する。これらの批判的思考スキルに加えて、今回は英語で問題を解くため、英語力も測定領域に入る。Figure 1を参考に、今回の課題状況を当てはめたのがFigure 2である。 Figure 2. ECTT課題における批判的思考スキルとプロセス ECTT課題の英文が与えられると、領域固有知識・スキルとして、英語の文法や語彙知識および英文読解力などの英語力が必要と考えられる。それと同時に、領域普遍知識・スキルとして、テスト項目によって、想定した批判的思考力である一貫性、分析、または推論のスキルが必要に応じて選択・適用されるといえる。このような批判的思考スキルは、異なった分野における批判的思考をする過程でも応用可能な領域普遍スキルであると言われている（e.g., Ennis,1987; 楠見2010; 道田, 2003; 山本, 2017）。Table 1に今回焦点を当てた3つの批判

的思考力スキルの定義をまとめて示す。 Table 1 ECTTの測定領域とその定義測定領域定義（a）一貫性情報が論理的で、かつ一貫しているかを明確にすること（b）分析情報を分析し、その信頼性、必要性などを評価・判断すること（c）推論演繹的・帰納的に推論することによって、客観的な結論を導くことそして、これらの 3 つの下位概念（一貫性、分析、推論）の問題形式を Table 2 のように定め、このテスト細目に沿って、妥当性のある項目を作るようにした。

(7)

Table 2 測定領域と問題形式測定領域問題形式（a）一貫性 1．会話文や物語文内の文を並べ替える 2．文章中に欠けている文や語を入れる 3．文章中から不要な1文を抜く（b）分析 1．文章を読んで、内容を示す図表を選択する 2．文章や図表から目的に応じた情報を抜き出し、評価する 3．文章や図表から目的に応じた数値を選択し、簡単な計算をして解を導く（c）推論 1．信頼できる複数の事例や結果から、客観的な結論を導く 2．文脈から語彙の意味を推測する 3．いくつかの前提から最も妥当な解を導く従来の多くの筆記試験では、文の語句整序、文法や語句の個別問題、訳や要約、事実を問う内容把握問題など、Figure 2の点線が示すような、領域固有知識である英語力のみに焦点を当ててきた。後述する英語熟達度テスト（EPT）もこれにあたる。しかし、ECTTはTable 2にあるように、基本的な内容把握問題ではなく、読み解いたことを踏まえて批判的思考を働かせて解を導く高次レベルの発問を心掛けた。現実世界における英語を使用する場面においては、英語で書かれた資料を理解しながら、批判的思考を発揮できるかが重要になってくることが多い。つまり、英語力と批判的思考力を別々に発揮できることと、第2言語の環境の中で批判的思考力を発揮できることとは同義とは言えない。よって、ECTT を開発し、英語を読みながら批判的思考を測定し、鍛えようとするところにテストの真正性があり、本研究の意義があると考える。 本研究の目的およびリサーチ・クエスチョン

開発を試みた ECTT の妥当性については、Chapelle, Enright, and Jamieson （2008）が提案している6つの推論（inference）（領域定義、得点化、一般化、説明、外挿、利用）からなる論証（argument）に基づく妥当性検証の枠組みに照らして論じることとする（Table 3）。この枠組みを採用した理由は、ECTTの開発にあたって、最も苦慮したTable 3の1つめの「領域定義（domain definition）」推論が明確に打ち出されているためである。 ECTTに関する解釈的論証に基づいて妥当性検証を行うに当たり、以下の 4 つのリサーチ・クエスチョン（RQs）を設定した。 RQ1: ECTTの各項目の弁別力および難易度は A2 から B1 レベルの受験者にとって妥当であるか。 RQ2: ECCTで批判的思考力の中の想定した3つの構成概念に分けて測定できるか。 RQ3: ECTTは、英語力とどの程度関連するか。 RQ4: 問題を解く際、受験者は作問者が想定した能力を発揮したと感じているか。

(8)

Table 3 ECTT開発における解釈的論証推論論拠の前提論拠に対する裏付け方法 1．領域定義 1． 3 つの下位能力（分析、一貫性、推論）は、批判的思考能力を構成する代表的な下位能力である。 2． ECTT の英文は、B1 レベルであれば十分理解できる英語で書かれている。 1 & 2．先行研究に基づく領域分析と専門家による判断 2．専門家による判断 2．得点化 1．テスト作成のためのテスト細目および採点は目標とする知識やスキルの証拠を得るのに適切である。 2．項目の統計的特徴は適切である。 1．専門家の判断 2．項目分析（RQ1） 3．一般化 1．テスト細目は明確に定義されており、同等の項目を作ることができる。 2．項目が測る能力は一貫している。 1．専門家の判断 2．内的一貫性の分析（RQ1） 4．説明 1．得点は英語力だけでなく、想定した 3 つの構成概念に分かれる。 2．受験者が使う能力は、テスト開発者の予測と一致する。 1．因子分析、相関分析、多次元尺度分析（RQ2） 2．アンケート調査（RQ4） 5．外挿 1．テスト得点は、 B1 レベルの英語学力テストと関連がある。 2．テスト得点は、日本語版批判的思考力と関連がある。 1．相関分析（RQ3） 2．相関分析（今後実施予定） 6．利用 1．テスト得点の意味は、受験者によって明確に解釈できる。 2．ECTTは良い波及効果を持つ。 1．専門家の判断 2．アンケート調査（今後実施予定）

方法

参加者 参加者は、日本人大学1年生計81名（男性53名、女性28名）で、文系クラスと理系クラ ス1クラスずつの学生である。参加者は大学入学時にTOEFL ITP（M = 488.38, SD = 7.93）を 受験しており、ヨーロッパ言語共通参照枠（CEFR; Council of Europe, 2001）のA2レベル後半からB1レベルの英語力と想定される。

マテリアル

英語版批判的思考テスト（English Critical Thinking Test: ECTT）

Table 1およびTable 2で定めたテスト細目を基に、一貫性、分析、推論の各セクションの多肢選択式項目を作成した（付録参照）。英文を理解した後に情報を操作する必要があるため、1項目に約5分と、予想以上に解答時間を要することが予備調査で分かった。つまり、現実的な60分間用テストとすると、多くて1セットに各セクション3∼4項目、計10∼12項目しか含めることができないことになる。よって、今回は少なくとも1セット12項目を完成させることを目指し、各セクション、17 項目、9 項目、9 項目を作問した。一貫性の項目が多いのは、これまでの英語力テストに近い形式で作成しやすかったことに加え、1題に複数項目ある形式（例：文章内の複数の穴あき項目）が含まれているためである。そのような項目も、項目の独立性があり、また個々に削除・修正を検討できることから、すべて独立項目と

(9)

して分析した。分析と推論に関する項目は、これまでの既成の英語の試験になかったため、作成が難しく、就職時に受験するSPI総合検査などを参考にした。

英語熟達度テスト（English Proficiency Test: EPT）

実験時の参加者の英語力を測定するために英語熟達度テスト（English Proficiency Test: EPT）を作成した。使用した項目はA2レベル後半からB1レベルと考えられる実用英語検定の2級と準1級、及びTOEICの問題集から抜粋した。項目分析の結果、機能していない項目が4項目あったため除外し、語彙（9問）、文法（9問）、読解（6問）の計24項目を英語力テストとして以後の分析に使用することとした。信頼性係数はα = .70であった。 質問紙 参加者が ECTT の各項目への回答中にどのような能力を発揮したと感じたかを調べるための質問項目を作成した。発揮した能力の選択肢として、構成概念の3つ（一貫性・分析・推論）および一貫性と関連する「結束性」、続いて、英語熟達度テストの3つの下位概念（語彙・文法・読解）、そして今回の項目では想定していないが、推論を発展させた概念も使用したと感じたかを知るために「創造」を加えた。Table 4のように、これら8つの概念と定義を各項目の回答入力フォームの直下に付け、最後に「その他」として自由記述欄を設けた。 Table 4 質問紙における学習者から見た項目が測っている能力の選択肢とその説明能力領域意味一貫性問題に出てくる記述や論理が最初から最後まで一貫しているか考えた。結束性隣り合った文と文の結びつきを考えた。分析問題に出てくる数値や情報などを分析的に考えた。推論与えられた情報をもとに推論をした。創造与えられた情報や一般的な知識をもとに独自の方法で問題を解いた。読解英文を正確に読んで理解しようとした。語彙英単語の意味に注目した。文法英文法に注目した。その他（自由記述）手順 ECTTは、批判的思考力を高めることを目標とした英語の授業で実施した。毎時間の後半にリーディングで思考力を磨く活動の一環として組み込めるように、ECTTのテスト項目を 4つに分け（set 1 から set 4）、EPT を含め、1 回 30 ∼ 40 分で 5 週間に渡って実施した。最初の 4 週間で ECTT を実施し、5 週目に EPT を実施した。全てのテストは全学で採用している学習支援システムmanaba上で行い、テスト提出後に自動採点され、得点と正解が表示されるようにした。受験の際にはメモを取ることを可とした。また、ECTTの各項目を受験するごとに、上記（Table 4）の質問項目を付け、第1候補から第3候補までを選択させた。学期末には、分析した個別の結果を配布し、解説を行い内省の機会とした。

(10)

結果

ECTTの正答率および弁別力 最初に、セクションごとに弁別力指標として、項目の点双列相関係数を算出し、テスト得点に寄与しない項目を削除し、テストとして使用できる項目を選定する作業を行った。但し、この段階での点双列相関係数による削除基準を .10 以下とし、削除することによって信頼性が改善する項目のみ削除した。通常より低い削除基準を用いた理由として、参加者にとって不慣れな形式のテストを限られた時間内で解くため、実力が発揮できなかった項目もあると予想されることや、英語力と批判的思考力という異なる2つの能力を測定しているためである。削除後に残った項目をセクション別にTables 5∼7に示す。 Table 5 一貫性項目の正答率と弁別力（12項目）設問 C1 C2 C6 C8 C9 C11 C12 C13 C14 C15 C16 C17 M α 正答率 .81 .86 .31 .74 .64 .70 .78 .44 .66 .55 .81 .35 .64 .61 SD .40 .35 .47 .44 .48 .46 .42 .50 .48 .50 .40 .48 弁別力 .24 .37 .18 .36 .20 .27 .24 .27 .45 .19 .15 .28 注．N = 77. 下線項目はTable 9の因子分析3因子仮定に含まれる項目 一貫性セクションでは、弁別力が低かった 5 項目を削除し、最終的に Table 5 にある 12 項目とした。信頼性係数は α ＝ .61 で、英語力と同時に批判的思考を測るテストとしては、十分高い信頼性を得た。難易度も平均が64％と丁度良く、正答率も31％から86％と広く受験者能力をカバーしている。 Table 6 分析項目の正答率と弁別力（5項目）設問 A2 A4 A5 A6 A7 M α 正答率 .82 .91 .92 .91 .94 .88 .52 SD .39 .29 .27 .29 .25 弁別力 .27 .18 .43 .31 .33 注. N = 77. 下線項目はTable 8の因子分析3因子仮定に含まれる項目 分析セクションは、当初の9項目の内、A8は全員正答で、A1、A3、A9は弁別力が低かったため削除し、Table 6に示した5項目を使用できる項目とした。内的信頼性はα = .52であった。平均正答率は 88 ％と易しい項目ばかりであった。これは、設問の英文が短く、解答に要する計算も平易であったからだと考えられる。

(11)

Table 7 推論項目の正答率と弁別力（5項目）設問 I2 I5 I7 I8 I9 M α 正答率 .35 .48 .25 .71 .22 .39 .40 SD .48 .50 .43 .46 .42 弁別力 .13 .21 .21 .24 .22 注．N = 77. 下線項目はTable 9の因子分析3因子仮定に含まれる項目 最後の推論セクション（Table 7）は、9 項目の内、弁別力が低かった 4 項目を削除し 5 項目とした。しかし、4 項目を削除しても、信頼性係数はあまり上昇せず、α ＝ . 40 であった。このセクションの平均正答率は 39 ％と他のセクションより難しいものの、各項目の正答率は 22 ％から 71 ％とばらついており、受験者能力をカバーしているという点でバランスが取れていると言える。 Table 8 ECTTとEPTの記述統計 ECTT（22項目） EPT（24項目）項目数一貫性₁₂ 分析₅ 推論₅ 合計₂₂ 語彙₉ 文法₉ 読解₆ 合計₂₄ M 7.69 4.41 1.96 14.06 4.89 6.10 5.21 16.20 SD 2.33 0.98 1.24 3.08 2.02 1.84 1.07 3.50 正答率 0.64 0.88 0.39 0.64 0.54 0.68 0.87 0.67 注．N = 81. テスト全体で合計 22 項目（Table 8）となり、正答率 64 ％であった。A2 から B1 レベルの項目から集めた EPT の正答率 67 ％とほぼ一致することから、ECTT は、ほぼ CEFR A2 から B1レベルのテストとして使用できると言える。また、上記の 3 セクションのすべての項目で見ると、その正答率の範囲が22％から94％と受験者能力を十分カバーしている。よって、以降の探索的分析をこの22項目（一貫性12項目、分析5項目、推論5項目）で吟味することとする。 因子分析 続いて、項目分析で正答率および弁別力で問題のなかった ECTT22 項目の得点が、想定する3つの批判的思考力を反映しているかを、最尤法による探索的因子分析を用いて調査した。相関係数の算出に際しては、データにランダムな未回答があったため、リストごとではなく、ペアごとに削除する分析方法を取った。スクリープロットを見ると、固有値間に大きな差は見られず、複数の次元があることがわかった。因子数の決定に関しては、第 3 または第 4 固有値以降で減少傾向が緩やかになっていることから、プロマックス回転で、3因子モデルおよび4因子モデルの両方を吟味した。今回は、各項目が英語力と批判的思考力を併せ持った探索的な分析であるため、因子負荷量の基準を.20と低く設定した。その結果、各因子に対する負荷量が.20以下となった5項目を除外し、測定領域の 3 つの概念を考慮した 3 因子モデルがより説明しやすく妥当と判断し

(12)

た。Kaiser-Meyer-Olkin の標本妥当性検定が KMO = .56 で、容認できない（unacceptable）水準とされる.50を上回っており（Kaiser, 1974）、かつBartlettの球面性検定結果も問題がなかった（χ2_{（136） = 258.60, p < .001）。また、適合度も十分な値で、データとモデルに有意} 差がないことを確認した（χ2_{（88） = 97.40, p = .231）。3 因子の説明率（累計負荷量平方和）} は28.74％であった。 Table 9に3因子モデルの結果を示す。第一因子に貢献した9項目は、英文は短めで読み取りやすい項目（C1, C2）もあるが、文章中の情報の論理性や価値を帰納的あるいは演繹的に推論させる深い推論プロセスが要求されるため、一貫性から推論プロセスを示す因子だと解釈できる。信頼性もα = .63と安定しており、批判的思考のモデルに合致した能力を測定している項目と考えられる。第 2 因子に貢献した 5 項目は、その文章の論理構造と意味を正確に把握した上で、主に文と文を繋いでテクストの結束性を高めるための語彙を選択する項目や物語の展開が一貫するように文を並べる項目であったことから、想定した一貫性を表す因子と解釈できる。信頼性も高く、α = .62 であった。最後の第 3 因子に貢献したのは 3 項目で、これらすべてが、情報を分析し、計算が必要な項目群であったため、分析から算術プロセスを示す因子と解釈できる。3 項目であったが、α = .55 と比較的安定した信頼係数を得 Table 9 ECTT項目に対する因子分析の概要項目概要（一貫性と推論）因子1 α = .63 因子2 （英語力と一貫性） α = .62 因子3 （分析と算術） α = .55 共通性 I5 情報を元に推論 0.71 −0.22 −0.16 0.57 C6 会話文の整序 0.50 0.03 0.07 0.25 C1 会話文の整序 0.39 0.11 0.09 0.18 C2 会話文の整序 0.38 0.31 0.15 0.27 C17 一文挿入 0.35 0.21 −0.12 0.19 I7 情報を元に推論 0.34 −0.01 0.14 0.13 C11 モノローグの整序 0.32 0.01 0.04 0.10 I8 語句の推論 0.31 −0.26 0.14 0.17 I9 情報を元に推論 0.25 −0.01 0.16 0.08 C14 文を繋ぐ適語選択 0.17 0.82 −0.13 0.74 C13 文を繋ぐ適語選択 −0.12 0.55 0.07 0.31 C12 文を繋ぐ適語選択 0.08 0.48 −0.04 0.25 C8 物語文の整序 −0.04 0.34 0.07 0.12 A7 文意に合うグラフ選択 −0.01 0.21 0.14 0.06 A5 情報を基に計算 0.09 0.01 0.93 0.87 A6 情報を基に計算 0.19 −0.01 0.61 0.40 A4 情報を基に計算 −0.27 0.21 0.27 0.19 因子間相関 1 2 3 1 –– 2 0.05 –– 3 −0.04 −.01 –– 注．ペア削除法、最尤法、プロマックス回転

(13)

た。ちなみに、4 因子指定の分析では、第 1 因子にある英文が比較的短く易しい項目である C1とC2が第4因子に移動し、会話文の一貫性を示す因子（α = .71）が構成される。各因子の解釈が妥当かどうかを確認し、因子の命名を決定するために、各因子の因子得点（factor score）を算出し、ECTTの下位セクションの得点およびEPT得点との関係を調べた。その結果をTable 10に示す。下線部分を見ると、多くの推論項目の因子負荷量が高かった第 1因子は推論セクションとの相関（r = .71）が他の因子と推論の相関（r = −.21, r = .15）より かなり高く、続いて一貫性セクションとの相関が高くなっている（r = .50）。よって、「一貫 性と推論」因子と命名した。第2因子は、一貫性セクションとの相関が高くなっている（r = .68）。また、EPTと相関が他のセクションよりも高く、英語力要因がより影響していること がわかる（r = .32）。そのため、「英語力と一貫性」と命名する方がより因子の特性を表すと 考えられる。第3因子では、因子負荷量が高かった項目が分析項目ばかりで、当然、分析セ クションとの相関が高くなっている（r = .70）。一貫性や推論セクションとの関連は見られ ず、また、分析項目の中で算術を必要としない項目 A7 とは別の因子になったことから、テキスト情報を基に算術する能力は、2 つの下位能力とは異なった能力であることが伺える。よって、「分析と算術」と命名するのが妥当だと思われる。以上の因子名を Table 9 に示す。因子分析の結果から、想定した3つの下位概念にある程度分かれるが、それぞれのスキルに必要な下位スキルが付随した因子形成となることがわかった。 Table 10 各因子の因子得点とECTT、EPTの得点の相関因子1 因子2 因子3 ECTT （一貫性） .50** _.68** _.02 ECTT （分析） .02 .18 .70** ECTT （推論） .71** _-.21 _.15 ECTT （合計） .67** _.48** _.27* EPT .15 .32** _.23* 注．N = 77. *p < .05, **p < .01. 多次元尺度分析 参加者の英語力および 3 つの構成概念を想定したテストであったため、因子分析でデータに一次元性が認められなかった。そこで、多次元尺度分析（Alternating Least Squares Scaling）を使用し、項目間の距離を求めることによって項目どうしの類似度を視覚化し、データの概念構造を探索的に探ることにした。 Figure 3が、ECTT22 項目間のユークリッド距離を求めた結果である。まず、ほとんどの推論項目と少数の一貫性項目が他の項目から離れて、中心縦軸よりかなり右側に分布しているのがわかる。推論項目のI8だけが中心軸から左に位置しているが、これは、語句の意味を推測する問題で、その語句あるいはその近くの文を読み取ることができれば正解できる項目である。しかし、その他の推論項目は、文章を理解しただけでは正解を導くことができず、帰納的あるいは演繹的に推論することが求められる高度な項目であった。一方、分析項目やいくつかの一貫性項目は左側に位置している。中でも問題文が比較的短く易しい項目や、簡単な計算が必要な項目が集まっている。このことから、この平面上で右に位置する項

(14)

目ほど、より複雑で統合的な思考力が必要な項目であると思われる。よって、次元1は批判的思考力（認知力）のレベルを示していると考えられる。 Figure 3. 多次元尺度分析によるECTT22項目のユークリッド距離モデル縦軸の次元 2 は、因子分析の第 2 因子の項目がより下に来ていることから、下に位置するほど、より正確な文の繋がりを理解する英語力が必要な一貫性項目と考えられる。反対に中心横軸より上に行くほど、一貫性能力の影響が小さく、別の能力の影響が大きくなっている項目と解釈できる。よって、次元2は英語力・一貫性能力比重を表すと考えられる。 ECTTとEPTの合計得点間の相関分析 以上、因子分析および多元尺度分析の結果、ECTTの得点から、批判的思考力だけでなく、第2因子から英語力の影響が認められた。そこで、ECTT得点とEPT得点がどの程度関連しているかを相関分析で調べた。因子分析で絞った ECTT17 項目でも 22 項目でも、EPT との相関関係の傾向は同じであったため、Table 11にECTT22項目とEPTの関係のみを示す。 Table 11の下位概念別の相関分析結果を見ると、ECTTとEPTの合計得点の間に、中程度 の有意な相関（r = .43, p < .001）が認められる。つまり、テスト得点の約20％（r2 _{= .19）が英} 語力で説明されることが明らかとなった。中でも、一貫性項目の文と文の結束や文章の一貫性をみる整序問題などは、従来の英語力テストでも見られる形式で、英語力の相関が他の 2つのセクションよりかなり高くなっている（r = .41 > r = .29, r = .07）。これは、一貫性項目は、英文自体の操作に関わるスキルであるため、より英語力との影響が大きいからだと考えられる。反対に、推論項目と英語力に相関がなかったことから、推論自体は認知プロセスで あり、英語力とは別物であると言える（r = .07）。興味深いことに、分析項目は、文法との 相関が低いものの有意にあり（r = .28）、他の一貫性や推論ではそのような相関関係が見ら れない（r =.19; r = .09）。これは、情報の分析と、文の分析に関わる文法との共通点からか、 分析を得意とする学習者の傾向の表れかもしれない。

(15)

Table 11 ECTTとEPTの相関関係（項目数） 1 2 3 4 5 6 7 8 1．一貫性（12） ― 2．分析（5） .12 ― 3．推論（5） .12 .13 ― 4．ECTT（計22） .84** _.46** _.53** _― 5．語彙（9） .41** _.15 _-.01 _.35** _― 6．文法（9） .19 .28* _.09 _.27* _.34** _― 7．読解（6） .25* _.18 _.11 _.29** _.23* _.05 _― 8．EPT （計24） .41** _.29** _.07 _.43** _.82** _.73** _.46** _― 質問紙調査 参加者が回答に必要だと感じた能力が、作成者が想定したものと一致するかを調査するために、項目に解答するごとにアンケートに回答してもらった。回答に必要だと感じた能力が 1 つだけとは限らないため、必要だったと感じた能力順に 3 つまで選択肢から回答してもらった。そして、参加者が 1 番必要な能力だと答えたものに 3 点、2 番目に必要だった能力に2点、3番目のものは1点を付与し、その合計点を回答数で割った。 Figure 4. それぞれのセクションで受験者が回答の際に必要だと思った能力 Figure 4の結果を見ると、一貫性セクションに関して、想定した一貫性と結束性の能力を使った割合の合計が 54 ％と過半数を占め、他の下位セクションよりも使用能力が明確に表れている。このことから、受験者は、整序問題や適切な位置に文を挿入する問題において、文章の理論的な流れ、および隣り合った文のつながりの検証を行っていく必要であったことが示唆される。分析セクションにおいても、意図した分析能力が36％と最も高かった。文

(16)

章中の情報や数値を抽出し、演算したり、図表の読み取りを行ったりして回答する際に分析能力を使ったと感じていたことが伺える。また、推論（17 ％）や読解（15 ％）の能力も高かったことから、単なる計算能力ではなく、英文を読みながら必要な情報を取り出し、推論していったことが伺える。しかしながら、推論セクションでは、推論（20％）だけでなく他の能力領域も満遍なく選択されていた。この理由として、推論項目では、文の論理構造や言語情報、数値情報を把握した上で、情報の取捨選択や真偽を判断・評価するため、総合的な能力が求められたからだと解釈できる。最後に、全てのセクションに、読解をはじめ、英語力がある程度の割合を占めていることから、ECTTは想定していた英語力もかなり影響しているという証拠となる。アンケートの最後に付けた「その他」の、自由記述欄はほとんど無回答であったが、分析スキルの中の「計算能力」と記入していた学生がいた。

考察

RQ1 （ECTT の各項目の弁別力および難易度は A2 から B1 レベルの受験者にとって妥当であるか）について、項目分析の結果、37項目中12項目を削除した。主な原因は、項目の内容を見る限り良問だと思っていたいくつかの項目の弁別力が低く推定されたためである。英語力と批判的思考力という異なる能力を測定する項目であるため、1つの概念を測定している項目より、弁別力が正確に表れにくかったと考えられる。例えば、英語力があり、英文を理解できたとしても、問いの課題が解けなかった場合や、反対に英文が読み取れずに、批判的思考力があっても十分に発揮できなかった場合など、回答パターンが一貫していなかったからだと考えられる。事実、より高度で総合的な思考能力が必要な推論項目では、複数の能力が使われているためか、高い弁別力を示しているものが見られない。最も高かった項目（I8）でさえ弁別力が.24に留まりで、これは、語句の意味を推測する局所的な問いであった。テスト全体で、弁別力が高かった項目は、C14（.45）の文と文の間に接続詞を入れる結束性を問う項目、A5（.43）の短い英文を読んで計算をする項目であった。このどちらも求められる知識や能力が限定されており、ストレートに得点に結びつく問題である。このことから、第2言語のオブラートに包まれたテストで、かつ批判的思考力の中でもより複雑で統合的な能力を測定する場合には、これまでの弁別力の観点から妥当性のある項目を判断するには限界があると思われる。この点を考慮すると、今回の信頼性指標であるα係数が、一貫性（α = .61）、分析（α = .52）、推論（α = .40）と、高度な批判的思考を必要とするほど下がっているのも説明がつく。よって、Table 3 の「一般化」推論（Table 3）における、「2．内的一貫性」については十分なレベルの証拠を提供できなかったが、その原因を突き止めることができた。難易度に関しては、3つの下位概念によってかなり異なっていた。最も易しかったのは正答率 88 ％だった分析の項目で、図表だけなく文章も短く、理解できさえすれば正答できたからであろう。そのため、今後、もう少し長い英文を分析させる難しい項目を加える必要がある。一貫性セクションは、様々な難易度の項目で受験者能力をカバーしており、かつ正答率平均が 64 ％と対象レベルの受験者にとって妥当な難易度であった。最も難しかったのは推論セクションで、正答率が 39 ％に留まった。これは、参加者にとって馴染みがない形式で、かつ英文を理解しただけでは正答できない問題が多かったからだと思われる。しかし、ECTT全体としては、分析や一貫性セクションの局所的な易しい項目と、比較的難しい推論セクションの難易度が相殺され、テストの正答率が 64 ％（Table 7）と妥当なレベルであった。このレベルは、EPTの正答率とほぼ同じであることから、A2からB1レベル

(17)

の受験生にとって適切なレベルの批判的思考テストであると言える。よって、「得点化推論」における「2．項目の統計的特徴は適切である」という前提を裏付けることができた（Table 3）。続いて、RQ2 （ECTT は、英語力および想定した 3 つの構成概念を反映しているか）に関して、因子分析を行った結果、3 因子モデルが妥当であった。そして、第 1 因子は一貫性から推論に進む因子、第 2 因子は英文理解から一貫性を測る因子、第 3 因子に情報分析から算術をする因子に分かれた。以上のことから、第 1 因子の「推論」はそれだけで成り立つスキルではなく、Figure 1 のモデルにあるように、情報の「明確化」や「推論の土台の検討」プロセスを踏まえて行われるスキルだと示唆される。また、第2因子の一貫性は直接英文構造に密接に関わる設問であるため、英語力が高いことと結束性や一貫性能力が高いことが直結したと考えられる。よって、「一貫性」は英語という領域固有知識（Figure 2）に最も影響を受ける、批判的思考の最も基礎になる「明確化」に関わるスキルの一つだと考えられる。これは、「一貫性」の能力を測定する項目であるC2が、第1因子（.38）に分類されているが、差で第2因子（.31）にも寄与していることからも裏付けられる。そして最後に、算術が必要な項目だけで、1つの因子が形成されたことから、算術能力は、情報を分析したり、その真偽を評価したりする「分析」能力とは、また別の能力であると考えられる。よって、「説明」推論（Table 3）において、「1．得点が想定した 3 つの概念に分かれる」傾向が見られた。厳密には、上位スキルは下位のスキルと切り離して現れず、密接に関連していることが明らかとなった。また、今回の新しい形式のテストは多次元性を有し、批判的思考の中でも高度な認知能力を要する推論の次元と、ベースのスキルとして英語力と切り離せない一貫性を示す次元が存在することが、多次元尺度分析において視覚的に示すことができた。 RQ3（ECTT で得られた得点は、外部試験である EPT の得点とどのように関係している か）について、ECTT と EPT の間に中程度の相関関係（r = .43）が認められた（Table 11）。 しかし、選択式の純粋な英語熟達度テストどうしであれば、通常はもっと高い相関が期待できる。例えば、日本英語検定協会（2015）の調査では、センター試験の英語科目受験者に実用英語技能検定（英検）およびTest of English for Academic Purpose（TEAP）を受験して もらった結果、センター試験と英検の相関はr = .89、センター試験とTEAPの相関はr = .80、 TEAPと英検の相関は r = .84 と、それぞれに高い相関係数が報告されている。その点で、今回のECTTと英語熟達度テストの相関が中程度にとどまっていることは、ECTTが英語力を測定しながら、英語力以外の能力も測定している証拠となると考える。各下位概念と EPT の相関では、一貫性セクションが最も英語力と関連しており、一貫性項目が文章の構造に向けられた問題だからと解釈できる。それに比べて、分析や推論は、文章自体の構造ではなく、内容に向けられており、その英文から必要な情報を使うことができればよく、その得られた情報操作は、概念化すれば日本語で考えることができるため、英語力とは直接大きな相関が出なかったと考えられる。 RQ4（問題を解く際、受験者は作成者が想定した能力を発揮していると感じていたか）について、一貫性および分析セクションに関しては、想定した能力を最も使ったと感じていた。しかし、推論セクションでは、推論以外の能力も大きな比重を占めていた。よって、ここでも、批判的思考プロセスを支持する結果となり、推論を正しく行うためには、先に、明確化や推論の土台の検討に必要な一貫性および分析能力を活性化させる必要があったことが伺える。興味深いことに、相関分析では、推論セクションと英語力との相関が表れなかっ

(18)

たにもかかわらず、英語力を使ったと回答した割合が、他のセクションよりも大きかったことである（推論27％, 分析19％, 一貫性18％）。このことからも、持てる英語力をしっかり使いながらも、推論から正しい結論を導いたかどうかが得点に反映されたことが伺える。以上のことから、Table 3の枠組みの「説明」推論の論拠の前提である「受験者が使う能力は、テスト開発者の予測と一致する」ことを概ね裏付けることができたが、それ以上に、批判的思考プロセスのモデルを支持する結果となった。

結論と今後の課題

本研究は、CEFR A2からB1レベルの英語学習者を対象とした英語版批判的思考力テストを開発するため、英語テストの中で批判的思考力を選択問題形式で測定できそうな3つの概念に絞った結果、より批判的思考プロセスモデルに近い形で因子が抽出された。そして概ね、論証的妥当性の検証に基づいて、Table 3 における「領域定義」から「外挿」推論までのテスト得点の妥当性を論証することができた。また、パイロット研究段階として、今後の課題を明らかにすることができた。第1点目として、当初作成した 35 項目から、機能していない項目が 13 項目も検出され、作問の難しさを実感した。具体的には、項目弁別力（信頼性）を高めることを求めすぎると、想定した妥当性を満たした項目が作りづらいという懸念が出てきた。因子分析においても、比較的高い因子負荷量が出現しにくく、3 因子抽出の因子分析では、それが原因でさらに 5 項目削除した。これは、常に英語力と複雑な思考力が存在していることが大きな原因であると考えられる。よって、弁別力指標や因子負荷量指標がやや低いという理由だけで削除していくと、項目が少なくなりすぎ、内容妥当性を失うことになりかねないため、多次元尺度分析などで、どのような性質の項目であるかを把握し、それぞれの次元の項目がバランスよく含まれるテストにすることも大切ではないかと考える。この点については、まずは、今回削除した項目を再吟味し、別の受験者でも同じような結果になるか検討してみる必要がある。第2点目は、先行研究で、CCTSTとワトソン・グレーザー批判的思考力テストとの相関が 中程度（r = .41, p < .001; Facione, 2000）と報告されていることから、このECTTが英語力以 外に測っているものが批判的思考力であることを確認するには、今後、日本語版の批判的思考力テストなど、他の批判的思考を測定すると考えられるテストと中程度の関係が確保されるか調査していく必要がある。第3点目は、妥当性における解釈的論証の最後の「利用」推論に当たる（Table 3）検証を行っていく必要がある。複雑な思考能力を測定することは母語である日本語でも容易なことではない。しかし、海外留学や仕事によっては、 L2環境で考えながら英文読み行動することが求められる。よって、英文を読む中で、批判的思考力が十分発揮できる力があるかを測定できるこのテストの波及効果を調査することは大切だと思われる。また、批判的思考力を発揮しながら英語で発信することが重要であることを考えると、筆記選択問題では測定できる批判的思考スキルが限られることから、批判的思考力を評価観点に取り入れたパフォーマンステストについても今後検討していく必要があるだろう。

引用文献

石井英真（2015）．『今求められる学力と学びとは：コンピテンシー・ベースのカリキュラムの光と影』東京：日本標準大井恭子（2008）．「思考力育成の試み：中学生の英語ライティング指導を通して」『千葉大学 教育学部研究紀要』56, 175−184.

(19)

Retrieved from https://core.ac.uk/download/pdf/96989795.pdf

糟屋美千子（2010）．「英語教育における批判的思考力とコミュニケーション能力の育 成」『兵庫県立大学環境人間学部研究報告』12, 69–78. Retrieved from https://u-hyogo. repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_ detail&item_id=1769&item_no=1&page_id=13&block_id=46 菊島正浩・寺本妙子・柴原宜幸（2018）．「大学生における批判的思考力と態度の育成を 目的とした教育プログラムの実践と評価」『日本教育工学会論文誌』41, 427–437. doi:10.15077/jjet.41060 楠見孝（2010）．「批判的思考と高次リテラシー」楠見孝（編）『思考と言語』（pp. 134–160）京都：北大路書房 楠見孝（2018）．「リテラシーを支える批判的思考：読書科学への示唆」『読書科学』60, 129–137． doi: 10.19011/sor.603_129 楠見孝・子安増生・道田泰司（2011）．『批判的思考力を育む: 学士力と社会人基礎力の基盤形成』東京：有斐閣楠見孝・道田泰司（2016）．『批判的思考: 21 世紀を生きぬくリテラシーの基盤』東京：誠信書房楠見孝・田中優子・平山るみ（2012）．「批判的思考力を育成する大学初年次教育の実践と評 価」Cognitive Studies, 19, 69–82. 清水誠・大澤正樹（2015）．「批判的思考力を育成する指導方法の開発 : 批判的思考の構 成要素を役割分担して話し合いをさせることの効果」『埼玉大学紀要教育学部』64, 103–116． doi:10.24561/00017729 竹田育子（2016）．「高等学校における批判的思考力を育む英語授業開発」『島根大学大学 院教育学研究科「現職短期 1 年コース」課題研究成果論集』7, 51–60. Retrieved from https://ir.lib.shimane-u.ac.jp/ja/list/journals/%E5%B3%B6/E-KKS/7/--/item/36344 髙見健太・木下博義（2017）．「他者との関わりを通じて批判的思考を働かせるための理科学 習指導法の開発と評価」『理科教育学研究』58, 27–40. doi:10.11639/sjst.16046 野澤雄紀・伊藤素江・須永正巳・堂下雄輝・村田維江（2016）．「論述力を測定する混合フォーマット開発の試み」第14回日本言語テスト学会発表資料 Retrieved from https:// berd.benesse.jp/up_ images/research/assess_20170124.pdf 平山るみ・田中優子・河崎美保・楠見孝（2010）．「日本語版批判的思考能力尺度の構成と性質の検討 : コーネル批判的思考テスト・レベル Z を用いて」『日本教育工学会論文誌』 33, 441–44．doi:10.15077/jjet.KJ00006063557 道田泰司（2001）．「批判的思考の諸概念 : 人はそれを何だと考えているか ?」『琉球大学教育 学部紀要』59, 109–127.

Retrieved from http://ir.lib.u-ryukyu.ac.jp/bitstream/20.500.12000/524/1/michita_y08. pdf 道田泰司（2003）．「批判的思考概念の多様性と根底イメージ」『心理学評論』46, 617–639． doi:10.24602/sjpr.46.4_617

峯島道夫・今井理恵（2017）．「批判的思考力を育成する高・大連携の試み」『中部地区英語 教育学会紀要』46, 133–140. doi:10.20713/celes.46.0_133

文部科学省（2011）．「言語活動の充実に関する指導事例集 : 思考力、判断力、表現力等の育成に向けて（中学校版）」Retrieved from http://www.mext.go.jp/component/a_menu/ education/micro_detail/__ icsFiles/afieldfile/2011/05/30/1306108.pdf

(20)

文部科学省（2012）．「社会の期待に応える教育改革の推進」『国家戦略会議関係資料』 Retrieved from http://www.mext.go.jp/b_menu/shingi/chukyo/chukyo9/shiryo/__ icsFiles/afieldfile/2012/ 06/25/1322792_6.pdf

文部科学省．（2016）．「幼稚園 , 小学校 , 中学校 , 高等学校および特別支援学校の学習指導要領等の改善について（答申）」Retrieved from http://www. mext. go. jp/a_menu/shotou/ new-cs/news/20080117.pdf

山本明．（2017）． 「批判的思考の観点から見たメディア・リテラシー」『心理学評論』60, 163–180． doi:10.24602/sjpr.60.2_163

Benesse i-Career (n.d.). GPS-Business. Retrieved from https://www.benesse-i-career.co.jp/ gps_ business/

Brookfield, S. (1987). Developing critical thinkers: Challenging adults to explore alternative ways

of thinking and acting. San Francisco, CA: Jossey-Bass.

CCTST (n.d.). California critical thinking test. Retrieved from https://www.insightassessment. com/Products/Products-Summary/Critical-Thinking-Skills-Tests/California-Critical-Thinking-Skills-Test-CCTST

Chapelle, C., Enright, M., & Jamieson, J. (2008). Building a validity argument for TOEFL. New York, NY: Routledge.

Council of Europe (2001). Common European Framework of Reference for Languages: learning,

teaching, assessment. Cambridge university press.

Ennis, R. H. (1987). A taxonomy of critical thinking dispositions and abilities. In J. B. Baron & R. J. Sternberg (Eds.), Teaching thinking skills: Theory and practice. New York, NY: W. H. Freeman and Company. (pp. 9–26).

Ennis, R. J., & Millman, J. (1985). Cornell tests of critical thinking. Pacific Grove, CA: Midwest. Facione, P. (1990). Critical thinking: A statement of expert consensus for purposes of

educational assessment and instruction (The Delphi Report).

Facione, P. A. (2000). The disposition toward critical thinking: Its character, measurement, and relationship to critical thinking skill. Informal Logic, 20, 61–84. doi:10.22329/il.v20i1.2254 Griffin, P., McGaw, B., & Care, E. (Eds.). (2012). Assessment and teaching of 21st century skills.

Berlin, Germany: Springer.

Insight Assessment (2016). California critical thinking skills test user manual and resource guide. Retrieved from https://www.elcentrocollege.edu/aboutecc/curriculum-assessment-and-accreditation-office/quality-enhancement-plan/documents/cctst_cctst-n_ cct-g835_user_manual_216.pdf

Kaiser, H. F. (1974). An index of factorial simplicity. Psychometrica, 39, 31–36. doi:10.1007/ BF02291575

Vendrely, A. M. (2007). An investigation of the relationships among academic performance, clinical performance, critical thinking, and success on the physical therapy licensure examination. Journal of Allied Health, 36, 108–123. Retrieved from http://docserver. ingentaconnect.com/deliver/connect/asahp/00907421/v36n2/s12.pdf?expires=15750887 51&id=0000&titleid=6329&checksum=5398BDC457267C104B12B918FF5020B8

Watson, G., & Glaser, E. (2002). Watson-Glaser critical thinking appraisal, UK edition: Practice

test. Psychological Corporation.

(21)

Grove, CA: Thomson Brooks/Cole.

謝辞

本研究は、共同研究メンバーである竹林尚輝氏、池田有希菜氏、吉居薫乃氏、新明匠氏、須田佳成氏から多大なるご協力をいただきました。そして、3人の匿名査読者からの貴重なコメントを基に論文を完成させることができました。この場を借りて深くお礼を申し上げます。

付録

（推論問題例）

Read the passage below and answer the question.

Dr. White was interested in diet （low-calorie） foods and decided to investigate how many times and how much people eat diet foods in a day. He conducted a questionnaire to 1,000 men and 1,000 women, 2,000 people in total, at random. According to the results of the questionnaire, the following two facts became clear.

（I） The more times a day people eat diet foods, the higher their body fatness is. （II） The larger the quantity of diet foods people eat, the higher their body fatness is.

From these results, Dr. White made the following two conclusions. A. Diet foods have no effect.

B. Diet foods make people fat.

Question. Dr. White s way of demonstrating these conclusions can be best evaluated as: 1. Good, because . . .

2. Good, because . . . 3. Poor, because . . .

(22)

批判的思考力を測定する英語テストの開発 パイロット・スタディ