• 検索結果がありません。

批判的思考力を測定する英語テストの開発 パイロット・スタディ

N/A
N/A
Protected

Academic year: 2021

シェア "批判的思考力を測定する英語テストの開発 パイロット・スタディ"

Copied!
22
0
0

読み込み中.... (全文を見る)

全文

(1)

JACET Journal 64 (2020) 205–225

批判的思考力を測定する英語テストの開発 : パイロット・スタディ

The Development of an English Test for Measuring Critical

Thinking Skills: A Pilot Study

HIRAI, Akiyo

University of Tsukuba MAEDA, Hiroki

OKA, Hideaki KATO, Takeshi

Graduate School, University of Tsukuba NAKANO, Emi

Igusa Junior High School

Abstract

Critical thinking ability is a generic ability that should be developed through both English and Japanese language educational curricula. However, there has been no attempt to test this abil-ity for Japanese EFL learners. Thus, we have developed a multiple-choice-items test called the English Critical Thinking Test (ECTT), which measures not only English ability but also three subcomponents of critical thinking skills: logical thinking (consistency), analytical skills (which we name analysis), and drawing appropriate conclusions using inductive and deductive reason-ing (inference). The target level of the test is from A2 to B1 level of the Common European Framework of Reference (CEFR). To evaluate the validity of the test, we built a validity argu-ment based on the framework proposed by Chapelle, Enright, and Jamieson (2008), which consists of six inferences (domain definition, evaluation, generalization, explanation,

extrapola-tion, and use), and examined eventually 22 items, using item analysis, factor analysis,

multi-dimensional scaling, and correlational analysis. As a result, three factors of “Consistency & In-ference,” “English ability & Consistency,” and “Analysis & Calculation” were extracted and the ECTT moderately correlated with the English Proficiency Test (EPT) (r = .43), which provides support for the ECTT measuring English proficiency as well as critical thinking skills.

Keywords: critical thinking test, validity, consistency, analysis, inference

はじめに

様々な情報が価値を持つようになる情報化社会において、求められる教育は刻々と変化 している。2009 年に発足した the Assessment and Teaching of Twenty-First Century Skills Project(ATC21S)は、これからの時代で求められる「21世紀型スキル」を提案した。その 中で、コミュニケーションやチームワークなどのスキルに加えて、「思考の方法」として批 判的思考力を挙げている(Griffin, McGaw, & Care, 2012)。

(2)

日本国内においても、批判的思考力はこれからの社会を生き抜くために必要な認知スキ ルであるため、教科教育の中で育まれるべきとして、その育成と評価に関心が高まっている (石井, 2015; 文部科学省, 2011, 2012, 2016)。楠見・田中・平山(2012)は、大学の初年次教 育に、読解、討論、発表、ライティングを支えるスキルとして批判的思考力を育成すること が大切であるとしている。中学校や高等学校でも、理科教育や創作論文を通して批判的思考 力を育むことを目的とした授業開発がいくつか報告されている(e.g., 清水・大澤 , 2015; 菊 島・寺本・柴原, 2018)。 グローバル化が進む中、英語で書かれた資料に目を通し、諸外国の人々と英語で議論や 交渉ができる人材が求められており、高校・大学レベルの段階で使用言語を問わず批判的 思考を発揮できるようにすることが重要になってきた(e.g., 文部科学省, 2012; 2016)。よっ て、英語教育においても、高校生を対象とした批判的思考力を育成する英語の教材開発や授 業展開例が報告され始めている(大井, 2008; 竹田, 2016; 峯島・今井, 2017)。 このように授業実践に関する研究が進められている一方で、批判的思考力を測定 ・ 評価 する国内での研究は、焦点がまだ十分に当てられていない。海外では、批判的思考力の測 定を目的としたテストが開発されており、コーネル批判的思考テスト(Ennis & Millman, 1985)やカリフォルニア批判的思考力テスト(California Critical Thinking Skills Test: CCTST; Facione, 1990)、ワトソン・グレーザー批判的思考テスト(Watson & Glaser, 2002)などがあ る。しかし、いずれも英語母語話者を対象としており、外国語として英語を学ぶ(English as a Foreign Language: EFL)日本人にとっては英語のレベルがかなり高く、かつ有償で入 手しづらいなど、日本でのそのままの利用が困難である。 そこで、日本人 EFL 学習者を対象とする英語力および批判的思考力を測定する英語版批 判的思考テストの開発を試みた。研究の最終目標は、このテストを完成させることである が、本研究の目的はパイロット段階として、開発した試作テストの妥当性を検証し、開発課 題を明らかにすることである。 主な批判的思考力テスト カリフォルニア批判的思考力テスト 批判的思考力テストで代表的なものに、オンライン環境で受験可能なカリフォルニア批 判的思考力テスト(CCTST)がある。このテストは批判的思考に関する専門家間で合意が あったとされる Facione (1990) における批判的思考の定義に基づき作成されたものである。 CCTSTは、批判的思考力の下位概念として7つのスキル(分析、解釈、推論、評価、説明、 帰納、演繹) を測定するとしている(CCTST, n.d.)。しかし、それぞれの項目が想定されて いる 7 つの構成概念のどの構成概念を測定しているかの判断が困難で、1 つの項目に対し複 数の構成概念が対応していると考えられ、項目の成否の解釈が不明瞭である。また、これに 関して、因子分析等による構成概念の詳細な研究報告は見当たらなかった。 しかし、批判的思考力の育成を目的とする教育課程を受講した前後で CCTST の点数を比 較した際、受講後の点数が高くなったこと、および批判的思考力と高次元の推論(higher-order reasoning)の尺度を評価の要素に含んでいる大学レベルの標準化テスト(Grade Record Examination: GRE)との間に高い相関(r = .72, p < .001)があったことから、構成概 念妥当性が担保されているとしている(Insight Assessment, 2016)。さらに、ワトソン・グ レーザー批判的思考テストの得点との間にも有意な相関 (r = .41, p < .001)が確認されている (Facione, 2000)。また、CCTSTとGrade Point Average (GPA)との相関分析では、批判的思 考力が成績評価でどの程度考慮されるかによって、r = .20 からr = .46の値と低から中程度の

(3)

相関が報告されている(CCTST, n.d., p. 69)。一方で、Vendrely (2007) の調査では、CCTST とGPA間の相関はみられなかった(r = .10, p > .05)。 これらの結果から、様々な要因が絡む 成績評価からは批判的思考力を説明することは難しいことが伺える。 日本人を対象に CCTST を使用する上での限界点として、筆者らが 1 フォームを受験した 際、英語が難しく規定時間内では到底終了できるものではないことがあげられる。そのた め、このテストをそのまま日本人英語学習者を対象として、英語力と批判的思考力を同時に 測定するテストとして使用することは現実的ではない。また、日本からは入手が困難で受験 コストも高額となる。 日本語版批判的思考テスト 日本人を対象にした批判的思考力の測定に関する研究はまだ少ないが、高見・木下 (2017)では、批判的思考を促す授業を考案する中で、生徒の批判的思考力の変容を「他者 との関わりによる批判的な気づき」「探究的・合理的な思考」「多面的な思考」「反省的な思 考」「健全な懐疑心」の 5 つの因子を反映した全 34 項目から構成される質問紙によって調査 している。 テスト開発に関わる研究では、平山・田中・河崎・楠見(2010) がコーネル批判的思考テ スト(Ennis & Millman, 1985)を日本語訳し、内的整合性および難易度を調整したテストと 批判的思考態度尺度、および認知能力を測定する京大 SX との関係を調査している。結果と して、日本語版コーネル批判的思考能力テストの成績と京大 SX 内にある文章推理課題の成 績(r = .35, p < . 05C、および乱文構成課題の成績(r = .36, p < . 05)の間に有意な相関がある ことが報告されているが、いずれもそれほど高い相関関係とは言えない。 一方、Benesse が行った研究 (野澤・伊藤・須永・堂下・村田 , 2016) では、「情報の明確 化」「情報の分析」「推論」の 3 つの構成概念を想定した批判的思考力テストと 5 種類のテス ト(論述テスト、汎用読解テスト、教科書型読解テスト、短答式・語彙読解テスト、語彙 テスト)との関連を調査している。結果として、5つのテストの中では論述テストが最も近 い能力を測定していた。ここで用いられた論述テストは、複数の根拠から論理的に主張を 展開する「資料活用課題」、妥当でない根拠を指摘する「課題解決課題」、論構造を明確に して論理的に反論する「反論課題」から構成されている。また、Benesse i-Career (n.d.) は Global Proficiency Skills (GPS) -businessやGPS-Academicといったテストにおいて、批判的 思考力、創造的思考力、協働的思考力といった3つの思考力をその測定対象としている。こ のテストでは、批判的思考力として「情報を抽出して吟味する力」が求められるとして、あ る主張の背景にある考えを選択肢の中から選び出す問題が例として掲載されている。しか しながら、これらのテストを利用した研究結果は報告されていない。このように、日本国内 においては日本語を用いて批判的思考力を測定する取り組みが徐々になされてきているが、 英語学習者が英語を使いながら批判的思考力を発揮するテストへの取り組みはまだ見られ ない。 批判的思考力の定義 具体的な批判的思考力を測定することを目的とするテストを取り上げたが、研究者に よって批判的思考力の解釈は多様であり、テストや研究間で一貫していない(道田 , 2001; 2003)。そのような状況で、楠見(2010) はこれまで行われてきた批判的思考に関する研究で 用いられている定義から類似点をまとめ、批判的思考を次の4つの側面から定義している。 (1)合理的な思考であり、規準に従う思考

(4)

(2)相手を批判する思考とは限らず、自分の推論過程を意識的に吟味する内省的な思考 (3) 人の話を聞いたり、文章を読んだり、観察したり、議論をしたり、自分の考えを述べ る時に、何を信じ、主張し、行動するのかの決定を支えている能動的・主体的思考 (4)目標や文脈に応じて実行される目標志向的思考 まず、(1)の「合理的な思考」という側面は、Ennis (1987) が言及しており、道理や理屈 にかなう論理的・理性的な思考である(道田, 2003)。また、ここでの「規準」とは帰納や演 繹、誤 の認識などの論理操作のことで、この規準に基づき問いを立て、意思決定を行う (楠見, 2010)。 次の(2)については、批判的思考に「批判的」という言葉があるために、相手に批判的 になることと考えられがちだが、むしろ自分の思考や推論過程を吟味することを意味する。 Brookfield (1987) では、批判的思考力を身につけている者は、一般的に言われていることや 常識を鵜呑みにせず、内省的で懐疑的(reflectively skeptical)であるとしている。つまり、 批判的思考とは、早急に判断を下すことなく内省的に熟考することである。 (3)は、Ennis (1987) における「何を信じ、行動するかを決定する合理的で内省的な思 考」という定義に基づいている。この側面は(1)と(2)の側面を包括した広義の定義であ るため、現在、最も多く引用されている(楠見, 2010)。 (4)について、批判的思考とは明確な目的を持って行うもの(purposeful)であるとされ ている (Facione, 1990)。つまり、目標志向的思考を備えている者は、適切な状況下で批判 的思考を使用し、そうではない状況では使用しないという判断が下せると考えられる。その ため、目的意識や目標設定は、批判的思考の技能や態度を育成する上で極めて重要だと言わ れている(糟屋 , 2010)。このように批判的思考はさまざまな側面から構成されており、単 一の能力から構成される概念として定めることは容易ではない。しかしながら、ある目標に 向かって自分の推論過程を吟味しながら内省的に思考する能力という解釈は研究者間で概 ね一致している。 批判的思考のプロセスと批判的思考スキル 批判的思考がどのような要素から構成されるかを考える上で重要となるのが批判的思考 のプロセスである(e.g., Ennis, 1987; Zechmeister & Johnson, 1992; 楠見, 2010; 2018)。Figure 1は、楠見(2018)から引用した批判的思考のプロセスのモデルである。このモデルでは、ま ず、テキストや図表などで情報や課題が提示されると、「明確化」「推論の土台の検討」「推 論」のプロセスを経て、「行動決定」がなされる。そして、最終的にそれが実際の行動や発 言として表出される。 最初の「明確化」では、情報にアクセスし、必要な情報を取り出す。日常生活に れてい る情報や発言に対し、受け手はまず、その意図や根拠・証拠、その論理的な流れを正しく理 解しようとする。そのために、情報が持つ論理構造や結論、理由などを分析的に吟味し、把 握する。次の「推論の土台の検討」において、得られた情報の導出過程が首尾一貫したもの かを判断していく。具体的には、(a)情報内に隠れた前提を明確にする、(b)信頼するに足 りる証拠を用いているかを検討する、あるいは(c)科学的手法やその実験から出た結果を 評価する(楠見・道田 , 2016)ことを行う。そして、最後に行われるのが「推論」である。 推論は、信頼できる複数の事例や結果から、客観的な結論を導こうとする帰納的、および三 段論法などを使用する演繹的推論によって誤りのない結論を導こうとするプロセスである (楠見・子安・道田, 2011)。

(5)

この 3 つのプロセスは、必ずしも順に使われるのではなく、例えば、楠見・田中・平山 (2012)のモデルでは、「明確化」に関連するスキルは、「推論の土台の検討」および「推論」 が行われる際に必要なスキルとなっている。批判的思考のプロセスは、常に「メタ認知」 (Figure 1左上)によってモニタリングおよびコントロールされ、批判的思考の使用者が、そ の状況や課題に応じて、適切なスキルを選択し、行動決定するまで行われると考えられる。 そして、これらのプロセスを可能にしているのが、その分野に特化した領域固有知識やスキ ルと、様々な批判的思考場面に応用できる汎用的な(領域普遍)知識とスキル(Figure 1左 下)である。 英語版批判的思考テスト (ECTT) を構成する測定領域と項目の作成 高い妥当性および信頼性を伴うテストを作成するためには、測定すべき構成概念を定 義することが不可欠である。そこで、今回作成する英語版批判的思考テスト(the English Critical Thinking Test: ECTT)の測定領域(target domain)を、Figure 1のモデルにある(a) 明確化、(b)推論の土台の検討、および(c)推論という一連の批判的思考のプロセスに必 要なスキルとした。しかし、複雑で包括的な思考能力プロセスのすべてのスキルをカバーす ることはできない。そこで、CCTSTに使われているテスト項目とその背後にある7つの構成 概念を参考にして、測定領域を英文を読む際において、特に重要でかつ選択形式で測定でき ると思われる一貫性、分析、および推論スキルの3つに絞った。 その理由として、まず、テキストを正確に把握するに当たっては、文と文の結束性 (cohesion)や文章構造の一貫性(coherence)を手がかりに文章の論理構造の流れを把握し、 情報の意味を明確にすることが重要と考える。よって、この結束性と一貫性のスキルをまと めて「一貫性」とした。これは、CCTSTの構成概念の「解釈」、およびモデル(Figure 2)の 特に「明確化」プロセスに関わるスキルと考えた。次に、CCTSCTの「計算」と「分析」を まとめて、「分析」スキルとした。文章と図表を使って「計算」をする行為であっても、そ こから必要な情報を「分析」し、抜き出すことであると考えたからである。情報を分析する スキルは、Figure1 の「明確化」に関わり、かつ分析した情報が信頼できるものか、矛盾し たところはないかなど、必要な情報の真偽を評価・判断する「推論の土台の検討」プロセス にも関わるとした。最後に、CCTST にある「推論」「演繹」「帰納」の間に重なる部分が大 きいため、作問にあたってはそれらをまとめて「推論」スキルとした。これは、Figure 1の Figure 1. 批判的思考のプロセス(楠見, 2018)

(6)

「推論」部分に相当する。これらの批判的思考スキルに加えて、今回は英語で問題を解くた め、英語力も測定領域に入る。Figure 1を参考に、今回の課題状況を当てはめたのがFigure 2である。 Figure 2. ECTT課題における批判的思考スキルとプロセス ECTT課題の英文が与えられると、領域固有知識・スキルとして、英語の文法や語彙知識 および英文読解力などの英語力が必要と考えられる。それと同時に、領域普遍知識・スキル として、テスト項目によって、想定した批判的思考力である一貫性、分析、または推論のス キルが必要に応じて選択・適用されるといえる。このような批判的思考スキルは、異なった 分野における批判的思考をする過程でも応用可能な領域普遍スキルであると言われている (e.g., Ennis,1987; 楠見2010; 道田, 2003; 山本, 2017)。Table 1に今回焦点を当てた3つの批判

的思考力スキルの定義をまとめて示す。 Table 1 ECTTの測定領域とその定義 測定領域 定義 (a)一貫性 情報が論理的で、かつ一貫しているかを明確にすること (b)分析 情報を分析し、その信頼性、必要性などを評価・判断すること (c)推論 演繹的・帰納的に推論することによって、客観的な結論を導くこと そして、これらの 3 つの下位概念(一貫性、分析、推論)の問題形式を Table 2 のように 定め、このテスト細目に沿って、妥当性のある項目を作るようにした。

(7)

Table 2 測定領域と問題形式 測定領域 問題形式 (a)一貫性 1.会話文や物語文内の文を並べ替える 2.文章中に欠けている文や語を入れる 3.文章中から不要な1文を抜く (b)分析 1.文章を読んで、内容を示す図表を選択する 2.文章や図表から目的に応じた情報を抜き出し、評価する 3.文章や図表から目的に応じた数値を選択し、簡単な計算をして解を導く (c)推論 1.信頼できる複数の事例や結果から、客観的な結論を導く 2.文脈から語彙の意味を推測する 3.いくつかの前提から最も妥当な解を導く 従来の多くの筆記試験では、文の語句整序、文法や語句の個別問題、訳や要約、事実を問 う内容把握問題など、Figure 2の点線が示すような、領域固有知識である英語力のみに焦点 を当ててきた。後述する英語熟達度テスト(EPT)もこれにあたる。しかし、ECTTはTable 2にあるように、基本的な内容把握問題ではなく、読み解いたことを踏まえて批判的思考を 働かせて解を導く高次レベルの発問を心掛けた。現実世界における英語を使用する場面に おいては、英語で書かれた資料を理解しながら、批判的思考を発揮できるかが重要になって くることが多い。つまり、英語力と批判的思考力を別々に発揮できることと、第2言語の環 境の中で批判的思考力を発揮できることとは同義とは言えない。よって、ECTT を開発し、 英語を読みながら批判的思考を測定し、鍛えようとするところにテストの真正性があり、本 研究の意義があると考える。 本研究の目的およびリサーチ・クエスチョン

開発を試みた ECTT の妥当性については、Chapelle, Enright, and Jamieson (2008) が提案 している6つの推論(inference)(領域定義、得点化、一般化、説明、外挿、利用)からなる 論証(argument)に基づく妥当性検証の枠組みに照らして論じることとする(Table 3)。こ の枠組みを採用した理由は、ECTTの開発にあたって、最も苦慮したTable 3の1つめの「領 域定義 (domain definition) 」推論が明確に打ち出されているためである。 ECTTに関する解釈的論証に基づいて妥当性検証を行うに当たり、以下の 4 つのリサー チ・クエスチョン(RQs)を設定した。 RQ1: ECTTの各項目の弁別力および難易度は A2 から B1 レベルの受験者にとって妥 当であるか。 RQ2: ECCTで批判的思考力の中の想定した3つの構成概念に分けて測定できるか。 RQ3: ECTTは、英語力とどの程度関連するか。 RQ4: 問題を解く際、受験者は作問者が想定した能力を発揮したと感じているか。

(8)

Table 3 ECTT開発における解釈的論証 推論 論拠の前提 論拠に対する裏付け方法 1.領域定義 1. 3 つの下位能力 (分析、一貫性、推論) は、批判的思 考能力を構成する代表的な下位能力である。 2. ECTT の英文は、B1 レベルであれば十分理解できる 英語で書かれている。 1 & 2. 先行研究に基づく領 域分析と専門家によ る判断 2.専門家による判断 2.得点化 1. テスト作成のためのテスト細目および採点は目標と する知識やスキルの証拠を得るのに適切である。 2.項目の統計的特徴は適切である。 1.専門家の判断 2.項目分析 (RQ1) 3.一般化 1. テスト細目は明確に定義されており、同等の項目を 作ることができる。 2.項目が測る能力は一貫している。 1.専門家の判断 2.内的一貫性の分析 (RQ1) 4.説明 1. 得点は英語力だけでなく、想定した 3 つの構成概念 に分かれる。 2. 受験者が使う能力は、テスト開発者の予測と一致す る。 1. 因子分析 、相関分析、多 次元尺度分析 (RQ2) 2.アンケート調査 (RQ4) 5.外挿 1. テスト得点は、 B1 レベルの英語学力テストと関連が ある。 2.テスト得点は、日本語版批判的思考力と関連がある。 1.相関分析 (RQ3) 2.相関分析(今後実施予定) 6.利用 1. テスト得点の意味は、受験者によって明確に解釈で きる。 2.ECTTは良い波及効果を持つ。 1.専門家の判断 2. アンケート調査 (今後実施予定)

方法

参加者 参加者は、日本人大学1年生計81名(男性53名、女性28名)で、文系クラスと理系クラ ス1クラスずつの学生である。参加者は大学入学時にTOEFL ITP(M = 488.38, SD = 7.93)を 受験しており、ヨーロッパ言語共通参照枠(CEFR; Council of Europe, 2001)のA2レベル後 半からB1レベルの英語力と想定される。

マテリアル

英語版批判的思考テスト (English Critical Thinking Test: ECTT)

Table 1およびTable 2で定めたテスト細目を基に、一貫性、分析、推論の各セクションの 多肢選択式項目を作成した(付録参照)。英文を理解した後に情報を操作する必要があるた め、1項目に約5分と、予想以上に解答時間を要することが予備調査で分かった。つまり、現 実的な60分間用テストとすると、多くて1セットに各セクション3∼4項目、計10∼12項目 しか含めることができないことになる。よって、今回は少なくとも1セット12項目を完成さ せることを目指し、各セクション、17 項目、9 項目、9 項目を作問した。一貫性の項目が多 いのは、これまでの英語力テストに近い形式で作成しやすかったことに加え、1題に複数項 目ある形式(例:文章内の複数の穴あき項目)が含まれているためである。そのような項目 も、項目の独立性があり、また個々に削除・修正を検討できることから、すべて独立項目と

(9)

して分析した。分析と推論に関する項目は、これまでの既成の英語の試験になかったため、 作成が難しく、就職時に受験するSPI総合検査などを参考にした。

英語熟達度テスト(English Proficiency Test: EPT)

実験時の参加者の英語力を測定するために英語熟達度テスト(English Proficiency Test: EPT)を作成した。使用した項目はA2レベル後半からB1レベルと考えられる実用英語検定 の2級と準1級、及びTOEICの問題集から抜粋した。項目分析の結果、機能していない項目 が4項目あったため除外し、語彙(9問)、文法(9問)、読解(6問)の計24項目を英語力テ ストとして以後の分析に使用することとした。信頼性係数はα = .70であった。 質問紙 参加者が ECTT の各項目への回答中にどのような能力を発揮したと感じたかを調べるた めの質問項目を作成した。発揮した能力の選択肢として、構成概念の3つ(一貫性・分析・ 推論) および一貫性と関連する「結束性」、続いて、英語熟達度テストの3つの下位概念(語 彙・文法・読解)、そして今回の項目では想定していないが、推論を発展させた概念も使用 したと感じたかを知るために「創造」を加えた。Table 4のように、これら8つの概念と定義 を各項目の回答入力フォームの直下に付け、最後に「その他」として自由記述欄を設けた。 Table 4 質問紙における学習者から見た項目が測っている能力の選択肢とその説明 能力領域 意味 一貫性 問題に出てくる記述や論理が最初から最後まで一貫しているか考えた。 結束性 隣り合った文と文の結びつきを考えた。 分析 問題に出てくる数値や情報などを分析的に考えた。 推論 与えられた情報をもとに推論をした。 創造 与えられた情報や一般的な知識をもとに独自の方法で問題を解いた。 読解 英文を正確に読んで理解しようとした。 語彙 英単語の意味に注目した。 文法 英文法に注目した。 その他 (自由記述) 手順 ECTTは、批判的思考力を高めることを目標とした英語の授業で実施した。毎時間の後半 にリーディングで思考力を磨く活動の一環として組み込めるように、ECTTのテスト項目を 4つに分け(set 1 から set 4)、EPT を含め、1 回 30 ∼ 40 分で 5 週間に渡って実施した。最初 の 4 週間で ECTT を実施し、5 週目に EPT を実施した。全てのテストは全学で採用している 学習支援システムmanaba上で行い、テスト提出後に自動採点され、得点と正解が表示され るようにした。受験の際にはメモを取ることを可とした。また、ECTTの各項目を受験する ごとに、上記(Table 4)の質問項目を付け、第1候補から第3候補までを選択させた。学期 末には、分析した個別の結果を配布し、解説を行い内省の機会とした。

(10)

結果

ECTTの正答率および弁別力 最初に、セクションごとに弁別力指標として、項目の点双列相関係数を算出し、テスト得 点に寄与しない項目を削除し、テストとして使用できる項目を選定する作業を行った。但 し、この段階での点双列相関係数による削除基準を .10 以下とし、削除することによって信 頼性が改善する項目のみ削除した。通常より低い削除基準を用いた理由として、参加者に とって不慣れな形式のテストを限られた時間内で解くため、実力が発揮できなかった項目 もあると予想されることや、英語力と批判的思考力という異なる2つの能力を測定している ためである。削除後に残った項目をセクション別にTables 5∼7に示す。 Table 5 一貫性項目の正答率と弁別力(12項目) 設問 C1 C2 C6 C8 C9 C11 C12 C13 C14 C15 C16 C17 M α 正答率 .81 .86 .31 .74 .64 .70 .78 .44 .66 .55 .81 .35 .64 .61 SD .40 .35 .47 .44 .48 .46 .42 .50 .48 .50 .40 .48 弁別力 .24 .37 .18 .36 .20 .27 .24 .27 .45 .19 .15 .28 注.N = 77. 下線項目はTable 9の因子分析3因子仮定に含まれる項目 一貫性セクションでは、弁別力が低かった 5 項目を削除し、最終的に Table 5 にある 12 項 目とした。信頼性係数は α = .61 で、英語力と同時に批判的思考を測るテストとしては、十 分高い信頼性を得た。難易度も平均が64%と丁度良く、正答率も31%から86%と広く受験 者能力をカバーしている。 Table 6 分析項目の正答率と弁別力(5項目) 設問 A2 A4 A5 A6 A7 M α 正答率 .82 .91 .92 .91 .94 .88 .52 SD .39 .29 .27 .29 .25 弁別力 .27 .18 .43 .31 .33 注. N = 77. 下線項目はTable 8の因子分析3因子仮定に含まれる項目 分析セクションは、当初の9項目の内、A8は全員正答で、A1、A3、A9は弁別力が低かっ たため削除し、Table 6に示した5項目を使用できる項目とした。内的信頼性はα = .52であっ た。平均正答率は 88 %と易しい項目ばかりであった。これは、設問の英文が短く、解答に 要する計算も平易であったからだと考えられる。

(11)

Table 7 推論項目の正答率と弁別力 (5項目) 設問 I2 I5 I7 I8 I9 M α 正答率 .35 .48 .25 .71 .22 .39 .40 SD .48 .50 .43 .46 .42 弁別力 .13 .21 .21 .24 .22 注.N = 77. 下線項目はTable 9の因子分析3因子仮定に含まれる項目 最後の推論セクション(Table 7)は、9 項目の内、弁別力が低かった 4 項目を削除し 5 項 目とした。しかし、4 項目を削除しても、信頼性係数はあまり上昇せず、α = . 40 であった。 このセクションの平均正答率は 39 %と他のセクションより難しいものの、各項目の正答率 は 22 %から 71 %とばらついており、受験者能力をカバーしているという点でバランスが取 れていると言える。 Table 8 ECTTとEPTの記述統計 ECTT(22項目) EPT(24項目) 項目数 一貫性12 分析5 推論5 合計22 語彙9 文法9 読解6 合計24 M 7.69 4.41 1.96 14.06 4.89 6.10 5.21 16.20 SD 2.33 0.98 1.24 3.08 2.02 1.84 1.07 3.50 正答率 0.64 0.88 0.39 0.64 0.54 0.68 0.87 0.67 注.N = 81. テスト全体で合計 22 項目(Table 8)となり、正答率 64 %であった。A2 から B1 レベルの 項目から集めた EPT の正答率 67 %とほぼ一致することから、ECTT は、ほぼ CEFR A2 から B1レベルのテストとして使用できると言える。また、上記の 3 セクションのすべての項目 で見ると、その正答率の範囲が22%から94%と受験者能力を十分カバーしている。よって、 以降の探索的分析をこの22項目(一貫性12項目、分析5項目、推論5項目)で吟味すること とする。 因子分析 続いて、項目分析で正答率および弁別力で問題のなかった ECTT22 項目の得点が、想定 する3つの批判的思考力を反映しているかを、最尤法による探索的因子分析を用いて調査し た。相関係数の算出に際しては、データにランダムな未回答があったため、リストごとでは なく、ペアごとに削除する分析方法を取った。 スクリープロットを見ると、固有値間に大きな差は見られず、複数の次元があることが わかった。因子数の決定に関しては、第 3 または第 4 固有値以降で減少傾向が緩やかになっ ていることから、プロマックス回転で、3因子モデルおよび4因子モデルの両方を吟味した。 今回は、各項目が英語力と批判的思考力を併せ持った探索的な分析であるため、因子負荷 量の基準を.20と低く設定した。その結果、各因子に対する負荷量が.20以下となった5項目 を除外し、測定領域の 3 つの概念を考慮した 3 因子モデルがより説明しやすく妥当と判断し

(12)

た。Kaiser-Meyer-Olkin の標本妥当性検定が KMO = .56 で、容認できない(unacceptable) 水準とされる.50を上回っており(Kaiser, 1974)、かつBartlettの球面性検定結果も問題がな かった(χ2(136) = 258.60, p < .001)。また、適合度も十分な値で、データとモデルに有意 差がないことを確認した(χ2(88) = 97.40, p = .231)。3 因子の説明率(累計負荷量平方和) は28.74%であった。 Table 9に3因子モデルの結果を示す。第一因子に貢献した9項目は、英文は短めで読み取 りやすい項目(C1, C2)もあるが、文章中の情報の論理性や価値を帰納的あるいは演繹的に 推論させる深い推論プロセスが要求されるため、一貫性から推論プロセスを示す因子だと 解釈できる。信頼性もα = .63と安定しており、批判的思考のモデルに合致した能力を測定し ている項目と考えられる。第 2 因子に貢献した 5 項目は、その文章の論理構造と意味を正確 に把握した上で、主に文と文を繋いでテクストの結束性を高めるための語彙を選択する項 目や物語の展開が一貫するように文を並べる項目であったことから、想定した一貫性を表 す因子と解釈できる。信頼性も高く、α = .62 であった。最後の第 3 因子に貢献したのは 3 項 目で、これらすべてが、情報を分析し、計算が必要な項目群であったため、分析から算術プ ロセスを示す因子と解釈できる。3 項目であったが、α = .55 と比較的安定した信頼係数を得 Table 9 ECTT項目に対する因子分析の概要 項目 概要 (一貫性と推論)因子1 α = .63 因子2 (英語力と一貫性) α = .62 因子3 (分析と算術) α = .55 共通性 I5 情報を元に推論 0.71 −0.22 −0.16 0.57 C6 会話文の整序 0.50 0.03 0.07 0.25 C1 会話文の整序 0.39 0.11 0.09 0.18 C2 会話文の整序 0.38 0.31 0.15 0.27 C17 一文挿入 0.35 0.21 −0.12 0.19 I7 情報を元に推論 0.34 −0.01 0.14 0.13 C11 モノローグの整序 0.32 0.01 0.04 0.10 I8 語句の推論 0.31 −0.26 0.14 0.17 I9 情報を元に推論 0.25 −0.01 0.16 0.08 C14 文を繋ぐ適語選択 0.17 0.82 −0.13 0.74 C13 文を繋ぐ適語選択 −0.12 0.55 0.07 0.31 C12 文を繋ぐ適語選択 0.08 0.48 −0.04 0.25 C8 物語文の整序 −0.04 0.34 0.07 0.12 A7 文意に合うグラフ選択 −0.01 0.21 0.14 0.06 A5 情報を基に計算 0.09 0.01 0.93 0.87 A6 情報を基に計算 0.19 −0.01 0.61 0.40 A4 情報を基に計算 −0.27 0.21 0.27 0.19 因子間相関 1 2 3       1 ––       2 0.05 ––       3 −0.04 −.01 –– 注.ペア削除法、最尤法、プロマックス回転

(13)

た。ちなみに、4 因子指定の分析では、第 1 因子にある英文が比較的短く易しい項目である C1とC2が第4因子に移動し、会話文の一貫性を示す因子(α = .71)が構成される。 各因子の解釈が妥当かどうかを確認し、因子の命名を決定するために、各因子の因子得点 (factor score)を算出し、ECTTの下位セクションの得点およびEPT得点との関係を調べた。 その結果をTable 10に示す。下線部分を見ると、多くの推論項目の因子負荷量が高かった第 1因子は推論セクションとの相関(r = .71)が他の因子と推論の相関(r = −.21, r = .15)より かなり高く、続いて一貫性セクションとの相関が高くなっている(r = .50)。よって、「一貫 性と推論」因子と命名した。第2因子は、一貫性セクションとの相関が高くなっている(r = .68)。また、EPTと相関が他のセクションよりも高く、英語力要因がより影響していること がわかる(r = .32)。そのため、「英語力と一貫性」と命名する方がより因子の特性を表すと 考えられる。第3因子では、因子負荷量が高かった項目が分析項目ばかりで、当然、分析セ クションとの相関が高くなっている(r = .70)。一貫性や推論セクションとの関連は見られ ず、また、分析項目の中で算術を必要としない項目 A7 とは別の因子になったことから、テ キスト情報を基に算術する能力は、2 つの下位能力とは異なった能力であることが伺える。 よって、「分析と算術」と命名するのが妥当だと思われる。以上の因子名を Table 9 に示す。 因子分析の結果から、想定した3つの下位概念にある程度分かれるが、それぞれのスキルに 必要な下位スキルが付随した因子形成となることがわかった。 Table 10 各因子の因子得点とECTT、EPTの得点の相関 因子1 因子2 因子3 ECTT (一貫性) .50** .68** .02 ECTT (分析) .02 .18 .70** ECTT (推論) .71** -.21 .15 ECTT (合計) .67** .48** .27* EPT .15 .32** .23* 注.N = 77. *p < .05, **p < .01. 多次元尺度分析 参加者の英語力および 3 つの構成概念を想定したテストであったため、因子分析でデー タに一次元性が認められなかった。そこで、多次元尺度分析(Alternating Least Squares Scaling)を使用し、項目間の距離を求めることによって項目どうしの類似度を視覚化し、 データの概念構造を探索的に探ることにした。 Figure 3が、ECTT22 項目間のユークリッド距離を求めた結果である。まず、ほとんどの 推論項目と少数の一貫性項目が他の項目から離れて、中心縦軸よりかなり右側に分布して いるのがわかる。推論項目のI8だけが中心軸から左に位置しているが、これは、語句の意味 を推測する問題で、その語句あるいはその近くの文を読み取ることができれば正解できる 項目である。しかし、その他の推論項目は、文章を理解しただけでは正解を導くことができ ず、帰納的あるいは演繹的に推論することが求められる高度な項目であった。一方、分析項 目やいくつかの一貫性項目は左側に位置している。中でも問題文が比較的短く易しい項目 や、簡単な計算が必要な項目が集まっている。このことから、この平面上で右に位置する項

(14)

目ほど、より複雑で統合的な思考力が必要な項目であると思われる。よって、次元1は批判 的思考力(認知力)のレベルを示していると考えられる。 Figure 3. 多次元尺度分析によるECTT22項目のユークリッド距離モデル 縦軸の次元 2 は、因子分析の第 2 因子の項目がより下に来ていることから、下に位置する ほど、より正確な文の繋がりを理解する英語力が必要な一貫性項目と考えられる。反対に中 心横軸より上に行くほど、一貫性能力の影響が小さく、別の能力の影響が大きくなっている 項目と解釈できる。よって、次元2は英語力・一貫性能力比重を表すと考えられる。 ECTTとEPTの合計得点間の相関分析 以上、因子分析および多元尺度分析の結果、ECTTの得点から、批判的思考力だけでなく、 第2因子から英語力の影響が認められた。そこで、ECTT得点とEPT得点がどの程度関連し ているかを相関分析で調べた。因子分析で絞った ECTT17 項目でも 22 項目でも、EPT との 相関関係の傾向は同じであったため、Table 11にECTT22項目とEPTの関係のみを示す。 Table 11の下位概念別の相関分析結果を見ると、ECTTとEPTの合計得点の間に、中程度 の有意な相関 (r = .43, p < .001) が認められる。つまり、テスト得点の約20%(r2 = .19)が英 語力で説明されることが明らかとなった。中でも、一貫性項目の文と文の結束や文章の一 貫性をみる整序問題などは、従来の英語力テストでも見られる形式で、英語力の相関が他の 2つのセクションよりかなり高くなっている(r = .41 > r = .29, r = .07)。これは、一貫性項目 は、英文自体の操作に関わるスキルであるため、より英語力との影響が大きいからだと考え られる。反対に、推論項目と英語力に相関がなかったことから、推論自体は認知プロセスで あり、英語力とは別物であると言える(r = .07)。興味深いことに、分析項目は、文法との 相関が低いものの有意にあり(r = .28)、他の一貫性や推論ではそのような相関関係が見ら れない(r =.19; r = .09)。これは、情報の分析と、文の分析に関わる文法との共通点からか、 分析を得意とする学習者の傾向の表れかもしれない。

(15)

Table 11 ECTTとEPTの相関関係 (項目数) 1 2 3 4 5 6 7 8 1. 一貫性(12) ― 2. 分析(5) .12 ― 3. 推論(5) .12 .13 ― 4.ECTT(計22) .84** .46** .53** 5. 語彙(9) .41** .15 -.01 .35** 6. 文法(9) .19 .28* .09 .27* .34** 7. 読解(6) .25* .18 .11 .29** .23* .05 8.EPT (計24) .41** .29** .07 .43** .82** .73** .46** 質問紙調査 参加者が回答に必要だと感じた能力が、作成者が想定したものと一致するかを調査する ために、項目に解答するごとにアンケートに回答してもらった。回答に必要だと感じた能力 が 1 つだけとは限らないため、必要だったと感じた能力順に 3 つまで選択肢から回答しても らった。そして、参加者が 1 番必要な能力だと答えたものに 3 点、2 番目に必要だった能力 に2点、3番目のものは1点を付与し、その合計点を回答数で割った。 Figure 4. それぞれのセクションで受験者が回答の際に必要だと思った能力 Figure 4の結果を見ると、一貫性セクションに関して、想定した一貫性と結束性の能力を 使った割合の合計が 54 %と過半数を占め、他の下位セクションよりも使用能力が明確に表 れている。このことから、受験者は、整序問題や適切な位置に文を挿入する問題において、 文章の理論的な流れ、および隣り合った文のつながりの検証を行っていく必要であったこ とが示唆される。分析セクションにおいても、意図した分析能力が36%と最も高かった。文

(16)

章中の情報や数値を抽出し、演算したり、図表の読み取りを行ったりして回答する際に分析 能力を使ったと感じていたことが伺える。また、推論(17 %)や読解(15 %)の能力も高 かったことから、単なる計算能力ではなく、英文を読みながら必要な情報を取り出し、推論 していったことが伺える。 しかしながら、推論セクションでは、推論(20%)だけでなく他の能力領域も満遍なく選 択されていた。この理由として、推論項目では、文の論理構造や言語情報、数値情報を把握 した上で、情報の取捨選択や真偽を判断・評価するため、総合的な能力が求められたからだ と解釈できる。最後に、全てのセクションに、読解をはじめ、英語力がある程度の割合を占 めていることから、ECTTは想定していた英語力もかなり影響しているという証拠となる。 アンケートの最後に付けた「その他」の、自由記述欄はほとんど無回答であったが、分析 スキルの中の「計算能力」と記入していた学生がいた。

考察

RQ1 (ECTT の各項目の弁別力および難易度は A2 から B1 レベルの受験者にとって妥当で あるか)について、項目分析の結果、37項目中12項目を削除した。主な原因は、項目の内容 を見る限り良問だと思っていたいくつかの項目の弁別力が低く推定されたためである。英 語力と批判的思考力という異なる能力を測定する項目であるため、1つの概念を測定してい る項目より、弁別力が正確に表れにくかったと考えられる。例えば、英語力があり、英文を 理解できたとしても、問いの課題が解けなかった場合や、反対に英文が読み取れずに、批判 的思考力があっても十分に発揮できなかった場合など、回答パターンが一貫していなかっ たからだと考えられる。事実、より高度で総合的な思考能力が必要な推論項目では、複数の 能力が使われているためか、高い弁別力を示しているものが見られない。最も高かった項目 (I8)でさえ弁別力が.24に留まりで、これは、語句の意味を推測する局所的な問いであった。 テスト全体で、弁別力が高かった項目は、C14(.45)の文と文の間に接続詞を入れる結束 性を問う項目、A5(.43)の短い英文を読んで計算をする項目であった。このどちらも求め られる知識や能力が限定されており、ストレートに得点に結びつく問題である。このことか ら、第2言語のオブラートに包まれたテストで、かつ批判的思考力の中でもより複雑で統合 的な能力を測定する場合には、これまでの弁別力の観点から妥当性のある項目を判断する には限界があると思われる。この点を考慮すると、今回の信頼性指標であるα係数が、一貫 性(α = .61)、分析(α = .52)、推論(α = .40)と、高度な批判的思考を必要とするほど下がっ ているのも説明がつく。よって、Table 3 の「一般化」推論(Table 3)における、「2.内的 一貫性」については十分なレベルの証拠を提供できなかったが、その原因を突き止めること ができた。 難易度に関しては、3つの下位概念によってかなり異なっていた。最も易しかったのは正 答率 88 %だった分析の項目で、図表だけなく文章も短く、理解できさえすれば正答できた からであろう。そのため、今後、もう少し長い英文を分析させる難しい項目を加える必要が ある。一貫性セクションは、様々な難易度の項目で受験者能力をカバーしており、かつ正答 率平均が 64 %と対象レベルの受験者にとって妥当な難易度であった。最も難しかったのは 推論セクションで、正答率が 39 %に留まった。これは、参加者にとって馴染みがない形式 で、かつ英文を理解しただけでは正答できない問題が多かったからだと思われる。 しかし、ECTT全体としては、分析や一貫性セクションの局所的な易しい項目と、比較的 難しい推論セクションの難易度が相殺され、テストの正答率が 64 %(Table 7)と妥当なレ ベルであった。このレベルは、EPTの正答率とほぼ同じであることから、A2からB1レベル

(17)

の受験生にとって適切なレベルの批判的思考テストであると言える。よって、「得点化推論」 における「2.項目の統計的特徴は適切である」という前提を裏付けることができた(Table 3)。 続いて、RQ2 (ECTT は、英語力および想定した 3 つの構成概念を反映しているか)に関 して、因子分析を行った結果、3 因子モデルが妥当であった。そして、第 1 因子は一貫性か ら推論に進む因子、第 2 因子は英文理解から一貫性を測る因子、第 3 因子に情報分析から算 術をする因子に分かれた。 以上のことから、第 1 因子の「推論」はそれだけで成り立つスキルではなく、Figure 1 の モデルにあるように、情報の「明確化」や「推論の土台の検討」プロセスを踏まえて行われ るスキルだと示唆される。また、第2因子の一貫性は直接英文構造に密接に関わる設問であ るため、英語力が高いことと結束性や一貫性能力が高いことが直結したと考えられる。よっ て、「一貫性」は英語という領域固有知識(Figure 2)に最も影響を受ける、批判的思考の 最も基礎になる「明確化」に関わるスキルの一つだと考えられる。これは、「一貫性」の能 力を測定する項目であるC2が、第1因子(.38)に分類されているが、 差で第2因子(.31) にも寄与していることからも裏付けられる。そして最後に、算術が必要な項目だけで、1つ の因子が形成されたことから、算術能力は、情報を分析したり、その真偽を評価したりする 「分析」能力とは、また別の能力であると考えられる。 よって、「説明」推論(Table 3)において、「1.得点が想定した 3 つの概念に分かれる」 傾向が見られた。厳密には、上位スキルは下位のスキルと切り離して現れず、密接に関連し ていることが明らかとなった。また、今回の新しい形式のテストは多次元性を有し、批判的 思考の中でも高度な認知能力を要する推論の次元と、ベースのスキルとして英語力と切り 離せない一貫性を示す次元が存在することが、多次元尺度分析において視覚的に示すこと ができた。 RQ3(ECTT で得られた得点は、外部試験である EPT の得点とどのように関係している か)について、ECTT と EPT の間に中程度の相関関係(r = .43)が認められた(Table 11)。 しかし、選択式の純粋な英語熟達度テストどうしであれば、通常はもっと高い相関が期待 できる。例えば、日本英語検定協会(2015)の調査では、センター試験の英語科目受験者に 実用英語技能検定(英検)およびTest of English for Academic Purpose(TEAP)を受験して もらった結果、センター試験と英検の相関はr = .89、センター試験とTEAPの相関はr = .80、 TEAPと英検の相関は r = .84 と、それぞれに高い相関係数が報告されている。その点で、 今 回のECTTと英語熟達度テストの相関が中程度にとどまっていることは、ECTTが英語力を 測定しながら、英語力以外の能力も測定している証拠となると考える。 各下位概念と EPT の相関では、一貫性セクションが最も英語力と関連しており、一貫性 項目が文章の構造に向けられた問題だからと解釈できる。それに比べて、分析や推論は、文 章自体の構造ではなく、内容に向けられており、その英文から必要な情報を使うことができ ればよく、その得られた情報操作は、概念化すれば日本語で考えることができるため、英語 力とは直接大きな相関が出なかったと考えられる。 RQ4(問題を解く際、受験者は作成者が想定した能力を発揮していると感じていたか)に ついて、一貫性および分析セクションに関しては、想定した能力を最も使ったと感じてい た。しかし、推論セクションでは、推論以外の能力も大きな比重を占めていた。よって、こ こでも、批判的思考プロセスを支持する結果となり、推論を正しく行うためには、先に、明 確化や推論の土台の検討に必要な一貫性および分析能力を活性化させる必要があったこと が伺える。興味深いことに、相関分析では、推論セクションと英語力との相関が表れなかっ

(18)

たにもかかわらず、英語力を使ったと回答した割合が、他のセクションよりも大きかったこ とである(推論27%, 分析19%, 一貫性18%)。このことからも、持てる英語力をしっかり 使いながらも、推論から正しい結論を導いたかどうかが得点に反映されたことが伺える。以 上のことから、Table 3の枠組みの「説明」推論の論拠の前提である「受験者が使う能力は、 テスト開発者の予測と一致する」ことを概ね裏付けることができたが、それ以上に、批判的 思考プロセスのモデルを支持する結果となった。

結論と今後の課題

本研究は、CEFR A2からB1レベルの英語学習者を対象とした英語版批判的思考力テスト を開発するため、英語テストの中で批判的思考力を選択問題形式で測定できそうな3つの概 念に絞った結果、より批判的思考プロセスモデルに近い形で因子が抽出された。そして概 ね、論証的妥当性の検証に基づいて、Table 3 における「領域定義」から「外挿」推論まで のテスト得点の妥当性を論証することができた。 また、パイロット研究段階として、今後の課題を明らかにすることができた。第1点目と して、当初作成した 35 項目から、機能していない項目が 13 項目も検出され、作問の難しさ を実感した。具体的には、項目弁別力(信頼性)を高めることを求めすぎると、想定した妥 当性を満たした項目が作りづらいという懸念が出てきた。因子分析においても、比較的高い 因子負荷量が出現しにくく、3 因子抽出の因子分析では、それが原因でさらに 5 項目削除し た。これは、常に英語力と複雑な思考力が存在していることが大きな原因であると考えられ る。よって、弁別力指標や因子負荷量指標がやや低いという理由だけで削除していくと、項 目が少なくなりすぎ、内容妥当性を失うことになりかねないため、多次元尺度分析などで、 どのような性質の項目であるかを把握し、それぞれの次元の項目がバランスよく含まれる テストにすることも大切ではないかと考える。この点については、まずは、今回削除した項 目を再吟味し、別の受験者でも同じような結果になるか検討してみる必要がある。 第2点目は、先行研究で、CCTSTとワトソン・グレーザー批判的思考力テストとの相関が 中程度(r = .41, p < .001; Facione, 2000)と報告されていることから、このECTTが英語力以 外に測っているものが批判的思考力であることを確認するには、今後、日本語版の批判的思 考力テストなど、他の批判的思考を測定すると考えられるテストと中程度の関係が確保さ れるか調査していく必要がある。 第3点目は、妥当性における解釈的論証の最後の「利用」推論に当たる(Table 3)検証を 行っていく必要がある。複雑な思考能力を測定することは母語である日本語でも容易なこ とではない。しかし、海外留学や仕事によっては、 L2環境で考えながら英文読み行動するこ とが求められる。よって、英文を読む中で、批判的思考力が十分発揮できる力があるかを 測定できるこのテストの波及効果を調査することは大切だと思われる。また、批判的思考 力を発揮しながら英語で発信することが重要であることを考えると、筆記選択問題では測 定できる批判的思考スキルが限られることから、批判的思考力を評価観点に取り入れたパ フォーマンステストについても今後検討していく必要があるだろう。

引用文献

石井英真 (2015). 『今求められる学力と学びとは: コンピテンシー・ベースのカリキュラム の光と影』東京:日本標準 大井恭子 (2008). 「思考力育成の試み:中学生の英語ライティング指導を通して」『千葉大学 教育学部研究紀要』56, 175−184.

(19)

Retrieved from https://core.ac.uk/download/pdf/96989795.pdf

糟屋美千子 (2010). 「英語教育における批判的思考力とコミュニケーション能力の育 成」『兵庫県立大学環境人間学部研究報告』12, 69–78. Retrieved from https://u-hyogo. repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_ detail&item_id=1769&item_no=1&page_id=13&block_id=46 菊島正浩・寺本妙子・柴原宜幸 (2018).「大学生における批判的思考力と態度の育成を 目的とした教育プログラムの実践と評価」『日本教育工学会論文誌』41, 427–437. doi:10.15077/jjet.41060 楠見孝 (2010). 「批判的思考と高次リテラシー」楠見孝 (編) 『思考と言語』(pp. 134–160) 京都:北大路書房 楠見孝 (2018). 「リテラシー を支える批判的思考:読書科学への示唆」『読書科学』60, 129–137. doi: 10.19011/sor.603_129 楠見孝・子安増生・道田泰司 (2011). 『批判的思考力を育む: 学士力と社会人基礎力の基盤 形成』東京:有斐閣 楠見 孝・道田泰司 (2016).『批判的思考: 21 世紀を生きぬくリテラシーの基盤』東京:誠信 書房 楠見孝・田中優子・平山るみ (2012).「批判的思考力を育成する大学初年次教育の実践と評 価」Cognitive Studies, 19, 69–82. 清水誠・大澤正樹 (2015).「批判的思考力を育成する指導方法の開発 : 批判的思考の構 成要素を役割分担して話し合いをさせることの効果」『埼玉大学紀要 教育学部』64, 103–116. doi:10.24561/00017729 竹田育子 (2016).「高等学校における批判的思考力を育む英語授業開発」『島根大学大学 院教育学研究科「現職短期 1 年コース」課題研究成果論集』7, 51–60. Retrieved from https://ir.lib.shimane-u.ac.jp/ja/list/journals/%E5%B3%B6/E-KKS/7/--/item/36344 髙見健太・木下博義 (2017). 「他者との関わりを通じて批判的思考を働かせるための理科学 習指導法の開発と評価」『理科教育学研究』58, 27–40. doi:10.11639/sjst.16046 野澤雄紀・伊藤素江・須永正巳・堂下雄輝・村田維江 (2016). 「論述力を測定する混合 フォーマット開発の試み」第14回日本言語テスト学会発表資料 Retrieved from https:// berd.benesse.jp/up_ images/research/assess_20170124.pdf 平山るみ・田中優子・河崎美保・ 楠見孝 (2010). 「日本語版批判的思考能力尺度の構成と性 質の検討 : コーネル批判的思考テスト・レベル Z を用いて」『日本教育工学会論文誌』 33, 441–44.doi:10.15077/jjet.KJ00006063557 道田泰司 (2001).「批判的思考の諸概念 : 人はそれを何だと考えているか ?」『琉球大学教育 学部紀要』59, 109–127.

Retrieved from http://ir.lib.u-ryukyu.ac.jp/bitstream/20.500.12000/524/1/michita_y08. pdf 道田泰司 (2003).「批判的思考概念の多様性と根底イメージ」『心理学評論』46, 617–639. doi:10.24602/sjpr.46.4_617

峯島道夫・今井理恵 (2017). 「批判的思考力を育成する高・大連携の試み」『中部地区英語 教育学会紀要』46, 133–140. doi:10.20713/celes.46.0_133

文部科学省 (2011).「言語活動の充実に関する指導事例集 : 思考力、判断力、表現力等の育 成に向けて (中学校版)」Retrieved from http://www.mext.go.jp/component/a_menu/ education/micro_detail/__ icsFiles/afieldfile/2011/05/30/1306108.pdf

(20)

文部科学省 (2012).「社会の期待に応える教育改革の推進」『国家戦略会議関係資料』 Retrieved from http://www.mext.go.jp/b_menu/shingi/chukyo/chukyo9/shiryo/__ icsFiles/afieldfile/2012/ 06/25/1322792_6.pdf

文部科学省.(2016).「幼稚園 , 小学校 , 中学校 , 高等学校および特別支援学校の学習指導要 領等の改善について(答申)」Retrieved from http://www. mext. go. jp/a_menu/shotou/ new-cs/news/20080117.pdf

山本明. (2017). 「批判的思考の観点から見たメディア・リテラシー」『心理学評論』60, 163–180. doi:10.24602/sjpr.60.2_163

Benesse i-Career (n.d.). GPS-Business. Retrieved from https://www.benesse-i-career.co.jp/ gps_ business/

Brookfield, S. (1987). Developing critical thinkers: Challenging adults to explore alternative ways

of thinking and acting. San Francisco, CA: Jossey-Bass.

CCTST (n.d.). California critical thinking test. Retrieved from https://www.insightassessment. com/Products/Products-Summary/Critical-Thinking-Skills-Tests/California-Critical-Thinking-Skills-Test-CCTST

Chapelle, C., Enright, M., & Jamieson, J. (2008). Building a validity argument for TOEFL. New York, NY: Routledge.

Council of Europe (2001). Common European Framework of Reference for Languages: learning,

teaching, assessment. Cambridge university press.

Ennis, R. H. (1987). A taxonomy of critical thinking dispositions and abilities. In J. B. Baron & R. J. Sternberg (Eds.), Teaching thinking skills: Theory and practice. New York, NY: W. H. Freeman and Company. (pp. 9–26).

Ennis, R. J., & Millman, J. (1985). Cornell tests of critical thinking. Pacific Grove, CA: Midwest. Facione, P. (1990). Critical thinking: A statement of expert consensus for purposes of

educational assessment and instruction (The Delphi Report).

Facione, P. A. (2000). The disposition toward critical thinking: Its character, measurement, and relationship to critical thinking skill. Informal Logic, 20, 61–84. doi:10.22329/il.v20i1.2254 Griffin, P., McGaw, B., & Care, E. (Eds.). (2012). Assessment and teaching of 21st century skills.

Berlin, Germany: Springer.

Insight Assessment (2016). California critical thinking skills test user manual and resource guide. Retrieved from https://www.elcentrocollege.edu/aboutecc/curriculum-assessment-and-accreditation-office/quality-enhancement-plan/documents/cctst_cctst-n_ cct-g835_user_manual_216.pdf

Kaiser, H. F. (1974). An index of factorial simplicity. Psychometrica, 39, 31–36. doi:10.1007/ BF02291575

Vendrely, A. M. (2007). An investigation of the relationships among academic performance, clinical performance, critical thinking, and success on the physical therapy licensure examination. Journal of Allied Health, 36, 108–123. Retrieved from http://docserver. ingentaconnect.com/deliver/connect/asahp/00907421/v36n2/s12.pdf?expires=15750887 51&id=0000&titleid=6329&checksum=5398BDC457267C104B12B918FF5020B8

Watson, G., & Glaser, E. (2002). Watson-Glaser critical thinking appraisal, UK edition: Practice

test. Psychological Corporation.

(21)

Grove, CA: Thomson Brooks/Cole.

謝辞

本研究は、共同研究メンバーである竹林尚輝氏、池田有希菜氏、吉居薫乃氏、新明匠氏、 須田佳成氏から多大なるご協力をいただきました。そして、3人の匿名査読者からの貴重な コメントを基に論文を完成させることができました。この場を借りて深くお礼を申し上げ ます。

付録

(推論問題例)

Read the passage below and answer the question.

Dr. White was interested in diet (low-calorie) foods and decided to investigate how many times and how much people eat diet foods in a day. He conducted a questionnaire to 1,000 men and 1,000 women, 2,000 people in total, at random. According to the results of the questionnaire, the following two facts became clear.

(I) The more times a day people eat diet foods, the higher their body fatness is. (II) The larger the quantity of diet foods people eat, the higher their body fatness is.

From these results, Dr. White made the following two conclusions.  A. Diet foods have no effect.

 B. Diet foods make people fat.

Question. Dr. White s way of demonstrating these conclusions can be best evaluated as: 1. Good, because . . .

2. Good, because . . . 3. Poor, because . . .

(22)

Table 2 測定領域と問題形式 測定領域 問題形式 (a)一貫性 1.会話文や物語文内の文を並べ替える2.文章中に欠けている文や語を入れる 3.文章中から不要な1 文を抜く (b)分析 1.文章を読んで、内容を示す図表を選択する 2.文章や図表から目的に応じた情報を抜き出し、評価する 3.文章や図表から目的に応じた数値を選択し、簡単な計算をして解を導く (c)推論 1.信頼できる複数の事例や結果から、客観的な結論を導く2.文脈から語彙の意味を推測する 3.いくつかの前提から最も妥当な解を導く 従来の多く
Table 3 ECTT 開発における解釈的論証 推論 論拠の前提 論拠に対する裏付け方法 1.領域定義 1. 3 つの下位能力  (分析、一貫性、推論)  は、批判的思考能力を構成する代表的な下位能力である。 2. ECTT の英文は、B1 レベルであれば十分理解できる 英語で書かれている。 1 &amp; 2.  先行研究に基づく領域分析と専門家による判断2.専門家による判断 2.得点化 1.  テスト作成のためのテスト細目および採点は目標とする知識やスキルの証拠を得るのに適切である。 2.項目の統計的
Table 7 推論項目の正答率と弁別力  (5項目) 設問 I2 I5 I7 I8 I9 M α 正答率 .35 .48 .25 .71 .22 .39 .40 SD .48 .50 .43 .46 .42 弁別力 .13 .21 .21 .24 .22 注.N = 77
Table 11 ECTT と EPTの相関関係 (項目数) 1 2 3 4 5 6 7 8 1. 一貫性(12) ― 2. 分析(5) .12 ― 3. 推論(5) .12 .13 ― 4 . ECTT (計 22 ) .84 ** .46 ** .53 ** ― 5. 語彙(9) .41 ** .15 -.01 .35 ** ― 6. 文法(9) .19 .28 * .09 .27 * .34 ** ― 7. 読解(6) .25 * .18 .11 .29 ** .23 * .05 ― 8 . EPT

参照

関連したドキュメント

MANGA Kyoto University (English ver.)( 5. The Sea Turtle and I :. Fieldwork In Kyoto And

MANGA Kyoto University (English ver.)( 4. It Can Heal Anything? The Almighty Cell ). Kyoto University and Kyoto Seika University

MANGA Kyoto University (English ver.)( 3. The Chimpanzee Story : the Kyoto University Primate Research Institute ). Kyoto University and Kyoto Seika University

MANGA Kyoto University (English ver.)( 1. Let's Go to the Children's Museum! ). Kyoto University and Kyoto Seika University

T Taiwan General Scholastic Ability Test (GSAT) or Department Required Test Thailand Ordinary National Educational Test(O-net), General Aptitude Test. (GAT), Professional

T Taiwan General Scholastic Ability Test (GSAT) or Department Required Test Thailand Ordinary National Educational Test(O-net), General Aptitude Test. (GAT), Professional

It is evident from the results that all the measures of association considered in this study and their test procedures provide almost similar results, but the generalized linear

A pointed regular category is subtractive if and only if every span in it is subtractive, and moreover, the functor S not only preserves but also reflects subtractive spans..