結果 - 学習者の学びを教師の振り返りに活用するための計量テキスト分析

6.4.1 タグ付け済みデータファイルの作成

初めに，「6.3分析資料」で示した４つの資料から文字情報を抽出した。

スライド資料からは，テキストデータとして入力された文字情報をすべて抽出し，ページごとに整理した。使用されているイラストについては，本研究が文字情報の分析を目的としていることから，分析の対象外とした。動画を含むページについては，動画に表示された字幕を抽出した。なお，動画の音声は英語であった。授業参加者である高校生が英語の聞き取りに熟達していないことを考慮し，動画に含まれる音声データは本研究の分析対象に含めないこととした。以上のようにスライド資料からは，スライドの文字情報，動画の字幕情報を分析対象として抽出した。

口頭説明台本は，スライド資料に対応させて作成した説明用の台本である。授業実施者である著者が作成した。口頭説明台本は全てテキストデータで構成されていることから，台本に掲載されている台詞全体を分析対象として抽出した。

配布資料は，振り返り活動で使用する「付箋貼付用台紙」，およびワークショップ中に学習者に配布する「学びの変化を可視化するワークシート（以下，「ワークシート」という。）

である。文字情報をすべて分析対象として抽出した。

カードに関しては，カードの種類に応じて以下のテキスト情報を抽出した。まず「ゴールカード」からは，カードの名称とゴール条件として記述されている文章を抽出した。「プロジェクトカード」からは，カードの名称のみを抽出した。その他の「マネーカード」「タイムカード」「Achivementカード」「意志カード」からは，それぞれのカードに記入されている名称を抽出した。

抽出した文字情報の概要を，表6.2にまとめて示す。

表6.2 分析資料から抽出したデータ

分析資料の種類資料の内容抽出した情報

スライド資料スライドテキストデータとして入力された文字情報

動画日本語字幕

口頭説明台本台詞記載された文字情報配布資料付箋貼付用台帳印刷された文字情報ワークシート印刷された文字情報カードゴールカードカードの名称

ゴール条件プロジェクトカード名称

マネーカード「100M」「500M」タイムーカード「タイム」

Achivement 「Achive」

意志カード「青の意志」「緑の意志」「黄の意志」

抽出したテキストデータをそのまま分析に用いると，どこからどこまでが１つのスライドなのかといったことやワークショップのどの場面に使われる資料なのかということが，KH

Coderには区別できない。そこで，抽出したテキストデータに対し，以下で示すようにH1，

H2 およびH3タグを使って，場面，資料の種類およびスライドごとの区分にマーキングを施した。タグ付けを施したデータファイルを「タグ付け済み教材データファイル」（以下，

「教材データ」という。）と呼ぶ。以下に，教材データの一部を抜粋した。

<H3>^{スライド番号}9</H3>

SDGs^{ワークショップ}

カードゲームで，SDGsを体感しよう！

<H3>^{スライド番号}10</H3>

講義の前に。

今の「SDGs」のイメージをメモしましょう！(^後略)

まずデータ全体が，「1 事前」「2 講義」「3 体験」「4 振り返り」および「5 補足」という５つの部分に分かれていることを，H1 タグによって示している。たとえば，「<H1>2_^講

義</H1>」タグは，このタグ以降が講義場面で用いた資料であることを示している。なお，

５つの部分は，ワークショップの５場面に対応している。次に，その５つの部分の内側が，

分析資料の種類によって分かれていることを，「2_^講義_^{スライド」}^「2_^講義_^{口頭説明」}^「2_

講義_配布物」といったH2タグで括ることで示している。さらに H2タグで括られたそれぞれの部分の内側に，「スライド番号9^」^{「スライド番号}10」といったスライドのページ番号に対応したタグをH3タグとして加えた。H1からH3 のタグは，手作業で入力した。本研究で用いたタグは，表6.3 にまとめて示す。

表6.3 分析資料に用いたタグ

階層説明分類の例

<H1>タグ場面別の分類「1 事前」「2 講義」「3 体験」

「4 振り返り」「5 補足」

<H2>タグ資料の種類による分類「スライド」「口頭説明」「配布物」「カード」

<H3>タグスライド番号による分類「スライド番号１」「スライド番号２」など

カードの種類による分類「プロジェクトカード」「ゴールカード」など

6.4.2 KH Coderにおける前処理

作成した教材データについて多変量解析を行うため，KH Coderを用いてデータ中から自動的に言葉を取り出す処理を行った。KH Coderは，文章を形態素に分解し，助詞や接続詞，数字などどのような文の中にでも出現する一般的な語を自動的に分析対象から除外する。その後，「進ん(で)」「進ま(ない)」「進め(ば)」などはすべて「進む」という１種類の語として数えるというように（樋口, 2014），活用のある語を基本形に直して抽出する。このようなKH Coderの処理によって，全体で1,881種類，18,926語，そのうち助詞や接続詞，

数字などを除いた1,425^種類，7,357語が分析の対象として取り出された。

抽出された語を確認すると，「R」と「s」（「R’s」で１つの固有名詞）や「ワケル」と「くん」（「ワケルくん」で１つの固有名詞）などの区切り方が不適切な語，「可能」と「性」(可能性)^{や「協」と「働」}(^協働)などのそれぞれの語でも意味はあるが１つのまとまりの語として抽出したほうが分析に適していると考えられる語が見受けられた。また，KH Coderの

処理で自動的に分析から除外された語の中には，「2030」のようなSDGsの特徴を表す語が見受けられた。このような，語の区切りを指定したい語および分析に利用したいが自動的には抽出されなかった語を「force-pick-up01.txt」として１つのファイルにまとめた。なお，強制抽出する語には，教材データを作成する際に挿入したタグを表す文字列も追加した。タグを表す文字列は，次に示す手続きで分析から除外する。さて，作成されたファイル

「force-pick-up01.txt」は，KH Coderの機能である「分析に使用する語の取捨選択」の「強制抽出する語の指定」で処理を行い，強制的に抽出する語として登録された。強制抽出する語のリストの一部を，表6.4 に示す。強制抽出する語のリストの全体は，付録A に示す。

表6.4 強制抽出する語のリストの一部

3R R s ワケルくん Iターン

Uターン CO2 協働可能性

2030 スライド番号口頭説明 2 講義配布物

一方，「する」「ある」などの一般的な動詞は，出現数が多いため，多変量解析の結果に大きな影響を与えてしまう可能性がある。また，強制抽出する語のリストの中には，分析に使用することが望ましくない語も含まれている。例えば，「口頭説明」や「スライド番号」，「2 講義配布物」のようにデータの区分を表すタグとして追加した語である。これらの語は，

ワークショップの内容を分析する際には除外しなければならない。そこで，これらの分析に適さない語を「force-ignore01.txt」としてまとめ，作成したファイルを「分析に使用する語の取捨選択」の「使用しない語の指定」に登録することで，これ以降の分析から除外した。

分析に使用しない語のリストの一部を，表6.5 に示す。分析に使用しない語のリストの全体は，付録A に示す。

表6.5 分析に使用しない語のリストの一部口頭説明スライド番号スライドする

あるなるいる 2 講義配布物

ここまでの作業を行った後，再度KH Coderで前処理を行ったところ，1,412種類，6,339 語，H1タグ５件，H2タグ13件，H3タグ179件が分析対象として抽出された。

6.4.3 頻出語，特徴語の抽出

教材データの中で，多く用いられていた語を確認した。11回以上出現した上位119種類をまとめたものを表6.6 として示す。なお，KH Coderは，基本設定ではひらがなのみで構成される語（システム上は「動詞B」「名詞B」等として，漢字を含む「動詞」「形容詞」等

とは別に分類）を抽出しない。しかし，本研究では，名詞「つながり」や否定助動詞「ない」

など，ひらがなの言葉や助動詞も分析の対象である。そこで，頻出語のリストを作成する

際，KH Coderによって抽出する品詞設定を「すべての語」に変更して処理を行った。

表6.6頻出語のリスト

KH Coderから出力された結果を，筆者がExcelで加工して作成。

表6.6を確認すると，「世界」142回，「SDGs」110回，「目標」75回，「持続」40回，「開発」36回といった，SDGsの概要を表す語が多く出現していた。次に多く出現しているのは，「プロジェクト」94回，「ゲーム」59回，「カード」56回といったカードゲームに関わる語である。また，「感じる」33回，「気づく」26回，「振り返る」24回といった学びを深めるために設定した活動に関する語や，「変化」34回，「意識」27回，「必要」23回，「なぜ」21 回といった振り返りの焦点についても多く出現していた。また，ワークショップの目標に関係する語としては，「活用」30回，「つながる」17回，「可視」11回が確認された。

次に，ワークショップの構成をさらに詳しく調べるため，ワークショップの５場面それぞ

れを特徴づける語を抽出した(表6.7)。抽出にあたっては，Jaccardの類似性測度を用い，

この値が大きい順に10語を選択した。なお，単語w と場面X のJaccardの類似性測度は，

式(2.1)で求められる数値である。KH Coderから場面を特徴づける語を抽出する手順と設

定は，付録Bに示す。

表6.7 ワークショップの各場面を特徴づける語

KH Coder から出力された結果を，筆者がExcelで加工して作成。数値は式

(2.1)で求められるJaccardの類似性測度を表す。

まず「1 事前」場面においては，「ワークショップ」「研究」の語が上位に挙がっている。また，学習者に依頼する「アンケート」も頻出しており，本ワークショップが研究の一環であること，授業参加者にはアンケート形式の調査への協力を説明していることが読み取れる。

ドキュメント内学習者の学びを教師の振り返りに活用するための計量テキスト分析 (ページ 61-151)