• 検索結果がありません。

6.4.1 タグ付け済みデータファイルの作成

初めに,「6.3分析資料」で示した4つの資料から文字情報を抽出した。

スライド資料からは,テキストデータとして入力された文字情報をすべて抽出し,ページ ごとに整理した。使用されているイラストについては,本研究が文字情報の分析を目的とし ていることから,分析の対象外とした。動画を含むページについては,動画に表示された字 幕を抽出した。なお,動画の音声は英語であった。授業参加者である高校生が英語の聞き取 りに熟達していないことを考慮し,動画に含まれる音声データは本研究の分析対象に含めな いこととした。以上のようにスライド資料からは,スライドの文字情報,動画の字幕情報を 分析対象として抽出した。

口頭説明台本は,スライド資料に対応させて作成した説明用の台本である。授業実施者で ある著者が作成した。口頭説明台本は全てテキストデータで構成されていることから,台本 に掲載されている台詞全体を分析対象として抽出した。

配布資料は,振り返り活動で使用する「付箋貼付用台紙」,およびワークショップ中に学 習者に配布する「学びの変化を可視化するワークシート(以下,「ワークシート」という。)

である。文字情報をすべて分析対象として抽出した。

カードに関しては,カードの種類に応じて以下のテキスト情報を抽出した。まず「ゴール カード」からは,カードの名称とゴール条件として記述されている文章を抽出した。「プロ ジェクトカード」からは,カードの名称のみを抽出した。その他の「マネーカード」「タイ ムカード」「Achivementカード」「意志カード」からは,それぞれのカードに記入されてい る名称を抽出した。

抽出した文字情報の概要を,表6.2にまとめて示す。

表6.2 分析資料から抽出したデータ

分析資料の種類 資料の内容 抽出した情報

スライド資料 スライド テキストデータとして入力された文字情報

動画 日本語字幕

口頭説明台本 台詞 記載された文字情報 配布資料 付箋貼付用台帳 印刷された文字情報 ワークシート 印刷された文字情報 カード ゴールカード カードの名称

ゴール条件 プロジェクトカード 名称

マネーカード 「100M」「500M」 タイムーカード 「タイム」

Achivement 「Achive」

意志カード 「青の意志」「緑の意志」「黄の意志」

抽出したテキストデータをそのまま分析に用いると,どこからどこまでが1つのスライド なのかといったことやワークショップのどの場面に使われる資料なのかということが,KH

Coderには区別できない。そこで,抽出したテキストデータに対し,以下で示すようにH1,

H2 およびH3タグを使って,場面,資料の種類およびスライドごとの区分にマーキングを 施した。タグ付けを施したデータファイルを「タグ付け済み教材データファイル」(以下,

「教材データ」という。)と呼ぶ。以下に,教材データの一部を抜粋した。

<H1>2_講義</H1>

<H2>2_講義_スライド</H2>

<H3>スライド番号9</H3>

SDGsワークショップ

カードゲームで,SDGsを体感しよう!

<H3>スライド番号10</H3>

講義の前に。

今の「SDGs」のイメージをメモしましょう!(後略)

まずデータ全体が,「1 事前」「2 講義」「3 体験」「4 振り返り」および「5 補足」という 5つの部分に分かれていることを,H1 タグによって示している。たとえば,「<H1>2_

義</H1>」タグは,このタグ以降が講義場面で用いた資料であることを示している。なお,

5つの部分は,ワークショップの5場面に対応している。次に,その5つの部分の内側が,

分析資料の種類によって分かれていることを,「2_講義_スライド」2_講義_口頭説明」2_

講義_配布物」といったH2タグで括ることで示している。さらに H2タグで括られたそれ ぞれの部分の内側に,「スライド番号9「スライド番号10」といったスライドのページ番号 に対応したタグをH3タグとして加えた。H1からH3 のタグは,手作業で入力した。本研 究で用いたタグは,表6.3 にまとめて示す。

表6.3 分析資料に用いたタグ

階層 説明 分類の例

<H1>タグ 場面別の分類 「1 事前」「2 講義」「3 体験」

「4 振り返り」「5 補足」

<H2>タグ 資料の種類による分類 「スライド」「口頭説明」「配布物」「カード」

<H3>タグ スライド番号による分類 「スライド番号1」「スライド番号2」など

カードの種類による分類 「プロジェクトカード」「ゴールカード」など

6.4.2 KH Coderにおける前処理

作成した教材データについて多変量解析を行うため,KH Coderを用いてデータ中から自 動的に言葉を取り出す処理を行った。KH Coderは,文章を形態素に分解し,助詞や接続 詞,数字などどのような文の中にでも出現する一般的な語を自動的に分析対象から除外す る。その後,「進ん(で)」「進ま(ない)」「進め(ば)」などはすべて「進む」という1種類の 語として数えるというように(樋口, 2014),活用のある語を基本形に直して抽出する。この ようなKH Coderの処理によって,全体で1,881種類,18,926語,そのうち助詞や接続詞,

数字などを除いた1,425種類,7,357語が分析の対象として取り出された。

抽出された語を確認すると,「R」と「s」(「R’s」で1つの固有名詞)や「ワケル」と「く ん」(「ワケルくん」で1つの固有名詞)などの区切り方が不適切な語,「可能」と「性」(可 能性)や「協」と「働」(協働)などのそれぞれの語でも意味はあるが1つのまとまりの語と して抽出したほうが分析に適していると考えられる語が見受けられた。また,KH Coderの

処理で自動的に分析から除外された語の中には,「2030」のようなSDGsの特徴を表す語 が見受けられた。このような,語の区切りを指定したい語および分析に利用したいが自動 的には抽出されなかった語を「force-pick-up01.txt」として1つのファイルにまとめた。な お,強制抽出する語には,教材データを作成する際に挿入したタグを表す文字列も追加し た。タグを表す文字列は,次に示す手続きで分析から除外する。さて,作成されたファイル

「force-pick-up01.txt」は,KH Coderの機能である「分析に使用する語の取捨選択」の「強 制抽出する語の指定」で処理を行い,強制的に抽出する語として登録された。強制抽出する 語のリストの一部を,表6.4 に示す。強制抽出する語のリストの全体は,付録A に示す。

表6.4 強制抽出する語のリストの一部

3R R s ワケルくん Iターン

Uターン CO2 協働 可能性

2030 スライド番号 口頭説明 2 講義 配布物

一方,「する」「ある」などの一般的な動詞は,出現数が多いため,多変量解析の結果に大 きな影響を与えてしまう可能性がある。また,強制抽出する語のリストの中には,分析に使 用することが望ましくない語も含まれている。例えば,「口頭説明」や「スライド番号」,「2 講義 配布物」のようにデータの区分を表すタグとして追加した語である。これらの語は,

ワークショップの内容を分析する際には除外しなければならない。そこで,これらの分析に 適さない語を「force-ignore01.txt」としてまとめ,作成したファイルを「分析に使用する語 の取捨選択」の「使用しない語の指定」に登録することで,これ以降の分析から除外した。

分析に使用しない語のリストの一部を,表6.5 に示す。分析に使用しない語のリストの全体 は,付録A に示す。

表6.5 分析に使用しない語のリストの一部 口頭説明 スライド番号 スライド する

ある なる いる 2 講義 配布物

ここまでの作業を行った後,再度KH Coderで前処理を行ったところ,1,412種類,6,339 語,H1タグ5件,H2タグ13件,H3タグ179件が分析対象として抽出された。

6.4.3 頻出語,特徴語の抽出

教材データの中で,多く用いられていた語を確認した。11回以上出現した上位119種類 をまとめたものを表6.6 として示す。なお,KH Coderは,基本設定ではひらがなのみで構 成される語(システム上は「動詞B」「名詞B」等として,漢字を含む「動詞」「形容詞」等

とは別に分類)を抽出しない。しかし,本研究では,名詞「つながり」や否定助動詞「ない」

など,ひらがなの言葉や助動詞も分析の対象である。そこで,頻出語のリストを作成する

際,KH Coderによって抽出する品詞設定を「すべての語」に変更して処理を行った。

表6.6頻出語のリスト

KH Coderから出力された結果を,筆者がExcelで加工して作成。

表6.6を確認すると,「世界」142回,「SDGs」110回,「目標」75回,「持続」40回,「開 発」36回といった,SDGsの概要を表す語が多く出現していた。次に多く出現しているの は,「プロジェクト」94回,「ゲーム」59回,「カード」56回といったカードゲームに関わる 語である。また,「感じる」33回,「気づく」26回,「振り返る」24回といった学びを深める ために設定した活動に関する語や,「変化」34回,「意識」27回,「必要」23回,「なぜ」21 回といった振り返りの焦点についても多く出現していた。また,ワークショップの目標に関 係する語としては,「活用」30回,「つながる」17回,「可視」11回が確認された。

次に,ワークショップの構成をさらに詳しく調べるため,ワークショップの5場面それぞ

れを特徴づける語を抽出した(表6.7)。抽出にあたっては,Jaccardの類似性測度を用い,

この値が大きい順に10語を選択した。なお,単語w と場面X のJaccardの類似性測度は,

式(2.1)で求められる数値である。KH Coderから場面を特徴づける語を抽出する手順と設

定は,付録Bに示す。

表6.7 ワークショップの各場面を特徴づける語

KH Coder から出力された結果を,筆者がExcelで加工して作成。数値は式

(2.1)で求められるJaccardの類似性測度を表す。

まず「1 事前」場面においては,「ワークショップ」「研究」の語が上位に挙がっている。ま た,学習者に依頼する「アンケート」も頻出しており,本ワークショップが研究の一環であ ること,授業参加者にはアンケート形式の調査への協力を説明していることが読み取れる。

関連したドキュメント