• 検索結果がありません。

PDFファイル 1E5OS23b オーガナイズドセッション「OS23 認知科学に基づくヒューマンエージェントインタラクションの工学的デザイン 」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 1E5OS23b オーガナイズドセッション「OS23 認知科学に基づくヒューマンエージェントインタラクションの工学的デザイン 」"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

invisible

迷路

を用い

学習過程

可視化

的学習

支援

Visualizing mental learning processes with invisible mazes for assisting continuous learning

山口

智浩

*1

竹森

孝樹

*1

高玉

圭樹

*2

Tomohiro Yamaguchi and Kouki Takemori Keiki Takadama

*1

奈良

業高等専門学校

*2

電気通信大学

Nara National College of Technology The University of Electro-Communications

This paper reports our learning support system for a human learner to visualize his/her mental learning processes with invisible mazes for continuous learning. The objective of this research is to bring the learning ability of the learning agent close to that of a human. To fill in the missing piece of reinforcement learning whose learning process is mainly behavior change, we add two mental learning processes, awareness as pre-learning process and reflection as post-learning process. To observe mental learning processes of a hu-man, we propose a new method for visualizing mental learning processes with invisible mazes consisting of invisible walls which are perceived as a sign that is the number of walls in the neighborhood.

1.

本論文 強化学習 枠組 を拡張 人 学習

ン 共通 的 学 習過 程 設 計[Yamaguchi 2014]

い 述 強化学習を拡 張 学習前後 過程

気 , 振 返 2 心的過程を追 的学習

を通 両者 を可 視化 迷 路 invisible 壁

遭遇 回避行動 有無 気 過程を可視化 次

invisible 壁 気配 気 を記述 meta-action

振 返 過 程 を可 視 化 実 験 結果 的 学 習

解発見数 振 返 強い負 相関を持 解発見数

位者ほ 効率 く振 返 を行 い こ 示唆さ

2.

学習過程モ

本 節 的 学 習[Sessa 2006][Smita 2012][Yamaguchi

2013] 気 , 振 返 理論的背景 い 述

2.1 的学習 強化学習 比較

Fig.1 人間 的学習 学習agent 強化学習 学習

過程 比較を示 Fig.1(a) Buckler 提案さ 的改善を 学習過程 [Buckler 1996] あ

主 特徴 各過程 状 終 いこ あ

各過程 心的過程 あ ア 化さ い い

一方 Fig.1(b) 学習agent 強化学習過程を示 学

習過程全体 Fig.1(a) 異 直線状 始 終わ あ

Fig. 1: A comparison of learning processes

理 既 強化学習 目的 人間 設計者 え

学習目標 対 最適解 発見 あ 次 各過

程 を 両 者 比 較 Fig.1(a) 2) understanding, 4)

enactment Fig.1(b) 2) 4-1), 4-2) 過程 相当

Fig.1(a) 過程1), 3), 5) Fig.1(b) い こ 学習

や ア を変 更 学 習 的 役 割 を持

的学習 本質的過程 あ う 3) commitment 過程 標準

強化学習ア 含 設計者 学習目標を設

定 Fig.1(a) 1) awareness, 5) reflection 過程 い

次節 説明

2.2 学習過程 おけ 気 き 振 返

本 節 的 学習 過程 け 本 質 的 過程 あ 気

振 返 [Kravcik 2013] い 述 気

(Awareness) 振 返 (Reflection) 共通 将来 改善

情 報 学 習者 経 験 注 目 こ あ 両 者

い 気 知覚 関連 振 返 行動(行 知覚

行 ) 関係 こ あ

(1) 学習前過程 気 き(Awareness)

学 習 関 気 [Marton 1997][Reinhardt 2011]

様々 意味 あ 本研究 気 定義を 近い将来 状

況 予 測 関 知覚 [Kurapati 2012] 学習 前過 程 い 気 行動変更(behavior change) け いう

要 役 割 あ こ 々 気 体 的 意 味 を 将

来 失 敗 間 区 困 難 完 全 知覚 を区

必 要 性 理 論 的 述 区 困 難 知 覚

完全知覚状態[Kaelbling 1998] 生 仮定

(2) 学習後過程 振 返 (Reflection)

学習 関 振 返 [Boud 1985] 様々 意味 あ 本

研 究 振 返 定義 を 将来 行 動を く 経 験 意

識 的 再 評 価 [Krogstie 2012] 学 習 後 過 程 い

振 返 行動変更や学習結果 何 意味 創造 い

う 要 役割 あ こ 々 振 返 体的 意味を

学 習 者を将 来 失敗 く く規 則 習 慣 向 け

説明 解釈 生

3.

迷路モ

学習過程

設計

本節 学習環境 的学習 設計概念

連絡先:山口智浩 奈良 業高等専門学校情報 学科

〒639-1080 大和郡山 矢 22

[email protected]

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 - [Yamaguchi 2014][山 口 2014] い 述 本 研 究

Fig.1 的学習過程 化 学習環境を一

目標地 迷路を構 壁 invisible あ 迷路 定式化[Yamaguchi 2013] 的学習

迷路 をく く歩く迷路 巡回 学 習者

当初 気 い様々 学習目標を発見 う設計

3.1 的学習過程 流

Fig.2 本論文 提案 的学習過程 流 を示 こ

過程 イ [Yamaguchi 2014] 構 さ 側 イ を trial 呼ぶ trial 開始状態 目標状態

遭遇 迷路巡回 条件を満 場合 他 失敗

壁 呼 ば 障 害 遭 遇 失 敗 移 系 列 定 義

さ こ イ 線 mental processes 外部 観測困難 心的過程 Fig.1(a) 1) 5) 各過程

相当 学習者 失敗 action

気 (awareness)を含 心的過程を繰 返

中間 イ をachievement 呼ぶ achievement 迷路 巡 回(maze sweeping) 学 習 定 義 さ こ イ

学習者 壁や目標 遭遇 trial終了時 reflection

trialを振 返 後 進行中 trial 未 場合

開始状態 移 を再開(restart) trial 場合 achievementを終了 外側 イ 的 学習 イ あ 進行中 achievementを give

up 学習者 次 achievement 挑戦

Fig. 2: The flow of the continuous learning process

3.2 invisible迷路モ ル よ 学習環境 設計

人 学 習 者 学 習 環 境 設 計 開 始 状 態

目 標 状 態 至 格 子 迷 路 [Yamaguchi 2013]を用 い

迷 路 を用 い 理 試 行 錯 誤 過 程 を通 解

筋 を見 例 両 者 を対 応 さ や い例 あ

迷 路 状 態 集 合 壁 気 配 値(sign) 移 壁 action

集合 meta-action 5 要素 定義さ

Fig.3 2次元格子迷路 構 を示 周 壁 長方形

あ 迷路を単純迷路 呼ぶ Fig.3 (a) 開始状態S 目標状

態Gを持 3×2 単純迷路 表示イ を示 迷路

各 正 方 形 を状 態 呼 ぶ 迷路 状 態 間 移

あ 状態 右 4近傍 状態 連結(壁 ) 非連結(壁

あ ) 定義さ Fig.3 (b) 有向 フ 表さ action集

合 学習者 実行可能 右4方向い 移動

を表 {up, right, left, down} 4種類 action 定義さ

Fig. 3: The structure of a 3 x 2 simple maze

次 3.1 節 述 achievement 行 う 迷 路 巡 回(maze

sweeping) い 述 迷 路 巡 回 2次 元 迷

路 固定さ 開始状態S 目標状態G い 迷路

全状態を う 1回 訪問 S G 経路 解

呼ぶ を求 定義さ

移 動 先 状 態 移 状 態 を訪問 済 但

巡回 迷路訪問済状態 後戻 (backtrack)

い 壁 衝 突 action 開始 状 態 S 移 trial を

restart 目標状態G 移時 迷路巡回

定を行い 未 時 自動的 restart

3.3 気配値(sign) よ 気 き過程 可視化

本節 迷路 invisible 壁 在を示唆 気配値

を学習者 知覚 提 示 壁 対 衝 突 回避行 動 有

無 気 過程を可視化 方法 い 述

あ 状態 気配値(sign) [Yamaguchi 2014] 状態

4 近 傍 け 壁 数{0,1,2,3,4} 定 義 さ 学 習 者

invisible 壁を直接知覚 い代わ 各状態 気配値を

invisible 壁 在 知 覚 知 覚 済 気 配 値 trial

終了 迷路 訪問済状態 表示さ Fig.4 invisible

壁 構 さ 単 純 迷 路 例 を 示 Fig.4 (a) 4×4

invisible 単 純 迷 路 を 示 線 trial 中 表 示 さ い

invisible 壁 位置を表 Fig.4 (b) 移系列 例を示

Fig.4 (c) 迷路 訪問済 状態 気配値 を示

Fig. 4: An example of a simple maze with invisible walls

3.4 気配値 基 く不完全知覚状態 そ 解決

本節 invisible 壁 気配値 0以外 場合

完 全 知 覚 状 態 あ こ を述 次 学 習 者 自 身 視 拡

大 気 く 完 全 知 覚 状 態 解 決 未 知 壁 予 見 可

能 こ を説明

気配値 0 周 壁 い(完全知覚)状態 気配値 1,2,

3 4近傍 壁 位置 特定 い 完全知覚状態 あ

単 一 完 全 知 覚 状 態 を解 決 学 習 者 移 動

視 を 拡 大 近 傍 状 態 気 配 値 を 知 必 要 あ

invisible 壁を衝突前 予見 要 気 学習目

標 Fig.4 示 周 壁 長方形 あ 単純迷路 場合

近傍状態間 気配値系列 01 び invisible 壁

位置関係 気 くこ あ 次 要 適 特徴

注目 視 拡大 invisible 壁 見え う こ あ Fig.4 (c) 単純迷路 例 2種 気配値{01, 12} 壁{!, #} パ ン{01!, 12#} 着目 未知壁!

び 未 知 角(corner)#を予 見 周 壁 形 状 長 方 形 以

外 壁 岐 や孤 立 島 を持 非単 純迷 路 場合

壁 配 置 状 況 応 気 配 値 壁 位 置 規 則

性 気 くこ ば 未知壁 予見 可能

以 未知壁 予見 学習目標系列を示

subgoal1: invisible 壁を見 け 位置を特定

subgoal2: 壁周辺 気配値 注目

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 -

3.5 meta-action よ 振 返 過程 可視化

本 節 invisible 壁 気 配 気 を 記 述

meta-action 学習者 心的学習過程を表 振 返

過程を可視化 方法 い 述 meta-action

を迷路地図 状態 置く操作 定義さ 学習者 心

的学習過程を表現 要約 目的 あ

振 返 緑 赤, 青 3種類あ 各Trial 最

後 行う振 返 過程を表 用い こ

色 数 区 さ 緑 1 赤

青 4

trial終了時 振 返 過程 振 返 を 迷路 地

任 意 状 態 置 くこ 型 的 使 い方 緑

目 標 状 態 を見 け 時 印 を 黄 色 赤

発見 壁 位置 び迷路 四隅 位置を表 場

合 あ 地 印 を け 振 返 あ

achievement 一連 trial 中 迷路地 表示さ

4.

実験

本 章 invisible 迷 路 系 列 学 習 環境

的学習 被験者実験[山口2014] い 述 気

関 先 行 研 究[藤 本 2004] 答 え 直 接 教 示 間 接

教示 方 学習 定着率 良 いこ わ い こ 知見

を参 考 教示 学習 関 直接 的 説明 を少 く

実験条件を設定 主 実験目的 被験者 的

学習 長さや振 返 過程 可視化 あ 被験者 実

験を行う 操 作方法を教 示 総数や迷路形状

用意 色 役割 使い方等 教示 い い

4.1 invisible迷路 よ 的学習タスク設定

(1) 学習環境

被験者 的学習 長さを見積 全 54

迷路系列を用意 各 単一 invisible迷

路 2 以 解を持 解 総数 54×2=108

個 あ 系列 難易度 う 前半 8

単 純迷路 を状態数 昇 並 9 目 以降

非単純迷路を状態数 昇 配置 用い 非単純迷路

周 壁形状 長方形以外 を持 一形状 迷路

後半 迷路 独立 壁を配置 い

(2) meta-action よ 振 返 過程 可視化

trial終了時 振 返 過程 い 3種 色 緑1,

赤4, 青4 を用意 色 役割 い 説明

事後アン 各色 役割を決 決 い

場合 使い方を調査

(3) 的学習タスク

実験前 被験者 教示 概要を 記 列挙

 至 経 路 中 最 大 長

経路 を解 呼ぶ

 解を2 見 け こ 目的 あ

 実験を け く い 思えば終了 い

 表示さ 数 隣接 壁 枚数 あ

 迷路中 操作方法

 reflection 過程 説明 ップ 操作方法

こ こ 迷 路 挑 戦 を振 返 気 い こ を記 録

こ 中略 ップ を置くこ

次 挑 戦 備 え 挑 戦 時 気 や 注 意 い場

所 を移動さ さい Red(4 ), Blue(4

) Green(1 ) 3種類 あ 以 操作方法 説明

(4) 測定項目

主 測定 目 被験者 挑戦 数

挑 戦 回 数 壁 衝 突 回 数 解 発 見 数 実 験 時 間

achievement 時 間 reflection 時 間 reflection 回 数 あ

reflection 過程 被験者 作 迷路地 を 像形式

保 実験時間 構 を式(1) 示

実験時間=achievement時間 reflection時間 (1)

(5) 的学習タスク 仮説

 reflection時間 長い程 的学習 長く

4.2 実験結果

18才 22才前後 高専男子学生8 を被験者 4.1

節 説 明 一 条 件 を用 い 学 習 実 験 を行 実 験 謝

礼 的 学 習 影 響を え い う 実 験 時 間

関係 く 安価 菓子 う い棒 1 本 以 実験結

果 概要を述

 的学習 長さ

(1) 実験時間:最短 被験者 48 間実験を行 残

7/8 被験者 60 以 (60~105 間)実験を

(2) 挑戦 率 解発見率:6/8 被験者 半数以

(30~50 ) 挑戦 半数以 (60~

100個) 解を発見

 的学習 け 実験時間 析

(3) reflection時間 長さ 解発見数 弱い負 相関 あ

相関係数 -0.28

(4) achievement時間 解発見数 強い正 相関 あ

相関係数0.94

(5) 壁 衝突回数 解発見数 強い正 相関 あ

相関係数0.88

実験結果(1)(2) 大半 被験者 実験 60 以

組 半 数 以 解を発 見 結果 的 invisible 迷 路

学習 性 貢献 考え

こ 対 実 験 結果(3) 著者 予想 外 あ

事 後 ア ン 回 答 び 実 験 状 況 析 解 発 見 数

位 2 No.8,6 被 験 者 主 序 盤

reflection 時 間 長 く 中 盤 以 降 一 部

reflection 時間を使 い こ わ 一方 解発見数最

No.7: 16 解20個を発見 被験者 reflection

時間 73 間 8 中2番目 長い こ 解発見数

reflection時間 くreflection 質 依 こ 予

想さ reflection 質を評価 指標 reflection

を式(2) 定義 析を行

reflection =reflection時間 解発見数 (2)

Table 1 reflection を含 実験結果を示 相関

析 結果 reflection 解 発見数 強い負 相関 相関係数 -0.78 壁 衝突回数 中程度 負 相関 あ 相関係数 -0.68 今回 的学習 い

解発見 数 位 被験者 解発見 数 位 被 験者 比

要領 くreflectionを行い reflection 壁 衝

突 を許 容 壁 衝 突 回 数 大 こ 多 く 解 を発 見

(4)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 4 - Table 1 Experimental results

4.3 議論

(1) reflectionコス 意味 上達支援

reflection 意味 使い方 い 議論 reflection

を振 返 キ 度

楽 解け う いく え 多く

解を発見 的学習 長く こ 予想さ

今後 課題 学習 中 reflection 逐次的 算 を予 定 い こ reflection 大 い被験

者 を学 習 早 期 発 見 振 返 キ 初 級 者 択 的

支 援 一 方 reflection さ い 被 験 者 対

級者 位置 け 難易度調 整 び後 述 新

学習目標 設定を検討

(2) 振 返 スキル 個人差 基 く対話的上達支援へ向け

reflection 個 人 差 要 因 有 効 使 い方 い 議

論 reflection 大 い 位被験者 配

置 数 多 く 配 置 規 則 一 貫 性 弱 い傾 向 あ 対

reflection さい 位被験者 reflection map

を置 頭 中 け 迷路 を解い い

中盤以 降多 い reflection け く

使用 数や 置 方 を行 動観 察法[松波 2013] 析

振 返 キ 度を精度 良く見積 期待さ 一

方 今回実験 学習環境 び学習 系列 け 振

返 キ 個人差を吸収 い こ 予想さ

こ 振 返 キ 個人差 基 く適応的 支援

び対話的 支援 以 目を検討予定 あ

振 返 キ 個人差 基 く 級者 初級者 類

振 返 キ 応 気配値提示 適応的 支援

級者初級者ペア 振 返 キ 対話的 支援

行動観察法 reflection過程 キ 析 細 化

5.

結論

本論文 強化学習 枠組 気 , 振 返 2

心 的 過 程 を追 イ 構 さ 的 学 習

過程 を提 案 invisible迷路 を用い 気 可

視 化 振 返 可 視化 を実 現 invisible 迷 路系 列 を用 い

的 学 習 被 験 者 実 験 結 果 析 的 学

習 長 さ を見 積 解 発 見 数 振 返 強 い負

相関を持 解発見数 位者ほ 要領 く振 返 を行 い

こ 示唆さ

今 後 課 題 的 学 習 条件 を明 比 較

条件 検討 reflection 基 く学習 中 振 返

キ 度 ン イン見 積 実装 検 証 振 返 キ

個人差 基 く適応的 対話的 支援 検討 あ

謝辞

本研究 JSPS科研費 23500197 助 を け

参考文献

[Boud 1985] Boud, D., Keogh, R., and Walker, D. “Reflection: Turning Experience into Learning”, Routledge (1985) [Buckler 1996] Buckler, B. “A learning process model to achieve

continuous improvement”, The Learning Organization, Vol.

3, No. 3, pp.31-39, MCB University Press (1996)

[藤本 2004] 藤本武司, 砂山渡, 山口智浩, 谷 正彦: 視

線行動 可視 化 着眼 キ 伝 支援 , 人 知能学

会論文誌, Vol. 19, No. 3, pp.174-183 (2004)

[Kaelbling 1998] Kaelbling, L.P., Littman, M.L. and Cassandra, A.R. “Planning and acting in partially observable stochastic

domains”, Artificial Intelligence, Vol.101, pp.99-134,

Elsevier (1998)

[Kravcik 2013] Kravcik, M., et al.(Eds.), Proceedings of the 3rd Workshop on Awareness and Reflection in Technology Enhanced Learning (ARTEL2013), http://ceur-ws.org/Vol-1103/ (2013)

[Krogstie 2012] Krogstie, B., Prilla, M. “Tool support for reflection in the workplace in the context of reflective learning cycles”, Proceedings of the 2nd Workshop on Awareness and Reflection in Technology-Enhanced Learning (ARTEL 2012), pp.57-72, http://ceur-ws.org/Vol-931/ (2012) [Kurapati 2012] Kurapati, S., et al. “A Theoretical Framework for Shared Situational Awareness in Sociotechnical Systems”, Proceedings of the 2nd Workshop on Awareness and Reflection in Technology-Enhanced Learning (ARTEL 2012), pp.47-53, http://ceur-ws.org/Vol-931/ (2012)

[Marton 1997] Marton, F. and Booth, S. “Learning and Awareness”, Routledge (1997)

[松波 2013] 松 波 晴人 行 動観 察 基 本 イヤ ン 社

(2013)

[Reinhardt 2011] Reinhardt, W. and Christian, M. “Awareness in

Learning Networks”, Proceedings of the The PLE

Conference 2011 (ARTEL2011), pp.12-20 (2011)

[Sessa 2006] Sessa, V. I., and London, M. “Continuous Learning in Organizations: Individual, Group, and Organizational Perspectives”, Psychology Press (2006)

[Smita 2012] Smita, J., and Trey, M. “Facilitating continuous learning: re-view of research on individual learning capabilities and organizational learning environments”, the annual meeting of the AECT International Convention, Louisville (2012)

[Yamaguchi 2013] Yamaguchi, T., Takemori, K. and Takadama, K. "Modeling a human's learning processes toward continuous learning support system", in Interdisciplinary Mechatronics, M. K. Habib, J. Paulo Davim, (eds.), pp.69-94, Wiley-ISTE (2013)

[Yamaguchi 2014] Yamaguchi, T., Takemori, K., Takadama, K.

“Visualizing mental learning processes with invisible mazes

for continuous learning”, Proceedings of 16th International Conference, HCI International 2014, June, (2014) to appear [山口2014] 山口智浩, 竹森孝樹, 高玉圭樹: Invisible 迷

路 を用 い 人 学 習 過 程 可 視 化 計 測自 動 制 御

Fig. 1: A comparison of learning processes
Fig. 3: The structure of a 3 x 2 simple maze
Table 1 Experimental results

参照

関連したドキュメント

This is a typical behavior for processes comprising both jump and diffusion part, and for general open sets one cannot expect a scale-invariant result: the boundary Harnack

Using limit theorems for large deviations for processes with and without immigration limit theorems for the index of the first process exceeding some fixed or increasing levels

We consider the new class of the Markov measure-valued stochastic processes with constant mass.. We give the construction of such processes with the family of the probabilities

In Section 6 various semigroups associated with above mentioned unitary processes are studied and using them a Hilbert space, called noise space and structure maps are constructed

In the carrier-borne epidemic process, as outlined in Weiss (1965) and Daley & Gani (1999), infection spreads through contact between an infectious carrier and a suscep- tible..

Amount of Remuneration, etc. The Company does not pay to Directors who concurrently serve as Executive Officer the remuneration paid to Directors. Therefore, “Number of Persons”

The purpose of this practical training course is for students, after learning the significance of the social work practicum in mental health, to understand the placement sites

The course aims to help students develop an interest in topics about the mental and physical development and learning process of preschoolers, elementary school children and