PDFファイル 1E5OS23b オーガナイズドセッション「OS23 認知科学に基づくヒューマンエージェントインタラクションの工学的デザイン」

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

invisible

迷路

を用い

人

学習過程

可視化

的学習

支援

Visualizing mental learning processes with invisible mazes for assisting continuous learning

山口

智浩

*1

竹森

孝樹

*1

高玉

圭樹

*2

Tomohiro Yamaguchi and Kouki Takemori Keiki Takadama

*1

奈良

業高等専門学校

*2

電気通信大学

Nara National College of Technology The University of Electro-Communications

This paper reports our learning support system for a human learner to visualize his/her mental learning processes with invisible mazes for continuous learning. The objective of this research is to bring the learning ability of the learning agent close to that of a human. To fill in the missing piece of reinforcement learning whose learning process is mainly behavior change, we add two mental learning processes, awareness as pre-learning process and reflection as post-learning process. To observe mental learning processes of a hu-man, we propose a new method for visualizing mental learning processes with invisible mazes consisting of invisible walls which are perceived as a sign that is the number of walls in the neighborhood.

1. め

本論文強化学習枠組を拡張人学習

ン共通的学習過程設計[Yamaguchi 2014]

い述強化学習を拡張学習前後過程

気 , 振返 2 心的過程を追的学習

を通両者を可視化迷路 invisible 壁

遭遇回避行動有無気過程を可視化次

invisible 壁気配気を記述 meta-action

振返過程を可視化実験結果的学習

解発見数振返強い負相関を持解発見数

位者ほ効率く振返を行いこ示唆さ

2. 的

学習過程モ

ル

本節的学習[Sessa 2006][Smita 2012][Yamaguchi

2013] 気 , 振返理論的背景い述

2.1 的学習強化学習比較

Fig.1 人間的学習学習agent 強化学習学習

過程比較を示 Fig.1(a) Buckler 提案さ的改善を学習過程 [Buckler 1996] あ

主特徴各過程状終いこあ

各過程心的過程あア化さいい

一方 Fig.1(b) 学習agent 強化学習過程を示学

習過程全体 Fig.1(a) 異直線状始終わあ

Fig. 1: A comparison of learning processes

理既強化学習目的人間設計者え

学習目標対最適解発見あ次各過

程を両者比較 Fig.1(a) 2) understanding, 4)

enactment Fig.1(b) 2) 4-1), 4-2) 過程相当

Fig.1(a) 過程1), 3), 5) Fig.1(b) いこ学習

やアを変更学習的役割を持

的学習本質的過程あう 3) commitment 過程標準

強化学習ア含設計者学習目標を設

定 Fig.1(a) 1) awareness, 5) reflection 過程い

次節説明

2.2 学習過程おけ気き振返

本節的学習過程け本質的過程あ気

振返 [Kravcik 2013] い述気

(Awareness) 振返 (Reflection) 共通将来改善

情報学習者経験注目こあ両者

い気知覚関連振返行動(行知覚

行 ) 関係こあ

(1) 学習前過程気き(Awareness)

学習関気 [Marton 1997][Reinhardt 2011]

様々意味あ本研究気定義を近い将来状

況予測関知覚 [Kurapati 2012] 学習前過程い気行動変更(behavior change) けいう

要役割あこ々気体的意味を将

来失敗間区困難完全知覚を区

必要性理論的述区困難知覚

完全知覚状態[Kaelbling 1998] 生仮定

(2) 学習後過程振返 (Reflection)

学習関振返 [Boud 1985] 様々意味あ本

研究振返定義を将来行動をく経験意

識的再評価 [Krogstie 2012] 学習後過程い

振返行動変更や学習結果何意味創造い

う要役割あこ々振返体的意味を

学習者を将来失敗くく規則習慣向け

説明解釈生

3. 迷路モ

ル

よ

的

学習過程

設計

本節学習環境的学習設計概念

連絡先：山口智浩奈良業高等専門学校情報学科

〒639-1080 大和郡山矢 22

[email protected]

(2)

- 2 - [Yamaguchi 2014][山口 2014] い述本研究

Fig.1 的学習過程化学習環境を一

目標地迷路を構壁 invisible あ迷路定式化[Yamaguchi 2013] 的学習

迷路をくく歩く迷路巡回学習者

当初気い様々学習目標を発見う設計

3.1 的学習過程流

Fig.2 本論文提案的学習過程流を示こ

過程イ [Yamaguchi 2014] 構さ側イを trial 呼ぶ trial 開始状態目標状態

遭遇迷路巡回条件を満場合他失敗

壁呼ば障害遭遇失敗移系列定義

さこイ線 mental processes 外部観測困難心的過程 Fig.1(a) 1) 5) 各過程

相当学習者失敗 action

気 (awareness)を含心的過程を繰返

中間イをachievement 呼ぶ achievement 迷路巡回(maze sweeping) 学習定義さこイ

学習者壁や目標遭遇 trial終了時 reflection

trialを振返後進行中 trial 未場合

開始状態移を再開(restart) trial 場合 achievementを終了外側イ的学習イあ進行中 achievementを give

up 学習者次 achievement 挑戦

Fig. 2: The flow of the continuous learning process

3.2 invisible迷路モルよ学習環境設計

人学習者学習環境設計開始状態

目標状態至格子迷路 [Yamaguchi 2013]を用い

迷路を用い理試行錯誤過程を通解

筋を見例両者を対応さやい例あ

迷路状態集合壁気配値(sign) 移壁 action

集合 meta-action 5 要素定義さ

Fig.3 2次元格子迷路構を示周壁長方形

あ迷路を単純迷路呼ぶ Fig.3 (a) 開始状態S 目標状

態Gを持 3×2 単純迷路表示イを示迷路

各正方形を状態呼ぶ迷路状態間移

あ状態右 4近傍状態連結(壁 ) 非連結(壁

あ ) 定義さ Fig.3 (b) 有向フ表さ action集

合学習者実行可能右4方向い移動

を表 {up, right, left, down} 4種類 action 定義さ

Fig. 3: The structure of a 3 x 2 simple maze

次 3.1 節述 achievement 行う迷路巡回(maze

sweeping) い述迷路巡回 2次元迷

路固定さ開始状態S 目標状態G い迷路

全状態をう１回訪問 S G 経路解

呼ぶを求定義さ

移動先状態移状態を訪問済但

巡回迷路訪問済状態後戻 (backtrack)

い壁衝突 action 開始状態 S 移 trial を

restart 目標状態G 移時迷路巡回

定を行い未時自動的 restart

3.3 気配値(sign) よ気き過程可視化

本節迷路 invisible 壁在を示唆気配値

を学習者知覚提示壁対衝突回避行動有

無気過程を可視化方法い述

あ状態気配値(sign) [Yamaguchi 2014] 状態

4 近傍け壁数{0,1,2,3,4} 定義さ学習者

invisible 壁を直接知覚い代わ各状態気配値を

invisible 壁在知覚知覚済気配値 trial

終了迷路訪問済状態表示さ Fig.4 invisible

壁構さ単純迷路例を示 Fig.4 (a) 4×4

invisible 単純迷路を示線 trial 中表示さい

invisible 壁位置を表 Fig.4 (b) 移系列例を示

Fig.4 (c) 迷路訪問済状態気配値を示

Fig. 4: An example of a simple maze with invisible walls

3.4 気配値基く不完全知覚状態そ解決

本節 invisible 壁気配値 0以外場合

完全知覚状態あこを述次学習者自身視拡

大気く完全知覚状態解決未知壁予見可

能こを説明

気配値 0 周壁い(完全知覚)状態気配値 1,2,

3 4近傍壁位置特定い完全知覚状態あ

単一完全知覚状態を解決学習者移動

視を拡大近傍状態気配値を知必要あ

invisible 壁を衝突前予見要気学習目

標 Fig.4 示周壁長方形あ単純迷路場合

近傍状態間気配値系列 01 び invisible 壁

位置関係気くこあ次要適特徴

注目視拡大 invisible 壁見えうこあ Fig.4 (c) 単純迷路例 2種気配値{01, 12} 壁{!, #} パン{01!, 12#} 着目未知壁!

び未知角(corner)#を予見周壁形状長方形以

外壁岐や孤立島を持非単純迷路場合

壁配置状況応気配値壁位置規則

性気くこば未知壁予見可能

以未知壁予見学習目標系列を示

subgoal1: invisible 壁を見け位置を特定

subgoal2: 壁周辺気配値注目

(3)

- 3 -

3.5 meta-action よ振返過程可視化

本節 invisible 壁気配気を記述

meta-action 学習者心的学習過程を表振返

過程を可視化方法い述 meta-action

を迷路地図状態置く操作定義さ学習者心

的学習過程を表現要約目的あ

振返緑赤, 青 3種類あ各Trial 最

後行う振返過程を表用いこ

色数区さ緑 1 赤

青 4

trial終了時振返過程振返を迷路地

任意状態置くこ型的使い方緑

目標状態を見け時印を黄色赤

発見壁位置び迷路四隅位置を表場

合あ地印をけ振返あ

achievement 一連 trial 中迷路地表示さ

4. 実験

本章 invisible 迷路系列学習環境

的学習被験者実験[山口2014] い述気

関先行研究[藤本 2004] 答え直接教示間接

教示方学習定着率良いこわいこ知見

を参考教示学習関直接的説明を少く

実験条件を設定主実験目的被験者的

学習長さや振返過程可視化あ被験者実

験を行う操作方法を教示総数や迷路形状

用意色役割使い方等教示いい

4.1 invisible迷路よ的学習タスク設定

(1) 学習環境

被験者的学習長さを見積全 54

迷路系列を用意各単一 invisible迷

路 2 以解を持解総数 54×2=108

個あ系列難易度う前半 8

単純迷路を状態数昇並 9 目以降

非単純迷路を状態数昇配置用い非単純迷路

周壁形状長方形以外を持一形状迷路

後半迷路独立壁を配置い

(2) meta-action よ振返過程可視化

trial終了時振返過程い 3種色緑1,

赤4, 青4 を用意色役割い説明

事後アン各色役割を決決い

場合使い方を調査

(3) 的学習タスク

実験前被験者教示概要を記列挙

 至経路中最大長

経路を解呼ぶ

 解を2 見けこ目的あ

 実験をけくい思えば終了い

 表示さ数隣接壁枚数あ

 迷路中操作方法

 reflection 過程説明ップ操作方法

ここ迷路挑戦を振返気いこを記録

こ中略ップを置くこ

次挑戦備え挑戦時気や注意い場

所を移動ささい Red(4 ), Blue(4

) Green(1 ) 3種類あ以操作方法説明

(4) 測定項目

主測定目被験者挑戦数

挑戦回数壁衝突回数解発見数実験時間

achievement 時間 reflection 時間 reflection 回数あ

reflection 過程被験者作迷路地を像形式

保実験時間構を式(1) 示

実験時間＝achievement時間 reflection時間 (1)

(5) 的学習タスク仮説

 reflection時間長い程的学習長く

4.2 実験結果

18才 22才前後高専男子学生8 を被験者 4.1

節説明一条件を用い学習実験を行実験謝

礼的学習影響をえいう実験時間

関係く安価菓子うい棒 1 本以実験結

果概要を述

 的学習長さ

(1) 実験時間：最短被験者 48 間実験を行残

7/8 被験者 60 以 (60～105 間)実験を

(2) 挑戦率解発見率：6/8 被験者半数以

(30～50 ) 挑戦半数以 (60～

100個) 解を発見

 的学習け実験時間析

(3) reflection時間長さ解発見数弱い負相関あ

相関係数 -0.28

(4) achievement時間解発見数強い正相関あ

相関係数0.94

(5) 壁衝突回数解発見数強い正相関あ

相関係数0.88

実験結果(1)(2) 大半被験者実験 60 以

組半数以解を発見結果的 invisible 迷路

学習性貢献考え

こ対実験結果(3) 著者予想外あ

事後アン回答び実験状況析解発見数

位 2 No.8,6 被験者主序盤

reflection 時間長く中盤以降一部

reflection 時間を使いこわ一方解発見数最

No.7: 16 解20個を発見被験者 reflection

時間 73 間 8 中2番目長いこ解発見数

reflection時間くreflection 質依こ予

想さ reflection 質を評価指標 reflection

を式(2) 定義析を行

reflection ＝reflection時間解発見数 (2)

Table 1 reflection を含実験結果を示相関

析結果 reflection 解発見数強い負相関相関係数 -0.78 壁衝突回数中程度負相関あ相関係数 -0.68 今回的学習い

解発見数位被験者解発見数位被験者比

要領くreflectionを行い reflection 壁衝

突を許容壁衝突回数大こ多く解を発見

(4)

- 4 - Table 1 Experimental results

4.3 議論

(1) reflectionコス意味上達支援

reflection 意味使い方い議論 reflection

を振返キ度

楽解けういくえ多く

解を発見的学習長くこ予想さ

今後課題学習中 reflection 逐次的算を予定いこ reflection 大い被験

者を学習早期発見振返キ初級者択的

支援一方 reflection さい被験者対

級者位置け難易度調整び後述新

学習目標設定を検討

(2) 振返スキル個人差基く対話的上達支援へ向け

reflection 個人差要因有効使い方い議

論 reflection 大い位被験者配

置数多く配置規則一貫性弱い傾向あ対

reflection さい位被験者 reflection map

を置頭中け迷路を解いい

中盤以降多い reflection けく

使用数や置方を行動観察法[松波 2013] 析

振返キ度を精度良く見積期待さ一

方今回実験学習環境び学習系列け振

返キ個人差を吸収いこ予想さ

こ振返キ個人差基く適応的支援

び対話的支援以目を検討予定あ

振返キ個人差基く級者初級者類

振返キ応気配値提示適応的支援

級者初級者ペア振返キ対話的支援

行動観察法 reflection過程キ析細化

5. 結論

本論文強化学習枠組気 , 振返 2

心的過程を追イ構さ的学習

過程を提案 invisible迷路を用い気可

視化振返可視化を実現 invisible 迷路系列を用い

的学習被験者実験結果析的学

習長さを見積解発見数振返強い負

相関を持解発見数位者ほ要領く振返を行い

こ示唆さ

今後課題的学習条件を明比較

条件検討 reflection 基く学習中振返

キ度ンイン見積実装検証振返キ

個人差基く適応的対話的支援検討あ

謝辞

本研究 JSPS科研費 23500197 助をけ

参考文献

[Boud 1985] Boud, D., Keogh, R., and Walker, D. “Reflection: Turning Experience into Learning”, Routledge (1985) [Buckler 1996] Buckler, B. “A learning process model to achieve

continuous improvement”, The Learning Organization, Vol.

3, No. 3, pp.31-39, MCB University Press (1996)

[藤本 2004] 藤本武司, 砂山渡, 山口智浩, 谷正彦: 視

線行動可視化着眼キ伝支援 , 人知能学

会論文誌, Vol. 19, No. 3, pp.174-183 (2004)

[Kaelbling 1998] Kaelbling, L.P., Littman, M.L. and Cassandra, A.R. “Planning and acting in partially observable stochastic

domains”, Artiﬁcial Intelligence, Vol.101, pp.99-134,

Elsevier (1998)

[Kravcik 2013] Kravcik, M., et al.(Eds.), Proceedings of the 3rd Workshop on Awareness and Reflection in Technology Enhanced Learning (ARTEL2013), http://ceur-ws.org/Vol-1103/ (2013)

[Krogstie 2012] Krogstie, B., Prilla, M. “Tool support for reflection in the workplace in the context of reflective learning cycles”, Proceedings of the 2nd Workshop on Awareness and Reflection in Technology-Enhanced Learning (ARTEL 2012), pp.57-72, http://ceur-ws.org/Vol-931/ (2012) [Kurapati 2012] Kurapati, S., et al. “A Theoretical Framework for Shared Situational Awareness in Sociotechnical Systems”, Proceedings of the 2nd Workshop on Awareness and Reflection in Technology-Enhanced Learning (ARTEL 2012), pp.47-53, http://ceur-ws.org/Vol-931/ (2012)

[Marton 1997] Marton, F. and Booth, S. “Learning and Awareness”, Routledge (1997)

[松波 2013] 松波晴人行動観察基本イヤン社

(2013)

[Reinhardt 2011] Reinhardt, W. and Christian, M. “Awareness in

Learning Networks”, Proceedings of the The PLE

Conference 2011 (ARTEL2011), pp.12-20 (2011)

[Sessa 2006] Sessa, V. I., and London, M. “Continuous Learning in Organizations: Individual, Group, and Organizational Perspectives”, Psychology Press (2006)

[Smita 2012] Smita, J., and Trey, M. “Facilitating continuous learning: re-view of research on individual learning capabilities and organizational learning environments”, the annual meeting of the AECT International Convention, Louisville (2012)

[Yamaguchi 2013] Yamaguchi, T., Takemori, K. and Takadama, K. "Modeling a human's learning processes toward continuous learning support system", in Interdisciplinary Mechatronics, M. K. Habib, J. Paulo Davim, (eds.), pp.69-94, Wiley-ISTE (2013)

[Yamaguchi 2014] Yamaguchi, T., Takemori, K., Takadama, K.

“Visualizing mental learning processes with invisible mazes

for continuous learning”, Proceedings of 16th International Conference, HCI International 2014, June, (2014) to appear [山口2014] 山口智浩, 竹森孝樹, 高玉圭樹: Invisible 迷

路を用い人学習過程可視化計測自動制御

PDFファイル 1E5OS23b オーガナイズドセッション「OS23 認知科学に基づくヒューマンエージェントインタラクションの工学的デザイン 」

invisible

迷路

を用い

人

学習過程

可視化

的学習

支援

Visualizing mental learning processes with invisible mazes for assisting continuous learning

山口

智浩

竹森

孝樹

高玉

圭樹

奈良

業高等専門学校

電気通信大学

1.

め

2.

的

学習過程モ

ル

3.

迷路モ

ル

よ

的

学習過程

設計

4.

実験

5.

結論

PDFファイル 1E5OS23b オーガナイズドセッション「OS23 認知科学に基づくヒューマンエージェントインタラクションの工学的デザイン」