しりとり課題を通した個人の語彙のモデル化
Personalized Modeling of Lexicon through Shiritori Game
西川純平
1*森田純哉
1Jumpei Nishikawa
1, Junya Morita
1 1静岡大学情報学部
1
Faculty of Informatics, Shizuoka University
Abstract: Shiritori is a popular Japanese word game for young children. The performance of this game is influenced by factors leading language acquisition such as phoneme segmentations, correspondence to phonemes to symbols, and access to a large-sized lexical knowledge base. We consider that this game is especially useful for supporting atypical language acquisition, like acquiring a second language, training for aphasia and autism people. In this research, we present a support system for lexicon acquisition utilizing shiritori, and construct a computational model representing the above factors with the ACT-R cognitive architecture. The model has vocabulary knowledge, limited working memory capacity, and rules extracting phonemes from words. As a result of the simulation with a prototype model, some cognitive process influencing the performance of shiritori became clear. In the future, by improving the model, we will construct a system that monitors vocabulary acquisitions process for individual users through the interaction with the model.
.
1. はじめに
言語の獲得支援に関わる研究の需要が高まってい る.一つの背景は,国際化と情報化の進展である. 第一言語の異なる人同士の共同作業の機会が増加し, 第二言語の利用が要求されるようになってきた.別 の背景は,言語の利用が困難となる脳機能障害への 注目である.人間の認知機能に関わる研究の進展に より,後天的な要因による失語症だけでなく,自閉 症などの先天性の障害についても,その原因や対処 が理解されるようになった. 第二言語の習得,脳機能障害を持つ人による言語 の獲得は,ともに典型的な第一言語の獲得プロセス と多くの点で異なっている.通常,人間は乳幼児期 に,養育者の振る舞いを観察し,その模倣を行うこ とで言語を獲得していく [1].この獲得のプロセス において,乳幼児は,音の分節化のパターン,記号 と対象の対応関係など,膨大なパラメータの値を推 定していく.この調整のプロセスは,共同注視や対 称性バイアスなど,生得的に埋め込まれた認知的制 約に誘導される.それに対して,第二言語の習得や * 連絡先:静岡大学情報学部 〒432-8011 静岡県浜松市中区城北3丁目5‐1 E-mail: [email protected] 脳機能障害者の言語習得においては, 生得的な制約 を有効に活用できない [2].そのため,定型発達の第 一言語話者並みの言語スキルを獲得するために,当 人あるいはチュータによる多大な努力が費やされる ことになる. こういった困難な学習を支援するためには,個人 に応じた学習者モデルが必要である [3].言語獲得 において,どのようなつまずきがどのような原因に よって生じるのか.言語の獲得につまずくといって も,どの程度の語彙を持つのか,語彙の構造はどの ようになっているのか,音節を切り出すことができ ているのか,音節と文字の対応がとれているのかな ど,様々な原因を考えられる.学習支援システムの なかでそれぞれの原因が切り分けられたモデルを参 照することで,適切な介入を実現できる. 上記の背景から,本研究では,言語の獲得に困難 を抱いている個人の語彙をモデル化する方法を提案 する.本研究で提案する方法の特徴は,(1) 言語に関 するインタラクティブなゲームを利用すること,(2) 認知アーキテクチャの知識やパラメータを個人から 受けたフィードバックをもとに推定することにある. 人工知能学会研究会資料 SIG-ALST-B509-11前者のゲームとして,しりとりを扱う.後者の認知 ア ー キ テ ク チ ャ に は ACT-R (Adaptive Control of Thought-Rational [4]) を用いる. 本稿の構成は次の通りである.まず,2 節にて本研 究と関連する研究をレビューする.そののちに,本 研究で提案するシステム,および実装を進めている プロトタイプモデルと予備的なシミュレーションを 示す.最後に現状のまとめと今後の課題を示す.
2.関連研究
2.1 しりとりの利用
しりとりにおいて,参加者は,先行して答えられ た単語の語尾文字を頭文字とする単語を回答する. ゲーム中で既に使われた単語や,特定の語尾文字を もつ単語を回答した場合は負けとなる.この手順は 複数名で行われることが多いが,幼児向けの語彙学 習の教材には,一人でのしりとり遊びを行わせるも のも存在する. しりとりは実装の容易さから,人と相互作用する 様々なエージェントに組み込まれてきた.学術的に は,しりとり課題中の言い淀みや間などを調整する ことで,ユーザによるエージェントの人間らしさの 知覚を増強する研究などが行われている [5, 6]. しりとりを利用することで,学習者の語彙のモデ ルを構築する学習支援システムの研究も行われてい る.山本と柏原によるシステム [7] では,英単語を 用いたしりとりを学習者と対話的に行う.そのなか で,学習者の語彙の状態を推定し,学習者のレベル に応じた支援を行う. 失語症の治療,あるいは自閉症の療育など,言語 聴覚療法においても,しりとりは頻繁に用いられて いる.いくつかの論文の中で,療育中の自閉症児の 検査にしりとりが利用されていることが示されてい る.しりとりを可能にする条件は,定型発達の幼児 を対象とした横断的な調査によって明らかにされて いる [8].音を音素に分割する音韻意識が必要であ ること,心的な語彙辞書に音韻による索引が付与さ れていることが必要であるとされている.さらに, 音韻による語彙への索引付けには,かな文字の獲得 が有効であることを示している. 本研究では,上記のようなしりとりを可能にする 条件を,認知アーキテクチャ上にモデル化すること を狙う.そのようなモデルをシステムに組入れるこ とで,学習者の状態をモニタリングしつつ,困難な 状況における言語の獲得を支援することを目指す.2.2 認知アーキテクチャの利用
認知アーキテクチャとは,個別の課題において生 起する認知プロセスをモデル化する基盤である.認 知アーキテクチャを利用したモデルにより,課題の 達成に要求される種々の要因を切り分けたモデルを 構築できる.様々な認知アーキテクチャが開発され るなかで,本研究ではACT-R [4] を利用したモデル に注目する. ACT-R は,複数のモジュールを持つプロダクショ ンシステムである.モジュールの動作を規定する 様々なパラメータが存在し,個人差のモデル化を容 易にしている.また,外界とのインタラクションを 受け持つモジュールを持ち,反応時間の予測が可能 である.モジュールと脳部位との対応づけによって, fMRI などの生理データとの対応も可能となってい る. ACT-R を用いた言語の獲得に関する研究は多く行 われている.英語の学習における不規則動詞の獲得 に関わるモデル [9],幼児による名詞の学習などの モデル [10] が構築されている.脳機能障害に関わ る検討もなされており,失語症の文理解において生 じるエラーを ACT-R のパラメータによって説明し た研究も存在する [11]. しかし,認知アーキテクチャによるこれまでの研 究において,しりとりを課題とした語彙獲得の研究 は存在しない.2.1 にて述べたように,しりとりは音 韻意識が関与する言語課題である.音声言語だけで なく,文字言語の習得との相関も指摘されている. つまり,しりとりは複数のモダリティが関与する言 語課題である.そのようなモダリティ間のインタラ クションを,ACT-R の保持するモジュール構造が有 効にモデル化する可能性がある.3.提案システム
対象課題となるゲームを行うために,本研究では, 認知モデルと人の相互作用をふくむシステムを構築 する.提案システムの概要を図1 に示す. 図 1 提案システムの概要このシステムは,ACT-R モデルと人が,ブラウザ に表示されたインタフェース,または音声によって しりとりを行う. ブラウザに表示されるこのシステムのユーザイン タフェース (UI) 例を図 2 に示す.この UI では,し りとりが続き回答がなされるたび,右端にその回答 が付け加えられて横方向につながってゆく.また横 方向のスクロールバーにより過去の回答を確認する こともできる.ゲーム参加者の回答と認知モデルの 回答は図形により区別され,入力待ちのテキストボ ックスは色枠によって強調される. このような視覚的なインタフェースに加え,音声 を介したインタフェースを用意する.音声インタフ ェースは,音声合成や音声認識の精度が要求される ため,一般的には困難である.しかし,音韻意識を 獲得させる学習の場面において,入力に意識的な努 力を要求するインタフェースが有効に働く可能性が ある.また,音声インタフェースとひらがな入力を 組み合わせることで,音韻意識の獲得が困難な学習 者への支援が有効に行われる可能性がある. ACT-R モジュール構造と記されている部分は, ACT-R の保持するモジュールを示している.視覚モ ジュールと運動モジュールにより,図2 のインタフ ェースを介したインタラクションが,聴覚モジュー ルと音声モジュールによって,音声インタフェース を介したインタラクションが実現される.各モダリ ティにおける入出力はプロダクションモジュールで 統合され,システム内部のモジュール(ゴールモジ ュール,イマジナルモジュール,宣言的モジュール) とインタラクションをする.内部モジュールのうち, ゴールモジュールとイマジナルモジュールは現在の 課題の状況を短期記憶として保持する.それに対し, 宣言的モジュールは語彙の知識を持ち,またユーザ の語彙モデルを保持する.以下の節にて,既に実装 されたプロトタイプモデルの内部処理を記載する.
4.プロトタイプモデル
4.1 モデルの構成
ACT-R によって構成されるしりとりのプロセスを 検討するため,簡易的なプロトタイプモデルを構築 した.今回のモデルは,実装の容易さから英語によ るしりとりを対象としている.また,ユーザとのイ ンタラクションを設けず,一人でのしりとりのプロ セスを扱っている.モデルは自身の想起した単語か ら,語尾文字を抽出し,それを語頭に持つ単語を想 起し,連結していくことになる.以下にACT-R のモ ジュール構造によって,このプロセスがどのように 実現されるかを示す.4.1.1 宣言的モジュール
ACT-R の宣言的モジュールを用いることで,しり とりの遂行に必要な語彙をモデル化する.ACT-R に おける宣言的モジュールは,チャンクと呼ばれる構 成要素からなる.本研究のモデルが保持するチャン クには,単語の知識(語彙)に関わるものと,文字 の知識に関わるものがある.前者のチャンクとして, 単語の文字列情報を表すtext-inf,単語の知識を表す names,単語の語頭文字の知識 である word-heads,単語の語尾文字の知識である word-tails とい うタイプを用意した.以下,それぞれのタイプに含 まれるチャンクの実例を示す.(name-EGG ISA text-inf text "EGG") (word-EGG ISA word-names
word-name name-EGG) (word-head-EGG ISA word-heads
word-name name-EGG head-char E)
(word-tail-EGG ISA word-tails word-name name-EGG tail-char G) 各チャンクは,先頭にチャンク名が示され,その 後にスロット名と値の組が続く.チャンクのタイプ は,ISA スロットの値によって示され,それぞれが 異なるスロットを持つ.text-inf をタイプとするチャ ンクは,text という名前のスロットを持ち,文字列の
情報 ("EGG") を保持する.word-names は,word-name スロットに,単語が指示する概念的な知識を保 持している.word-heads タイプは, word-name スロ ットに 単語の概念知識,head-char スロットに語頭 図 2 しりとりのユーザインタフェース例
文字の情報を持つ.word-tail チャンクも同様に,単 語の概念的知識と語尾文字を組み合わせる情報を保 持している. 本研究におけるACT-R モデルは,上記のような単 語に関わる知識の他に,文字に関わる知識をチャン クとして持つ.以下に例を示す.
(a ISA alphabets chara a) (b ISA alphabets chara b) …
(z ISA alphabets chara z)
このチャンクは,先に示した単語に関わるチャン クの構成要素となる.つまり,本研究のモデルにお いて,しりとりは文字に関わる知識を習得している ことが前提となっている.このようなモデルの構成 は,2.1 に示したしりとりを可能にする条件と整合的 である [8].
4.1.2 ゴールモジュール
ゴールモジュールは,課題の状態を一時的に保持 する.本モデルでは,ゴールモジュールに保持され る短期記憶は,回答単語を表すスロット(a-word),回 答単語の語頭文字を表すスロット(a-head),回答単語 の語尾文字を表すスロット(a-tail)とモデルの状態を 表すスロット(state)によって構成される.これらのス ロットの値はプロダクションモジュールによって逐 次的に挿入,更新される.4.1.3 プロダクションモジュール
モデルは,単語の情報を受け取ると,しりとりの ルールにのっとって単語を検索し回答する. 図3 は,モデルのルールをボックスで囲み,系列 的に発火するルールを矢印で結んでいる. モデルのプロセスは,回答候補を想起するプロセ ス(図3 の左側の start から check-used まで)と想起 された回答候補をチェックするプロセス(図 3 の check-used から右側のプロセス)に分けられる. 回答候補の想起プロセスにおいて,最初に単語の 知識が,ゴールモジュールのa-word スロットに格納 されている.この状態で,start ルールが発火し,a-word スロットの単語知識をもとに宣言的モジュー ル内の単語と語尾を結ぶ知識(word-tails をタイプと したチャンク)が呼び出される.その後,focus-tail ル ールが発火することで,語尾文字がゴールモジュー ルのa-tail スロットに格納される.retrieve-next-word ルールは,そのアルファベットを語頭に持つ単語 (word-heads をタイプとしたチャンク) を検索する. 単語が検索されると,ゴールバッファをクリアして 単語知識を次のゴール(a-word スロット)にセット する(set-next-goal ルール).以上で回答候補を想起 するプロセスは終了となる. この後,モデルは想起された回答候補が,課題中 で既出でないかの判定を行う.モデルの宣言的モジ ュールは,過去に想起された単語を経験として保持 している(answer-word というチャンクタイプ). check-used ルールによってその想起に失敗した場合 (過去にその単語を想起した経験がない場合),その 単語を回答とし,start ルールに戻る.回答候補を手 掛かりとした宣言的モジュールの検索によって,過 去に想起した経験が思い出された場合(既出だった 場合),回答単語の語頭文字との関連記憶を検索し (back-head ルール),語頭文字に着目し(focus-head ルール) ,語頭文字の知識を検索して(retrieve-head-chara ルール),再度文字知識から回答候補となる単 語を検索するプロセスに入る.4. 2 シミュレーション
図4 と図 5 に上記のモデルを実行した結果を示す. 図4 は 1 回の実行結果を事例として示し,図 5 は 100 図 3 モデルのプロセス回の実行結果を平均している. このシミュレーションでは,インターネット上の 英和辞典から取得した英単語 1,723 語分のデータを モデルの保持する単語知識として用いた.グラフの 横軸はしりとりがつながった回数であり,縦軸はあ る回答から次の回答までの経過時間(シミュレーシ ョン時間)である.図4 より,しりとりがつづくに つれ,回答までに時間のかかる頻度が高くなること がわかる.また,図5 より回答に掛かる平均時間も やや長くなっていくことがわかる. プロトタイプモデルでは,回答単語が既出ならば 再度検索を行い,別単語を回答とするまでループす るという処理を行っている.これは,人によるしり とりにおいて,既出の単語が思い出されるために, 良い回答を思いつくことができず言い淀む,回答ま でに間が空いてしまうといった先行研究において注 目されていた現象 [5, 6] と対応すると考えられる.
5.まとめ
本稿では研究の最終的な目標を言語の獲得に困難 を抱いている個人の語彙をモデル化に設定した.そ のためのシステム構成の検討と,プロトタイプモデ ルの作成を行った.また,プロトタイプモデルを実 行してシミュレーションを行い.しりとり課題にお けるモデルと人の類似点を確認した. 本研究に対して,多くの課題が残されている.ま ず,プロトタイプモデルの発展が必要である.現在 のモデルは提案するシステムに組み込んで運用する にあたって,不足する機能や,整合性の取れないプ ロセスが多くある.たとえば,本研究では,アルフ ァベットを文字とした英語によるしりとりを対象課 題とした.しかし,しりとりを可能にする条件 [8] を踏まえれば,英語ではなく,音韻と文字がより直 接的に対応する言語(i.e 日本語)を対象とすること が望ましいと考える.また,本研究におけるモデル は,インタラクションを実現する入出力のモジュー ルを持たない.今後,インタフェース部分やデータ 保管方法に関する検討を加えることで,ユーザとの インタラクションを介した個人のモデル化を実現し ていく.この過程において,モデル及びシステムの 妥当性を検証する実験も必要になるだろう.参考文献
[1] Tomasello M.: The cultural origins of human cognition, Harvard University Press, (1999)
[2] Baron-Cohen S.: Mindblindness.: An Essay on Autism and Theory of Mind, The MIT Press, (1997)
[3] Anderson J. R., Boyle C. F., and Reiser B. J.: Intelligent Tutoring Systems., Science, Vol. 228, No. 4698, pp. 456– 462, (1985)
[4] Anderson J. R.:How can the human mind occur in the physical universe?, New York: Oxford University Press, (2007) [5] 大藤 聖菜, 妹尾 卓磨, 清丸 寛一, 川崎 邦将, 大澤 正彦, 長田 茂美, 今井 倫太, 予測的認知と「間」の 関係ーー言葉を話せないロボットによるしりとりを 題材とした考察, HAI シンポジウム 2017, (2017) [6] 阪本 綾香, 林 勇吾, 小川 均: コミュニケーション ロボット PaPeRo による 人間らしさの表出, HAI シ ンポジウム2011, (2011) [7] 山本 米雄, 柏原 昭博: 知識定着を目的とした開放 型CAI のモデル化, 電子情報通信学会論文誌 D-2 情 報・システム, Vol. 72, No. 9, pp. 1459-1471, (1989) [8] 高橋 登: 幼児のことば遊びの発達“しりとり”を可 能にする条件の分析, 発達心理学研究, vol. 8, No. 1, pp. 42-52, (1997)
[9] Taatgen N.A., Anderson J.R.: Why do children learn to say “broke”? A model of learning the past tense without feedback., Cognition, Vol. 86, No. 2, pp. 123-155, (2002) [10] Van Rij J., Van Rijn H., and Hendriks P.: Cognitive
architectures and language acquisition: A case study in pronoun comprehension., Journal of Child Language, Vol. 37, No. 3, pp. 731-766, (2010)
図 5 実行結果(1 回の事例)
[11] Matzig P., Vasishth S., Engelmann F., and Caplan D.: A computational investigation of sources of variability in sentence comprehension difficulty in aphasia, Proceedings of the 15th International Conference on Cognitive Modeling, pp. 1-6, (2017)