画像に対する発話を対象とした概念獲得システムに関する研究

(1)

博士（情報科学）内田ゆず

学位論文題名

画像に対する発話を対象とした概念獲得システムに関する研究

学位論文内容の要旨

近年，ペットロポットやコミュニケーションロポット，掃除ロポッ，トをど，さまざまを家庭用ロポットが開発されている．しかし，現状ではそれらがー般家庭に広く普及しているとは言い難い．

ホームロボットの普及を妨げている原因の1 っは，ユーザのロボットに対する過剰を期待だと考えられる．特注日本においては「ロポットはをんでもできる」というイメージが先行しているため，現実との差が著しい．一方で，ユーザの期待に応えるためにロポットを高機能化していくと，ロポットを操作するユーザ側の負担が大きくをるというジレンマも抱えている．今後の家庭用ロポットは，人間と同等の対話処理能カを有することが必須とをるものと考えられる，

人間の言語活動は，対話の中から言語を獲得する，記憶に基づぃた対話を行う，質問に対して論理的を応答を行う，ユ―モアや皮肉を理解する，環境や相手に適した言葉を選択する，感情を表現する，

をどの様々を能カから成り立っている，それらの能カのうち，著者は，自然言語による対話を通じて実世界の中で言語を獲得するシステムの実現を目指している．研究の第ー歩として，ユーザの画像に対する発話から名詞概念（画像に対するラベル）を獲得していくシステムであるSINCA(System for

Noun Concepts Acquisition fromutteranCeSaboutImage

）の構築・提案を行った．

てれまでにも様々を用途の対話システムが開発されてきたが，それらはすべて大人の言語処理能カをモデルとして構築されている，しかし，人間の言語能カは極めて複雑であるため，このようをアプローチでは汎用的な対話システムに到達することは非常に困難だと考えられる．著者は，人が言語を獲得する能カの実現が人と同等の対話能カを計算機上で実現するための手がかりにをるのではをいかと考えている．本論文では，認知科学における言語獲得に関する研究から得られた知見を参考にしをがら、実際にコンピュータ上に言語獲得システムを構築して行った研究について述べる．

SNCA

は．あらゆる事物はそれに対応するラベルを持っているという知識を備えているが，成人が持っているようを語彙や文法の知識は与えられてい誼い，そのようを前提知識に基づぃたアルゴリズムや，入カを限定せずユーザが撮影した画像とそれに対する自由を発話といった実データを対象とする点，音声や画像といったマルチメディアに対応している点に本研究の独創性がある．

SINCA

の有効性については，様々誼観点から評価し，実証を行った．

第一に，SINCA の重要教アルゴリズムのーつであるラベル獲得ルールを評価するために，三つの

実験を行った．ラベル獲得ルールとは，名詞概念をより効率的に獲得するために，ユーザの入カから

生成されるテンプレートである，一つ目の実験は，名詞概念を獲得するために必要放入力回数をラベ

―818 一

(2)

ル獲得ルールを利用する場合と利用しをい場合で比較し，ラベル獲得ルールが名詞概念獲得に与える効果の評価を行うものである．実験の結果，ラベル獲得ルールを利用することでーつのラベルを獲得するために必要を平均入力回数が7.0 回から5.6 回に滅少し，より効率的を名詞概念獲得が可能にをることが明らかにをった．二つ目の実験は，Google による検索ヒット件数を用いて各ルールの一般性を測定するものである．実験の結果，Google の検索ヒット件数が10 ，000 件以下のルールは，

一般性が低く適用されにくいと判断でき，淘汰することが可能であることが明らかとをった，三つ目の実験は，

WordWideW

め上に存在する日本語文書をコーパスとみ誼し，S 玳CA が生成するラベル獲得ルールの妥当性を調査する性能評価実験である，実験の結果，全体の約26 ゲ。のルールが80 ゲ。以上の有効率（

W

曲検索で得られたフレーズに，ラベル獲得ルールの変数部分に名詞を挿入した表現が含まれる割合）で名詞の抽出が可能であることが明らかに誼った．

第二に，ユーザが実際に

SNCA

を使用したときに受ける印象を評価する実験を行った．人間の心理や行動に関する調査分析技法として広く用いられている評定尺度法を用いた評価において，全ての項目で中間点である

4

．0 ポイントを上回る結果が得られ，S 玳CA が幅広いユーザに好印象を与えることを確認した，また，S 玳（ニA と1 三ニI 亅ZA （キーワードと簡単をテンプレートを用いて応答を生成し，対話を行うシステム）の比較を行った．その結果，S 玳CA の評点はI 三I 厖A と比較して平均

1

．0 ポイント以上上回っており，

SmCA

はキーワードやテンプレ―トを用いた簡単を対話システムよりも好印象を与えられることが明らかとをった，

第三に．

SINCA

にどのようを入カを行うのが望ましいのかを検証するために，幼児の日常生活を収録したビデオデータを書き起こすことによって作成した独自の話し言葉データを入カ文として用いて名詞概念を獲得する実験を行った．このビデオデータは，幼児のいる家庭にピデオカメラを設置し，大人と幼児の間で行われる日常的を会話を収録するという方法で収集されたものである．撮影対象とをった家族は，

2

歳7 か月の男児，12 か月の女児（ビデオ撮影開始時の年齢）とその両親の4 人で構成されている，実験の結果，ビデオデータから収集した入力文から名詞概念を獲得することが可能であることが明らかにをった．また，アンケートによって収集した書き言葉の入カ文を用いた予備実験の結果と比較すると，ピデオデータから収集した入力文を用いた場合の方が効率的に名詞概念を獲得することが可能であることが明らかにをった．これは，ビデオデータによる入カ文にはー語発話が多い（全体の18 ．6 ％），助詞の欠落が多い（全体の42 ．6 卿，表現に多様性がある（ラベルの直後の表現はアンケートの場合の1 ．9 倍），をどの特徴があるためであると考えられる．これらのことから，幼児が日常生活の中で聞いている大人の発話は

SINCA

への入カとして適切であることが示された．

SINCA

で用いた名詞概念獲得手法は，文法知識をどを用いていをいため，他の品詞の獲得にも応用が可能であると考えられる，そこで，SNCA の名詞概念獲得アルゴリズムと同様に，語彙や文法の知識を持たをい状態から色を表す形容詞を獲得する手法の提案を行った．

SNCA

にその手法を適用し．評価実験を行った結果，提案したアルゴリズムによって入カ文から色を表す形容詞を抽出することが可能であることが明らかにをった，現状では色を表す形容詞に獲得対象を限定しているが，画像処理部の強化をどによって，幅広い形容詞を獲得することも可能であると考えられる，

ー819 ‑

(3)

学位論文審査の要旨主査教授荒木健治副査教授長谷山美紀副査教授山本強

学位論文題名

画像に対する発話を対象とした概念獲得システムに関する研究

近年，ペットロボットやコミュニケーションロボット，掃除ロボットなど，さまざまな家庭用ロポットが開発されている．しかし，現状ではそれらが一般家庭に広く普及しているとは言い難い．

ホームロポットの普及を妨げている原因の

1

っは，ユーザのロボットに対する過剰な期待だと考えられる．特に日本においては「ロポットは栓んでもできる」というイメージが先行しているため，現実との差が著しい，‑ 方で，ユーザの期待に応えるためにロポットを高機能化していくと，ロポットを操作するユーザ側の負担が大きくなるというジレンマも抱えている．今後の家庭用ロボットは，人間と同等の対話処理能カを有することが必須となるものと考えられる．人間の言語活動は，

対話の中から言語を獲得する，記憶に基づいた対話を行う，質問に対して論理的な応答を行う，ユーモアや皮肉を理解する，環境や相手に適した言葉を選択する，感情を表現する，などの様々な能カから成り立っている．それらの能カのうち，著者は，自然言語による対話を通じて実世界の中で言語を獲得するシステムの実現を目指している．研究の第一歩として．ユーザの画像に対する発話から名詞概念（画像に対するラベル）を獲得していくシステムであるSINCA(System for Noun Concepts

Acquisiton from utterances aboutImage)

の構築・提案を行った，

これまでにも様々な用途の対話システムが開発されてきたが，それらはすべて大人の言語処理能カをモデルとして構築されている．しかし，人間の言語能カは極めて複雑であるため，このようなアプローチでは汎用的な対話システムに到達することは非常に困難だと考えられる．著者は，人が言語を獲得する能カの実現が人と同等の対話能カを計算機上で実現するための手がかりになるのではないかと考えている．本論文では．認知科学における言語獲得に関する研究から得られた知見を参考にしながら，実際にコンピュータ上に言語獲得システムを構築して行った研究について述べる，

SINCA

は，あらゆる事物はそれに対応するラベルを持っているという知識を備えているが，成人

が持っているような語彙や文法の知識は与えられていない，そのような前提知識に基づぃたアルゴリズムや．入カを限定せずユーザが撮影した画像とそれに対する．自由な発話といった実データを対象とする点、音声や画像といったマルチメディアに対応している点に本研究の独創性がある．

SINCA

の有効性にっいては，様々ぬ観点から評価し，実証を行った，

第一に，SJNCA の重要なアルゴリズムのーっであるラベル獲得ルールを評価するために，三っの実験を行った．ラベル獲得ルールとは，名詞概念をより効率的に獲得するために，ユーザの入カから

―820 ‑

(4)

生成されるテンプレートである．一つ目の実験は，名詞概念を獲得するために必要な入力回数を，ラベル獲得ルールを利用する場合と利用しない場合で比較し，ラベル獲得ルールが名詞概念獲得に与える効果の評価を行うものである．実験の結果，ラベル獲得ルールを利用することでーつのラベルを獲得するために必要な平均入力回数が7．0回から5.6回に減少し，より効率的な名詞概念獲得が可能になることが明らかになった，二つ目の実験は，Googleによる検索ヒット件数を用いて各ルールの一般性を測定するものである．実験の結果，Goo餌eの検索ヒット件数が10，000件以下のルールは，一般性が低く適用されにくいと判断でき，淘汰することが可能であることが明らかとなった．三っ目の実験は，WbddWideWぬ上に存在する日本語文書をコーパスとみなし，SmCAが生成するラベル獲得ルールの妥当性を調査する性能評価実験である．実験の結果，全体の約26ゲDのルールが 80％以上の有効率m職）検索で得られたフレーズに，ラベル獲得ルールの変数部分に名詞を挿入した表現が含まれる割合）で名詞の抽出が可能であることが明らかになった．

第二に，ユーザが実際にS玳CAを使用したとき．に受ける印象を評価する実験を行った．人間の心理や行動に関する調査分析技法として広く用いられている評定尺度法を用いた評価において，全ての項目で中間点である4．0ポイントを上回る結果が得られ，SDb｀が幅広いユーザに好印象を与えることを確認した．また，S玳CAとH IZA（キーワードと簡単なテンプレートを用いて応答を生成し，対話を行うシステム）の比較を行った．その結果，S玳CAの評点はI三I厖Aと比較して平均1．0ポイント以上上回っており，SDぬ｀はキーワードやテンプレートを用いた簡単な対話システムよりも好印象を与えられることが明らかとなった．

第三に，S玳CAにどのような入カを行うのが望ましいのかを検証するために，幼児の日常生活を収録したビデオデータを書き起こすことによって作成した独自の話し言葉データを入力文として用いて名詞概念を獲得する実験を行った，このビデオデータは，幼児のいる家庭にビデオカメラを設置し，大人と幼児の間で行われる日常的な会話を収録するという方法で収集されたものである．撮影対象となった家族は，2歳7か月の男児，12か月の女児（ビデオ撮影開始時の年齢）とその両親の4 人で構成されている，実験の結果，ビデオデータから収集した入力文から名詞概念を獲得することが可能であることが明らかになった，また，アンケートによって収集した書き言葉の入力文を用いた予備実験の結果と比較すると，ビデオデータから収集した入カ．文を用いた場合の方が効率的に名詞概念を獲得することが可能であることが明らかになった．これは，ビデオデータによる入力文にはー語発話が多い（全体の18．6％），．助詞の欠落が多い（全体の42．6ゲ。），表現に多様性がある（ラベルの直後の表現はアンケートの場合の1．9倍），などの特徴があるためであると考えられる．これらのことから、幼児が日常生活の中で聞いている大人の発話はS玳CAへの入カとして適切であることが示された．

S烈CAで用いた名詞概念獲得手法は．文法知識などを用いていないため，他の品詞の獲得にも応用が可能であると考えられる．そこで，S玳CAの名詞概念獲得アルゴリズムと同様に，語彙や文法の知識を持たない状態から色を表す形容詞を獲得する手法の提案を行った．SINCAにその手法を適用し，評価実験を行った結果，提案したアルゴリズムによって入力文から色を表す形容詞を抽出することが可能であることが明らかになった．現状では色を表す形容詞に獲得対象を限定しているが，画像処理部の強化などによって，幅広い形容詞を獲得することも可能であると考えられる．これを要するに，著者は，実世界で動作可能な概念獲得手法を提案し，言語獲得にっいて有効な計算処理機構に関する新知見を得たものであり，自然言語処理工学及ぴ人工知能工学の発展に貢献するところ大なるものがある，よって著者は，北海道大学博士（情報科学）の学位を授与される資格あるものと認める．

―821−

画像に対する発話を対象とした 概念獲得システムに関する研究

博 士 （ 情 報 科 学 ） 内 田 ゆ ず

学 位 論 文 題 名

画像に対する発話を対象とした 概念獲得システムに関する研究

学位論文内容の要旨

近年，ペットロポットやコミュニケーションロポット，掃除ロポッ，トをど，さまざまを家庭用ロ ポットが開発されている．しかし，現状ではそれらがー般家庭に広く普及しているとは言い難い．

人間の言語活動は，対話の中から言語を獲得する，記憶に基づぃた対話を行う，質問に対して論理 的を応答を行う，ユ―モアや皮肉を理解する，環境や相手に適した言葉を選択する，感情を表現する，

） の 構 築 ・ 提 案 を 行 っ た ．

の有効性については，様々誼観点から評価し，実証を行った．

第一に ，SINCA の重 要教アルゴリズムのーつであるラベル獲得ルールを評価するために，三つの

実験を行った．ラベル獲得ルールとは，名詞概念をより効率的に獲得するために，ユーザの入カから

生成されるテンプレートである，一つ目の実験は，名詞概念を獲得するために必要放入力回数をラベ

―818 一

一般性が低く適用されにくいと判断でき，淘汰することが可能であることが明らかとをった，三つ目 の 実験 は ，

め上 に存 在す る 日本 語文 書をコーパス とみ誼し，S 玳CA が生成する ラベル 獲得ルールの妥当性を調査する性能評価実験である，実験の結果，全体の約26 ゲ。のルールが80 ゲ。以 上の有 効率（

曲検索で得られたフ レーズに，ラベル獲得ルー ルの変数部分に名詞を挿入した表現 が含まれる割合）で名詞の抽出が可能であることが明らかに誼った．

第二 に，ユーザが実際に

を 使用したときに受ける印象を 評価する実験を行った．人 間の心 理や行 動に関する調査分析技法と して広く用いられている評定尺度法を用いた評価において，全て の項目 で中間点である

．0 ポ イント 以上上回っており，

は キーワードやテンプレ―トを 用いた簡単を対話システム よりも 好印象を与えられることが明らかとをった，

第三 に．

への入カと して適切であることが示さ れた．

学位論文審査の要旨 主 査 教授 荒木健 治 副査 教授 長谷山美紀 副 査 教授 山本 強

学 位 論 文 題 名

画像に対する発話を対象とした 概念獲得システムに関する研究

近年，ペットロボットやコミュニケーションロボット，掃除ロボットなど，さまざまな家庭用ロ ポットが開発されている．しかし，現状ではそれらが一般家庭に広く普及しているとは言い難い．

ホームロ ポット の普及 を妨げ ている 原因の

の構築・提案を行った，

は，あ らゆる事物はそれに対応するラベルを持っているという知識を備えているが，成人

の有効性にっいては，様々ぬ観点から評価し，実証を行った，

第一に ，SJNCA の重要なアルゴリズムのーっであるラベル獲得ルールを評価するために，三っの 実験を行った．ラベル獲得ルールとは，名詞概念をより効率的に獲得するために，ユーザの入カから

画像に対する発話を対象とした概念獲得システムに関する研究

博士（情報科学）内田ゆず

学位論文題名

画像に対する発話を対象とした概念獲得システムに関する研究

近年，ペットロポットやコミュニケーションロポット，掃除ロポッ，トをど，さまざまを家庭用ロポットが開発されている．しかし，現状ではそれらがー般家庭に広く普及しているとは言い難い．

人間の言語活動は，対話の中から言語を獲得する，記憶に基づぃた対話を行う，質問に対して論理的を応答を行う，ユ―モアや皮肉を理解する，環境や相手に適した言葉を選択する，感情を表現する，

）の構築・提案を行った．

第一に，SINCA の重要教アルゴリズムのーつであるラベル獲得ルールを評価するために，三つの

一般性が低く適用されにくいと判断でき，淘汰することが可能であることが明らかとをった，三つ目の実験は，

め上に存在する日本語文書をコーパスとみ誼し，S 玳CA が生成するラベル獲得ルールの妥当性を調査する性能評価実験である，実験の結果，全体の約26 ゲ。のルールが80 ゲ。以上の有効率（

曲検索で得られたフレーズに，ラベル獲得ルールの変数部分に名詞を挿入した表現が含まれる割合）で名詞の抽出が可能であることが明らかに誼った．

第二に，ユーザが実際に

を使用したときに受ける印象を評価する実験を行った．人間の心理や行動に関する調査分析技法として広く用いられている評定尺度法を用いた評価において，全ての項目で中間点である

．0 ポイント以上上回っており，

はキーワードやテンプレ―トを用いた簡単を対話システムよりも好印象を与えられることが明らかとをった，

第三に．

への入カとして適切であることが示された．

学位論文審査の要旨主査教授荒木健治副査教授長谷山美紀副査教授山本強

学位論文題名

画像に対する発話を対象とした概念獲得システムに関する研究

近年，ペットロボットやコミュニケーションロボット，掃除ロボットなど，さまざまな家庭用ロポットが開発されている．しかし，現状ではそれらが一般家庭に広く普及しているとは言い難い．

ホームロポットの普及を妨げている原因の

は，あらゆる事物はそれに対応するラベルを持っているという知識を備えているが，成人

第一に，SJNCA の重要なアルゴリズムのーっであるラベル獲得ルールを評価するために，三っの実験を行った．ラベル獲得ルールとは，名詞概念をより効率的に獲得するために，ユーザの入カから