• 検索結果がありません。

博士(工学)徐 金安 学位論文題名

N/A
N/A
Protected

Academic year: 2021

シェア "博士(工学)徐 金安 学位論文題名"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

     博士(工学)徐   金安 学位論文題名

統計的モデルと帰納的学習との融合による ユーザ適応型行動予測手法に関する研究

学位論文内容の要旨

  近年,情報技術の発達に伴い,人工物と人との共生的な関係形成やコミュニケーションの ための 基盤技術 に関す る研究 が盛ん である .中でも,各ユーザに動的に適応が可能な高い 予測精度を持っ行動予測システムを実現することが,実践的な分野への応用に期待されてい る.このような知的システムの実現において,最も重要なことは,人間の知識獲得メカニズムそ して人間の予測能カを有する原理などをどの程度まで解明することができるかという点である と考えられる,

  本研究の目的は,それぞれのユーザに動的に適応可能なシステム,いわゆる「個人適応型 システム」に関する研究を通じて,そのメカニズム,工学的な実現方法及び原理を解明するこ とである.

  従来の行動予測手法は,統計的なアプローチと解析的なアプローチによるものに分けられ る.統 計的なア プロー チは, データ を解析 する方法によってPoint−Based予測システムと PassーBased予測システムに分類される.Point―Based予測システムは,観測されたデータの 頻度情報のような少ない相関情報を用いることにより,予測を行い,その予測精度が約30〜 50%とな ってい る.こ れに対し て,時 系列デ ータを シーケ ンスと し,N−gramを利用した Pass−Based予測システムが提案されている,この手法では,十分な学習データが与えられた 場合,その予測精度は約70%前後となっている.一方,解析的なアプローチにおいては,シ ステムに与えられたルールが適用された場合には,高い確率で予測できるが,人手により矛 盾なく予め与える規則には限界があり,各々のユーザに対し,全てのルールを用意するには 多くの労カがかかる.また,これらの手法において,予測となるターゲットの頻度情報が不足し ている時に,ユーザに適応できないという問題が残っている.

  一方, 人間の 行動の 特徴は規 則性と 多様性 などが挙げられる.規則的な行動において,

N‑gramやSVMなどの確率モデルを利用することにより,規則性を解明することができるが,多 様性のある行動パターンの予測には,ユーザに適応した利用方法を考える必要があることを 示している.本研究においては帰納的学習を用いることにより,システムが与えられたデータ から自分自身で予測ルールを獲得していく方法を提案している,提案手法では,予めシステ ムに与えるユーザの行動履歴を少なくすることで,ユーザに依存した表現をルールとして獲得 することが可能となる.さらに,N−gramを利用して,帰納的学習により獲得したルールをモデ     ‑ 1087−

(2)

ル 化 する こ と に よ り, ユ ー ザ の 行動 の 多 様 性 と規 則 性 に 共に 適用 可能なPointPass−Based 測手 法を提 案して いる,

  こ の 提 案 手 法 に 基 づ き , 人 間 の 生 活 パ タ ー ン や 嗜 好 な どを 自 動 的 に 獲得 で き る 部 屋 を想 定 し た. ユ ー ザ の 行動 を こ の 部 屋を 構 成 し て いる テ レ ビ や電 灯な ど,人 間の行 動によ り状態 を 変 化 さ せ る こ と が 可 能な 要 素 の 状 態が ュ ー ザ の 動作 に よ っ て 変 化し た 時 に , その 要 素 の 状 態 に 示 さ れ て い る ユ ー ザの 動 作 と 限 定し た , 実 験 シス テ ム を 構 築 し, 人 間 の 実 生活 に 基 づ き 収 集 し た デ ー タ を 用 い て 実 験 を 行 っ た 結 果 ,89.3% の 予 測 精 度 が 確 認 さ れ た .   ま た , 帰 納 的学 習 で は , 予 測結 果 に 対 し ,ユ ー ザ の 判 定結 果を教 師情報 として ,フ イード バ ック 学習を 用いる ことに より ,シス テムの 予測精 度を向 上さ せるこ とができる.そこで,この特徴 を 利 用し て , 「確 率モデ ルとフ イード バッ ク学習 の融合 による テレ ビビデ オ自動 予約シ ステム 」 を 提 案 し ,NgramSVMな ど の 確 率モ デ ル と フ イ ード バ ッ ク 学 習と の 融 合 に つい て 試 み た .   N ‑ gramと フ イー ド バ ッ ク 学習 を 融合 した テレビ ビデオ 自動予 約シス テム では,N‑ gramを用 い て ,ユ ー ザ の テ レビ 番 組 の 閲 覧履 歴 か ら , 各番 組 の カ テゴ リ情 報を分 類情報 として ,各カ テ ゴ り に 従 っ て 閲 覧 履 歴を 分 類 し , 単名 詞 や 未 知 語を 解 析 の 対 象 とし , 複 合 名 詞を 含 め た 重 み 付 け のキ ー ワ ー ド ベク ト ル 空 間 を抽 出 す る . 構築 さ れ た キー ワー ドベク トル空 間はユ ーザの 興 味 空 間を 示 し て い るた め , こ れ らの 情 報 を 用 いて 各 新 番 組に 対し ,ベク トル内 積法に より, 新 番組 にマッ チする 全要素 をク エリー として 獲得できる.さらに,このクエリーを用いて,tf.idf を利 用する ことに より, その 番組のtf.idf重みが 求め られる .そして,N―gramにより求めた重み tfidf重み を そ れ ぞ れ正 規 化 し て統 合する こと により ,ユー ザの嗜 好に合 う新 番組を 推薦可 能 に なる . ま た, 推薦結 果に対 してユ ーザ は判定 し,判 定結果 をフ イード バック 情報と して学 習 さ せ ,ユ ー ザ の興 味空間 を更新 するこ とに より, 予測の 精度を 向上 させる .本シ ステム のフイ ー ド バ ック 学 習 で は ,シ ス テ ム の 即応 性 と 頑 健 性を 持 た せ るた めに ,ユー ザの嗜 好パタ ーンを 示 す フ イー ド バ ッ ク タス ク の 自 動 抽出 と ユ ー ザ の閲 覧 履 歴 を適 切に 分割し た上で ,興味 空間を 構 築 す る 方 法 を 考 慮 し た . 実 験 の 結 果 , 86.9% の 予 測 精 度 が 確 認 さ れ た .   ま た ,SVMを用 い た フ イ ード バ ッ ク 学 習に よ る テ レ ビビ デ オ 自 動 予 約シ ス テ ム で は,SVM 利 用 して , ユ ー ザ の閲 覧 履 歴 か ら, ユ ー ザ の 嗜好 を 示 す 行動 パタ ーンを モデル 化し, フイー ド バ ッ ク学 習 を 行 う こと で , モ デ ルを 更 新 さ せ ,ユ ー ザ の 嗜好 に適 応した 番組を 推薦す ること が 可 能 にな る . 具体 的には ,イン ターネ ット から抽 出され たテレ ビ番 組から ,時間 (曜日 ,開始 及 び終 了時刻 ),チ ャンネ ル名 ,カテ ゴリ( 日,英 ),番 組の 説明部 分に含 まれて いる 名詞とラR 語 な どを 素 性 とし て抽出 し,ユ ーザが 見た 番組を クラス1, 見ない 番組を クラ ス―1,新 番組を ク ラ ス0と 分 類 し て , 線 形SVMや 多 項 式SVMを 用 い る 方 法 で あ る . 各 素 性 の 重 み 付 け は ブ ー ル 形 式 ま た はtfidf値 を 利 用 す る . 実 験 の 結 果 , 線 形SVMで は約82% の 予測 精 度 で , 多項 式SVMでは 約92%の 予測 精度が 得られ た,

  以 上 の 結 果 か ら , 統 計 的 モ デ ル と 帰 納 的 学 習 の 融 合 に よる ユ ー ザ 適 応型 行 動 予 測 手 法に 関 し ては , 帰 納 的 学習 に よ ル ル ール を 獲 得 す る方 法 とN‑gramと の融 合 ,Ngramによ るユー ザ の 興 味空 間 を 構 築 する 方 法 と フ イー ド バ ッ ク 学習 と の 融 合 , そし て ,SVMを 用 い てユ ーザの 行 動 パ ター ン を モ デ ル化 す る 手 法 とフ イ ー ド バ ック 学 習 と の融 合の 三っの 面から システ ムを構 築 し , 実 験 結 果 に よ り , ユ ー ザ 適 応 型 行 動 予 測 手 法 と し て の 有 効 性 が 確 認 さ れ た ,

1088

(3)

学位論文審査の要旨

学 位 論 文 題 名

統計的モデルと帰納的学習との融合による ユーザ適応型行動予測手法に関する研究

  著者は ,それぞれのユーザに動的に適応が可能なシステム,いわゆる「個人適応型システム」の実 現に関す る問題を解決するために,統計的モデルと帰納的学習との融合によるユーザ適応型行動予測 手法の提 案を行い,予測性能の向上に関する研究を行った.また,著者は,近年の情報技術の向上に 伴う個人 ユーザ適応システムの需要を考慮し,人間の知識獲得メカニズムそして人間の予測能カを有 する原理 などに着目し,行動予測における一般的な学習の枠組みを作り上げる方法に関する検討,及 び人間の ように学習能カを有するシステムの工学的な実現方法や 原理の探索を研究の目的としてい る.

  従来の 行動予測手法は,統計的なアプローチと解析的なアプローチによるものに分けられる,統計 的 なア プロ ーチ は ,データを解析する方法によってPoint‑Based予測システムとPass‑Based予測シ ステムに 分類される.これらの手法においては,予測精度が低い,動的適応が不可能,そして,デー タ の 収 集 や ル ー ル の 用 意 な ど に 多 く の 労 カ が か か る と い う 問 題 が 残 さ れ て い る .   一方, 人間の行動の特徴としては規則性と多様性などが挙げら れる.規則的な行動においては,

N‑gramやSVMなど の統 計的 モデ ルを 利用 する こ とに より ,規 則性 を解 明することができ るが,多 様性のあ る行動パターンの予測には,ユーザに適応した利用方法を考える必要がある.著者は,これ らのユー ザの行動の特徴を考慮した上で,「N‑gramを用いた帰納 的学習によるユーザの行動予測手 法」を提 案している.提案手法では帰納的学習を用いることにより,システムが与えられたデータか ら自分自 身で予測ルールを獲得し,ユーザに依存したルールを獲得することが可能となる.さらに,

N‑gramを 利用して,ユーザの行動予測に適用されたルールをモデ ル化することにより,ユーザの行 動 の 多 様 性 と 規 則 性 に 共 に 適 用 可 能 なPoint‑Pass‑Based予 測 手 法 を 提 案 し て い る .   この提 案手法に基づき,人間の生活パターンや嗜好などを自動的に獲得できる部屋を想定した.ユ ーザの行 動をこの部屋を構成しているテレビや電灯など,人間の行動により状態を変化させることが 可能な要 素の状態がユーザの動作によって変化した時に,その要素の状態に示されているユーザの動 作に限定 した.実験システムを構築し,人間の実生活に基づき収集したデータを用いて実験を行った 結果,89.3%の予測精度が確認された.

    ‑ 1089―

治 夫

健 秀

木 島

北 山

授 授

教 教

査 査

主 副

(4)

  ま た,著者は,帰納的学習は,フイードバック学習を含んでいるという特徴を利用して,「確率モ デ ル と フイ ード バッ ク学 習の 融合 によ る テレ ビビ デオ 自動 予約 シス テム 」を 提案 し,N‑gramや SVMなど の確 率モ デル とフ イー ドバ ッ ク学 習との融合に っいて試みた.N‑ gramとフ イードバック 学習 を融合したテレビビデオ自動予約システムでは,N‑gramを用いて,ユーザのテレピ番組の視聴 履歴 から,各番組のカテゴリ情報を分類情報として,各カテゴりに従って視聴履歴を分類し,単名詞 や未 知語を解析の対象とし,複合名詞を含めた重み付けのキーワードベクトル空間を抽出する.構築 され たキーワードベクトル空間はユーザの興味空間を示しているため,これらの情報を用いて各新番 組に 対し,ベクトル内積法により,新番組にマッチする全要 素をクエリーとして獲得できる.さら に, このクエリーを用いて,tf.idf法を利用することにより,その番組のtf.idf重みが求められ る .そ し て,N‑gramにより求めた重みとtf・idf重みをそれぞれ正規化して統合する ことにより,

ユー ザの嗜好に合う新番組を推薦可能となる.また,推薦結果に対してユーザが判定し,判定結果を フイ ードバック情報として学習させ,ユーザの興味空間を更新することにより,予測の精度を向上さ せる .本システムのフイードバック学習では,システムの即応性と頑健性を持たせるために,ユーザ の嗜 好パターンを示すフイードバックタスクの自動抽出とユーザの視聴履歴を適切に分割した上で,

興 味 空 間 を 構 築 す る 方 法 を 考 察 し た . 実 験 の 結 果 ,86.9% の 予 測 精 度 が 確 認 さ れ た .   ま た ,SVMを用 いた フイ ード バッ ク学 習に よる テレ ビビ デオ 自動 予 約シ ステ ムで は,SVMを利 用し て,ユーザの視聴履歴から,ユーザの嗜好を示す行動パターンをモデル化し,フイードパック学 習を 行うことで,モデルを更新させ,ユーザの嗜好に適合した番組を推薦することが可能になる.具 体的 には,インターネットから抽出されたテレビ番組から,時間(曜日,開始及び終了時刻),チャ ンネ ル名,カテゴリ(日,英),番組の説明部分に含まれている名詞と未知語などを素性として抽出 し ,ユ ー ザが 視聴 した番組をクラス1,視聴しなかった番組をクラス−1,新番組をクラス0と分類 し て , 線 形SVMや 多 項 式SVMを 用 い る 方 法 で あ る . 各 素 性 の 重 み付 けは ブー ル形 式ま たはtf・ idf値 を 利 用 す る . 実 験 の 結 果 , 線 形SVMで は 約82% の 予 測 精 度 , 多 項 式SVMで は 約92% の 予測 精度が得られた.

  以 上を要約すると,著者は統計的モデルと帰納的学習の融合によるユーザ適応型行動予測手法に関 し ては , 帰納 的学 習に よル ルー ルを 獲得 する 方法とN‑gramとの融合,N‑gramによる ユーザの興味 空 間を 構 築す る方 法とフィードバック学習との融合,SVMを用いてユーザの行動パタ ーンをモデル 化す る手法とフイードバック学習との融合の三っの面から実験システムを構築し,性能評価実験を行 った .実験結果よルユーザ適応型行動予測手法としての有効性が確認された.本研究を通じて,情報 化社 会におけるユーザ適応型行動予測手法の確立に貢献するところ大なるものがある.よって,著者 は北 海道大学博士(工学)の学位を授与される資格あるもの と認める.

1090

参照

関連したドキュメント

・ 支援情 報の確信度の表示など、洪水 等制御施設に対する具体的 な支援操作システム の 新しい 開発とその自己評価を可能に

  4 章 にお いては ,二ユ ーラル ネット ワー クモデ ルの導 入に先 立ち ,車両 感知器 を通し て計測 さ れる 交通変 量に

2 ) 片 側性 唇 顎 口蓋 裂 者に お ける 上 顎前 方 牽引 装 置の 治 療効 果 につ いて

製 品設 計 デー タを工 程設計 にて共 有する ことが 可能に なり, 工程設計 やCAM (Computer Aided Manufacturing)

  

   近年、特に1990 年代に入ってからの

の将来予測を行い、その効果を解析・評価したもので、自動車排気削減策の大気影響評価

自己組織化ニューラルネットワークは,その汎化性や適応性を実現するために,ある程度大