• 検索結果がありません。

協調フィルタリングにおける近傍グループの可視化

N/A
N/A
Protected

Academic year: 2021

シェア "協調フィルタリングにおける近傍グループの可視化"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)2004−DBS−133 (7) 2004−FI− 75 (7) 2004/5/14. 社団法人 情報処理学会 研究報告 IPSJ SIG Technical Report. 協調フィルタリングにおける近傍グループの可視化 藤. 森 洋. 昌†. 土. 方 嘉. 徳†. 西 田. 正 吾†. ユーザの情報獲得を支援する方式の一つとして,協調フィルタリングがある.これはユーザのアイ テムに対する嗜好を記録し,そのユーザと似た嗜好を持つ他のユーザグループの情報を基に,未知の アイテムに対するユーザの嗜好を推測する手法である.しかし,協調フィルタリングには,ユーザが これまでに付けてきた評価値が大きく変わらない限り,毎回同じようなグループが特定され,毎回似 たようなアイテムが推薦されてしまうという問題がある.本研究では,この問題に対処するために, ユーザが興味を持ってグループを見つけることができ,そのグループで直接推薦を受けることが出来 る協調フィルタリングシステムを提案する.具体的には、協調フィルタリングに必要な評価値行列と、 e-マーケットプレイスで取得されているデモグラフィック情報から,自己組織化マップと決定木を用 いた近傍グループ可視化インタフェースを構築する.. Visualizing Neighborhood for Collaborative Filtering Hiromasa Fujimori,† Yoshinori Hijikata† and Shogo Nishida† Collaborative Filtering is one of the method for helping users to acquire information. This method firstly records the user’s rating for each item. Then new items are recommended to the user based on the user’s ratings and other user’s ratings who have similar preferences. Thid method has a problem that while the user’s rating histories do not change largely, similar groups are specified and similar items are recommended every time. In our research, we propose a collaborative filtering system that visualizes the neighborhood and allows the user to directly select some groups and get a recommendation from the groups. Concretely speaking, we construct a visualizing interface using self-organizing map and decision tree created by rating matrix and demographic data.. 1. は じ め に. は,単にアイテムを推薦してくれるだけでなく,ユー ザは「自分と同じような嗜好を持つ人達は,どういう. ネットワークの普及で多くの情報にアクセスできる. アイテムを気に入っているのか?」ということを知る. ようになった反面,大量の情報から目的の情報を探す. ことができ,一種のエンタテインメント性を持ってい. ことが困難であるという情報洪水の問題が取りだたさ. る点が,他の情報フィルタリング方式と異なるところ. れている.この情報洪水に対処する手法の 1 つに協調. である.. フィルタリングがある.協調フィルタリングとは,他. ここで,協調フィルタリングの基本アルゴリズムの 1 つとして現在広く利用されている Resnick2) の近傍 ユーザ集合に基づく評価予測アルゴリズムについて説 明する.このアルゴリズムの手順は,(i) 注目してい. 人の興味に関する情報を利用して,コンテンツや商品. (以降,これらをアイテムと呼ぶ) を推薦する技術であ る1) .現在,この技術を使ったシステムは書籍,音楽 CD,映画,文房具,薬,カタログ商品などの商品を 扱う多くの商用 Web サイトで利用されている. 現在の協調フィルタリングシステムの多くは,ユー ザがアイテムに対して付けた評価値の統計量に基づい て,そのユーザと近い好みを持つグループを特定し, そのグループが高く評価しているアイテムをユーザに 推薦している.そのため協調フィルタリングシステム † 大阪大学大学院基礎工学研究科 Graduate School of Engineering University. るユーザ (active user) 以外の全てのユーザとの評価 値分布の相関 (類似度) を求め,(ii) 比較可能なユーザ 部分集合を選び,(iii) 選ばれたユーザ部分集合が付け た評価値の重みつき和によって,あるアイテムに対す るそのユーザの予想評価値を求める,というものであ る.具体的には,ユーザ u(1∼m) のアイテム i(1∼. n) に対する評価値 (rating)rui は,以下のような行 列で表現できる.. Science,. Osaka. −59−.

(2)  u. i r11.   r21  .  .  . rm1. r12 r22 .. . rm2. ··· ··· .. . ···. r1n r2n .. . rmn. ズムを基本として,ユーザが直接に推薦の基となるグ. . ループを指定可能なインタフェースを備える協調フィ.     . ルタリングシステムを開発する.. 2. ユーザ情報と本研究の方法論 一般的に協調フィルタリングを行う Web サイトに. このとき,Resnick は rui に対する予測値 pui を. て入手しているユーザ情報には,評価データとデモグ. m. (roi − r¯u ) ∗ wu,o o=1 m pui = r¯u + (1) |wu,o | o=1 と表し,ユーザ u と o との類似度 wu,o ∈ [−1, 1] を ピアソン相関 (Pearson correlation).  (ruk − r¯u )(rok − r¯o ) k=1. ムに対する評価値である.デモグラフィックデータと は,性別,年齢などその人の持つ特質を表すデータの ことであり,多くの e-マーケットプレイスで取得され. n. wu,o =. ラフィックデータの 2 つがある.評価データとは,ユー ザから 5 段階のアンケート形式などで得られるアイテ. ている3) .本研究では,これら 2 種類のデータに対し. σu σo. てグループの可視化を試みる.. を用いて求める.ここで, r¯u はユーザ u の平均評価. n r を示し, σu は評 値 (average rating) r¯u = i=1 ui  n 2 2 価 rui の標準偏差 σu =. (r − r¯u ) を示す. i=1 ui 現 在 の 協 調 フィル タ リ ン グ シ ス テ ム の 多 く は , Resnick2) のアルゴリズム及びその改良型を基本と しているが,これらの方法には 1 つの問題点がある. これらの方法は,推薦の基となるグループを自動的に 選択していると見ることができるが,逆に言えば,も しユーザに見せれば興味を持つグループが存在してい たとしても,それを発見しさらに選択するような手段 を持たないことになる.推薦を受ける基となるグルー プの選択ができなければ,ユーザがこれまでに付けて. 最初の評価データに対しては,コホーネンの自己組 織化 Feature マップ (以降,これを Self-Organizing. Map:SOM と呼ぶ)4) を使ってグループの可視化を行 う.SOM とは,雑然とした情報群の中からいくつかの 特徴を見つけ出し,その特徴によってデータをグルー プに分類し,それらのグループを 2 次元のマップ上に 配置するものである.分類により作られたグループの ラベルには,例えばグループ内で最頻出のアイテム名 や,アイテムのジャンル名を付けたりすることができ る.データ同士の関係は 2 次元平面上の距離として表 され,視覚的に理解しやすく,自分がどのグループに いるかはマップを見れば一目瞭然である.. きた評価値が大きく変わらない限り,毎回同じような. 2 つ目のデモグラフィックデータに対しては,決定. グループが特定され,毎回似たようなアイテムが推薦. 木を使ってグループの可視化を行う.決定木とは,各. されてしまう.その結果,ユーザはすぐにその推薦結. ノードに設定されたテストによりデータを分類させ,. 果に飽きてしまい,サービスを使わなくなってしまう. 各葉ノードにクラスとしてグループ化したデータを配. 可能性がある.このことは,協調フィルタリングシス. 置するものである.根ノードから木を順にたどること. テムを使用している Web サイトにとっては,リピー. で,自分がどんな属性を持つグループにいるかわかる. タを失うことにつながる恐れがある.. ようになっており,グループの理解は容易である.. ユーザがデフォルトの推薦に飽きても, 「自分が属さ. 本研究では,以上述べた 2 つの方法を相互に組み合. ないあるグループの人は,どういったアイテムに興味. わせることで,ユーザが様々な角度から興味を持って. を持っているか?」や「評価データ以外のデータ(例. グループを指定可能なインタフェースを構築すること. えば,性別や年齢,職業などのデモグラフィック情報). を目指す.. でグループ化すると,あるグループの人達はどういっ. 3. 設計コンセプト. たアイテムに興味を持っているか?」というような幅 広い推薦が受けられれば,ユーザはその Web サイト. 本研究では,グループの可視化とその選択を容易と. を利用し続けるものと思われる.つまり,システムが. するために,SOM と決定木を使うことにした.しか. グループをうまく視覚化してやり,ユーザが容易にグ. し,これらが単に独立に機能しているだけでは,これ. ループを直接操作できるような機能を提供することに. らの利点を最大限に引き出しているとは言えない.そ. よって,このようなより付加価値の高いサービスを実. こで,本研究における協調フィルタリングシステムで. 現することが可能になると考えられる.. は,Resnick のアルゴリズム,SOM,決定木の 3 つ. 2). そこで,本研究では一般的な Resnick. のアルゴリ. の方法論を有機的に連携させる以下の設計コンセプト. 2 −60−.

(3) ラフィックデータのどの要素がユーザの分類に寄与し 1. N. ているのかを確認することができる.これも SOM と. A B. 同様,葉ノードを選択することで葉ノード中のユーザ を使って,Resnick2) のアルゴリズムによりアイテム. M. の推薦を受けることができる.. SOM のニューロンと決定木の葉ノード間にはリン クが張ってあり,SOM の分類を見た後,その分類を 決定付ける社会的要素を見るために決定木を見たり, 逆にユーザの社会的要素で分類されたグループは,ア イテムに対する嗜好で分類するとどこに位置づけさ れるかなどを見ることができる.具体的には,SOM 図1 Fig. 1. のニューロンをクリックすれば,対応する決定木の葉. 設計コンセプト Design concept. ノードとそこに至る根ノードからのパスが点滅後,強 調表示されるような見せ方が考えられる.またこの場. を採ることとする.. 合,逆に決定木の葉ノードをクリックすると,対応す. • SOM または決定木で分類されたグループを使っ. る SOM のニューロンが点滅後,強調表示される.ま. てアイテムを推薦する機能. た,SOM または決定木の分類を見て,自分の入力し. ユーザがいくつか選択した SOM 上のニューロン. た嗜好よりもより自分の嗜好を表現していそうな評価. または決定木上の葉ノードから新たにアイテムを. 値を持つユーザまたはグループが見つかれば,その評. 推薦する.予測評価値 pui の算出は,Resnick2) の. 価値を使って自分の評価値ベクトルを更新することも. アルゴリズム (1) 式において o を SOM のニュー. できる.. ロンまたは決定木の葉ノード中のユーザとして,. 4. システム設計. 類似度 wu,o を 1 として計算する.. • 評価値による分類とデモグラフィックデータによ る分類の相関を見ることができる機能 これは,SOM で作られたグループを,決定木の 葉ノードのクラスに対応させることで実現する. • ユーザプロファイルを変更できる機能 これは,評価データに相当するプロファイルのベ クトルデータを,気に入ったグループを代表した ある 1 人のユーザの評価値で置き換えることで実 現する.SOM・決定木の両方で変更が行えるよ うにする.. 4.1 システム構成 図 2 に全体のシステム構成を示す.本研究で提案す るシステムは,サーバ・クライアント型のシステムと なっている.クライアントは,HTML ファイルに記述 された Java Applet を実行するための Web ブラウザ と,音楽を試聴するための Windows Media Player や. RealOne Player から成る.サーバは,協調フィルタ リング Server と内部 Web Server,そして試聴する音 楽を呼び出す外部 Web Server から成る.協調フィル タリング Server と内部 Web Server は,同じマシンに 存在するものとする.協調フィルタリング Server は,. 図 1 に上記の設計コンセプトを図式化する.本シ ステムではユーザ情報として,評価データとデモグ ラフィックデータを取得する.このうち評価データは, Resnick2) のアルゴリズムに入力することができ,ユー ザはこれまでと同様の推薦を受けることができる.ま た,評価データから SOM を構築することにより,評 価データによるユーザ全体の分類を見せることができ る.ユーザはニューロンを選択することにより,その ニューロン中のユーザを使って,Resnick2) のアルゴ リズムにより,アイテムの推薦を受けることができる. 一方デモグラフィックデータからは,SOM による分 類結果を用いて決定木を作成する.ユーザは,デモグ. CF Engine(Collaborative Filtering Engine),SOM Engine,DT Engine(Decision Tree Engine) の 3 つ の Engine から成る.内部 Web Server には Apache を用い,外部 Web Server は,音楽のサンプルを提供 する任意の Web サイトのサーバとする.. 4.2 システムの利用手順 以下にシステムの利用手順を述べる.システムを初 めて利用するユーザは,トップページから「初めての 利用である」ことを選択し,初期評価値集合を得るた めの音楽に対するアンケートを受け,デモグラフィッ クデータの入力を行う.前者のアンケートの入力画面 では,音楽データベース中からランダムに選択された. 3 −61−.

(4) 図 2 システム構成 Fig. 2 System architecture. 図 4 マップ Fig. 4 Map. 図 3 推薦フレーム Fig. 3 Recommendation frame. 図 5 ツリー Fig. 5 Tree. 曲に対しての曲名とアーティスト名を表示し,ユーザ. くつかのメニューボタンが配置されており,”サイズ. は試聴ボタンを押すことでサンプルデータを視聴でき,. 変更”ボタンにより,3 × 3,5 × 5,7 × 7,10 × 10 の. 5 段階のアンケート評価値をラジオボタンで選択する.. 価値をラジオボタンで選択する.また,この画面の下. 4 種類に SOM の大きさを変更できる.”詳細を見る” ボタンにより,選択したグループの中で,高い評価が 付けられている曲の情報をランキング形式で見ること ができる.”プロファイル置換”ボタンは,今の自分の プロファイルより,自分の好みを表現していると思わ れるグループが見つかれば(特に十分に初期アンケー トを受けなかったユーザ向けの機能),このボタンを 押すことで,自分のユーザプロファイルを選択ニュー ロンの平均評価値で置き換えることができる.”再グ ループ化”ボタンは,ユーザが選択した複数のニュー. 後者のデモグラフィックデータの入力画面では,次章 で示す 9 種類の属性に対する属性値をラジオボタンで 選択する. その次に,ユーザは最初の推薦を受ける.推薦画面 (図 3) では,予測評価値の高い順に 10 曲ずつ音楽が推 薦される.最初のアンケート画面と同様,曲名とアー ティスト名を表示し,ユーザは試聴ボタンを押すこと でサンプルデータを視聴でき,5 段階のアンケート評 部には,次の 10 曲を推薦するボタン,SOM・決定木を. ロンを使って,再び SOM アルゴリズムにより新しい. 表示するボタン,初期画面に戻るボタンがある.ユー. マップを作成することができる.最後に,”再推薦”ボ. ザは,協調フィルタリングの推薦に飽きれば,SOM. タンにより,ユーザは選択したグループから Resnick. と決定木の画面を表示し,近傍ユーザ集合を可視化し. のアルゴリズムにより,新たに曲の推薦を受けること. て,興味のあるグループを探すことができる.. が出来る.. 図 4 に,SOM を表示した時の画面を示す.各ニュー. 図 5 に,決定木の表示画面を示す.葉ノードには,. ロンのラベルには,そのニューロンに属しているユー. 対応する SOM 上のニューロンと同じラベルが表示さ. ザ群が高く評価している音楽ジャンルの割合が付けら. れている.決定木と SOM は互いにリンクしており,. れている.また,その一番割合の多いジャンルによっ. SOM 上でニューロンを選択すれば,決定木上でも対 応する葉ノードが点滅後に強調表示 (色づけ) され,逆. てニューロンが色分けされている.画面下部には,い. 4 −62−.

(5) に決定木上で葉ノードを選択すれば,SOM 上で対応. 表 1 ユーザから取得する属性および属性値 Table 1 Attributes and attribute values acquired from users. するニューロンが点滅後に強調表示 (色づけ) される. これにより,SOM と決定木間の相関を見ることが出 来る.画面下部には,SOM の画面と同じメニューボ タンが並んでおり,SOM の場合と同じ機能を持って. 属性. 属性値. 性別. 男性,女性. 年齢. 10 代未満,10 代,20 代,30 代 40 代,50 代,60 代以上 会社員,公務員,自営業,主婦 学生,パート・アルバイト,その他 既婚,未婚 あり,なし 300 万円未満,300∼500 万円未満 500∼700 万円未満,700∼1000 万円未満 1000 万円以上 邦楽 : J-Pop, アニメ, 演歌, J-indies 洋楽 : Pop/Rock, R&B/HipHop その他 : Jazz, Classic, Movie/Soundtrack やさしい,明るい,まじめ,積極的,几帳面 しっかり,楽天的,おとなしい,社交的,穏やか 車・バイク・ドライブ,音楽,旅行,アウトドア スポーツ,映画・ビデオ,ショッピング,パソコン ファッション,読書,料理・グルメ,ガーデニング アニメ,カラオケ,ペット,ゲーム,その他. いる. 職業. 5. 評 価 実 験. 婚歴 子供の有無. 本章では,提案したシステムによる評価実験を行う. 所得. ことで,ユーザが協調フィルタリングによるデフォル トの推薦に飽きても,グループを指定可能なインタ フェースを用いることで,再度興味を持って推薦を受. 好きな. けることができるか否かを検証する.具体的には,10. 音楽 ジャンル. 曲単位で推薦される曲に対しての発見性と,その推薦. 性格. に対する満足度から評価を行う.発見性とは,後に詳 趣味. 細を述べるが,知らない曲で好きなもの (あるいは知っ ている曲で自分が好きだという認識はないが試聴して 良かったもの) をどれだけ推薦できたかという指標で ある.. アーティスト名,リリース年,音楽ジャンル,CM や. 次に,システム中の各機能の有効性について検証す る.具体的には,SOM と決定木のそれぞれがグルー. TV ドラマのタイアップ,試聴先の URL の情報から. プ選択に有効であったか,SOM と決定木の 2 つを相. 構成される.1000 曲のジャンル構成は,市場の流通量. 互に連携するリンク機能が有効であったかについて検. の大きさを考慮した結果,J-Pop:700 曲,演歌:75. 証を行う.SOM については,SOM 上でグループ間の. 曲,アニメ:75 曲,洋楽:150 曲とした.また J-Pop. 距離に関する特徴 (グループ間の好みが近いほどマッ. や洋楽に関しては,1960 年代から現在に至るまでの. プ上で近い位置に,また遠いほどマップ上の遠い位置. 幅広い楽曲を選択した.これはできる限り多様な人に. に配置されていること) を使ってグループの探索をし. 対して,提案したシステムによる音楽推薦を受けられ. たかどうかにより評価する.決定木については,選定. るようにするためである.デモグラフィックデータの. した属性から興味を持ってグループ探索をしたかどう. 属性の選定は,ユーザから性別・年齢などの個人情報. かにより評価する.そして,リンク機能については,. を取得し,それらをサービス提供のために実際に利用. 推薦を受ける際にこの機能を利用したかどうかにより. している音楽配信サイト,通信販売サイトなど,合計. 調べる.ただし,現段階では被験者の人数が十分でな. 5.1 実 験 準 備. 15 個の商用 Web サイトを参考にして行った.表 1 に 設定した属性および属性値を示す. 5.2 実 験 方 法 実験は,ある程度音楽に興味を持つ 12 名の被験者 に対して行った.ここで実験の手順を説明する.まず,. 本研究では,まず 10 代未満から 60 代以上にわたる. 被験者にはランダムに提示される 200 曲の音楽に対し. いため,SOM と決定木の有効性についてまだ評価が 行えていない.そこで,本稿ではリンク機能について のみ,考察を述べる.. 男性 103 人,女性 57 人の合計 160 人 (10 代未満:2. て 5 段階の評価付けを行ってもらい,続けて 10 種類. 人,10 代:18 人,20 代:90 人,30 代:7 人,40 代:. のデモグラフィックデータを入力してもらう.そして. 11 人,50 代:26 人,60 代以上:6 人) から,音楽の評. 全ての被験者に,以下の実験. 価データとデモグラフィックデータを収集した.具体. 実験. 的には,音楽の評価データは,合計 1000 曲からなる. を行ってもらう.. 本研究で提案したインタフェースを使用しな. いデフォルトの協調フィルタリグによる音楽推薦. 音楽データベース中の 200 曲に対して 5 段階評価 (-2. を受ける.推薦は 10 曲単位で得られるが,その. ∼2) によりアンケートを行った.このアンケートデー. 推薦に対して満足度が”あまり満足できなかった”. タを,Resnick のアルゴリズムのための学習用データ. または”全く満足できなかった”と評価付けするま. とする.音楽データベースは,各楽曲に対する曲名,. で,つまり推薦に飽きるまで続ける.. 5. −63−.

(6) 次に以下の実験 実験. ∼. のいずれか行ってもらう.. 本研究で提案した 2 つのインタフェースを使. 用した音楽推薦を受ける.この実験は,自分が知 らない好みの曲を探すことを目的として行う. 実験. 音楽データベース中からランダムに選択され. た音楽推薦を受ける. 実験. 実験 に続けて協調フィルタリングによる音. 楽推薦を受ける. そして最後にインタフェースの使いやすさに関するア ンケートに答えてもらう. ここで,システムの有効性を検証するのに,協調フィ ルタリングによる推薦に飽きた後に,ランダムでの推. 図 6 精度・発見性の推移 Fig. 6 Transition of precision and discovery rate. 薦と続けて協調フィルタリングを受ける場合と比較し ている.本実験ではユーザが一度推薦に飽きた後も,. ち,これら 3 タイプの曲を合計したものの割合を. さらに提案するインタフェースを使って推薦を受ける. 発見性と定める.. ことで,新たに知らない好み曲を発見できるかどうか. 良い可能性もある.これらのことから,比較対象とし. 5.4 実 験 結 果 5.4.1 精度・発見性による比較 実験 において,被験者の精度と発見性がどのよう に変化していくかを図 6 に示す.ここで各被験者に対 して,実験の期間を前半から後半まで 5 段階に等分に 区切り,各区間ごとの精度と発見性を計算した (例え ば 15 回繰り返して推薦を受けた被験者に対しては,3 回ごとに精度・発見性を計算する).まず精度に注目 すると,前半は 80 %以上と高い数値を示しているが, 徐々に数値が下がっていき,後半は 50 %を下回って. てランダムの推薦と続けて協調フィルタリングを受け. いる.これは,最初はユーザの好みの曲が多く推薦さ. ることを採り上げている.. れるが,推薦を続けていくにつれて,徐々にその割合. 5.3 評価指標について 本研究では,システムを評価するための指標として, 精度および発見性を用いている.以下に各指標につい て説明する. • 精度 : 推薦された曲で被験者によって評価付けさ れたもののうち,5 段階評価 (-2∼2) が 1 以上の 曲の割合を精度と定める. • 発見性 : ユーザが新たな曲を発見するということ. が少なくなっていることを示している.また発見性に. を検証することとしている.しかし,続けて推薦を受 けているため,何らかの曲を発見することは当然であ る.何も提案するインタフェースでなくとも,他の推 薦手法でも同じことは実現できる.問題は,知らない 好み曲をどれだけ発見できたかである.他の推薦手法 としては,現実的には続けて協調フィルタリングを受 けることが挙げられる.しかし,これでは同じような 曲が推薦され続けることが想定されるので,新しい曲 を発見するのであれば,ランダムに推薦を受けた方が. 注目すると,一貫して 10 %を下回る低い数値を示し ている. このように,協調フィルタリングによりユーザの好 みの曲が推薦されるが,既に知っている曲が多くなり がちで,また推薦を繰り返し受けるにつれてその推薦 精度は下がっていってしまうため,結果的にユーザは 推薦に飽きてしまうことが確認できた.. を考えると,曲のタイプには以下の 3 パターンが 挙げられる.. (1) (2) (3). 次に,実験 の後に被験者に受けてもらった実験 ∼. の結果について述べる.各実験別によるユーザご. 以前に聴いたことがあり,好きだという認. との精度の結果を表 2 に,発見性の結果を表 3 に示. 識はなかったが試聴して気に入った曲. す.精度に注目すると,インタフェースを使用して自. 以前に聴いたことはないが,元々自分が好. 分でグループを選択して推薦を受ける方法は,ランダ. きなタイプの曲. ムによる推薦に比べると好みの曲が多く推薦され,協. 以前に聴いたことはないが,試聴して気に. 調フィルタリングと比較してもそれほど精度の低下は. 入った曲. 見られないことがわかる.発見性に注目すると,提案. そこで推薦された曲で被験者によって 5 段階評価. (-2∼2) で 1 以上の評価付けがなされたもののう. したインタフェースを使用した推薦 (実験. ) の発見 性が,平均して 23.94 %と他の推薦方法と比べて高い. 6 −64−.

(7) 表 2 各被験者についての推薦方法別の精度 Table 2 Precision of recommendation in each method and for each subject 実験 CF ユーザ A ユーザ B ユーザ C ユーザ D ユーザ E ユーザ F ユーザ G ユーザ H ユーザ I ユーザ J ユーザ K ユーザ L 平均. 71.66 51.59 61.80 50.00 74.18 72.06 61.38 61.68 64.00 74.67 73.10 74.56 65.89. 実験 IF あり. 実験 ランダム. とが出来る.このリンク機能は,提案したインタフェー スを相互に関連させる一つの大きな特徴である.しか. 実験 続けて CF. し,今回の評価実験では,ユーザはこのリンク機能を. 60.00. 使って推薦を受ける行動を取らなかった.ユーザの意 39.53. 見からは,SOM と決定木を別々のフレームとして表. 61.02. 示させていたため,そのような機能があること自体気. 50.85 34.78. 付かないようであった.以上より,ユーザがリンク機 50.00. 能の存在に気付くように改良することが今後の大きな. 40.00. 課題である.解決案として,同フレーム上に SOM と. 12.24. 決定木の両方を表示させることにより,一目で対応関. 34.69 63.79. 係がわかるようにすることを考えている.. 31.91 53.66. に対応するのか,またその逆はどうであるかを知るこ. 29.61. 6. 関 連 研 究. 43.75 47.37. この章では,協調フィルタリングに関係のある研究 表 3 各被験者についての推薦方法別の発見性. をいくつか紹介する.. Table 3 Discovery rate in each method and for each subject 実験 ユーザ A ユーザ B ユーザ C ユーザ D ユーザ E ユーザ F ユーザ G ユーザ H ユーザ I ユーザ J ユーザ K ユーザ L 平均. CF 2.67 9.52 7.87 9.09 0.00 3.68 0.53 3.74 8.00 2.67 5.52 8.77 5.17. 実験 IF あり 13.33. 実験 ランダム. 協調フィルタリングの概念は,Tapestry6) という システムで提唱され,その後 GroupLens 推薦エンジ. 実験. ン2) により,協調フィルタリングのコア技術となる近. 続けて CF. 傍ユーザ集合に基づく評価予測アルゴリズムが提案 4.65. された.その後続いて開発された Ringo7) ,Bellcore. 1.69. ビデオ推薦システム8) など多くのシステムでは,こ. 27.12 0.00. のアルゴリズムの改良形を採用している.また,予測 2.17. 精度を上げるという観点からの改良だけでなく,1 人. 26.00. のユーザに対してのみでなく,複数のメンバーからな. 2.04. るグループ(閉じた環境に共存するグループ)に協調. 4.08. フィルタリングで音楽の推薦を行う MusicFX9) とい. 29.31 4.26 23.94. 2.74. うシステムも開発されている.しかし,これらの研究. 6.25 3.55. では,アンケートに基づいて嗜好の似たグループを特 定し,そのグループのつけている評価値を用いて評価. 数値を示していることが確認できる.これより,ユー. の高いアイテムを推薦する処理を自動で行う.そのた. ザが自分の知らない好みの曲を探すことを目的とした. め,ユーザは別の観点を持つグループを発見し,興味. 時,自分でグループを指定して推薦を受けることが出. を持てばそのグループを基に推薦を受けようとしても,. 来るインタフェースを使う方が,ランダムに推薦を受. そのような行為を支援することはしていなかった.. けたり,協調フィルタリングによる推薦を受け続ける よりも,知らない好みの曲が見つけやすいといえる. 以上の考察から,ユーザが協調フィルタリングによ. また,協調フィルタリングにコンテンツに基づくフィ ルタリングを組み合わせる研究も数多く提案されてい るが(例えば,PHOAKS10) ,Fab11) ,Good12) らの. る推薦結果に飽きてしまった場合に,他の方法と比べ. 研究,WebWatcher13) ,Pazzani14) らの研究など),. ると提案したインタフェースを使用して推薦を受ける. これは sparsity 問題(評価付けを行うユーザ数が少な. 方が,自分の知らない好みの曲を探す目的には有効で. いと,推薦の予測精度が低下する問題)や first-rater. あると考えられる.. 問題(誰にも評価付けされていない新しいアイテムは. 5.4.2 リンク機能について 3 章で述べたように,SOM 上に作られたあるグルー プは,決定木のある葉ノードのクラスに対応している. そのため,ユーザは SOM 上で選択したあるグループ が,決定木ではどのような属性で分岐された葉ノード. 推薦されない問題)1) を解決することを目的としてお り,近傍グループを可視化するような試みは行ってい ない. これまでの協調フィルタリングの研究では,アイテ ムに対する評価値を入力すれば,後はその推薦結果. 7 −65−.

(8) を受けて,それに対する評価値を付けるまで,ユー ザとのインタラクションは存在しなかった.近年,推 薦結果の出力を工夫したり,ユーザプロファイルを編 集可能なインタフェースを持つものが出てきている.. Herlocker らは,推薦したアイテムにその推薦の根拠 をいくつかの観点から説明付けを行う研究を行ってい る15) .例えば,そのアイテムに対して,他のユーザが どのように評価付けしているかという分布を,ヒスト グラムの形で提示するなどしている.しかし,この研 究でも依然としてユーザは,推薦過程において何らか の操作を行うことはできない.これに対し,ユーザが 協調フィルタリングの推薦結果に操作を行い,ユーザ プロファイルの変更ができるシステム16) が構築され ている.具体的には,アイテムの予測評価値を,アー ティスト別に好みの大きさとなる棒グラフとして提示 し,ユーザはその値を棒グラフの伸縮で操作すること ができる.しかし,このシステムでも,他のユーザが どういった音楽に興味があるのかを知ることが出来た り,推薦の基となるグループを指定したりといった操 作を行うことはできない.. 7. 結論と今後の課題 本研究では,ユーザが直接に推薦の基となるグルー プを指定可能なインタフェースを備える協調フィルタ リングシステムの実装を行った.今後の課題として, 被験者数をさらに増やし,より詳しい評価実験を行い. その後,評価実験の結果をふまえて,システムを改良 していくことを考えている.. 参. 考. 文. 献. 1) 梅木秀雄 : ネットワークコミュニティ形成支援 技術, 人工知能学会誌, Vol.14, No.6, pp. 943-950 (1999). 2) Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P. and Riedl, J. : GroupLens: An Open Architecture for Collaborative Filtering of Netnews, Proc. CSCW’94 , pp. 175-186 (1994). 3) Cabena, P., Hadjinian, P., Stadler, R., Verhees, J. and Zanasi A. : Discovering Data Mining From Concept to Implementation (1997). 4) Kohonen, T. : Self-organization and Associative Memory (2nd Edition), Springer-Verlag (1988). 5) Quinlan, J.R. : C4.5: Programs for Machine Learning, Morgan Kaufmann, San Mateo, CA (1993). 6) Goldberg, D., Nichols, D., Oki, B.M. and Terry, D. : Using Collaborative Filtering to. Weave an Information Tapestry, Comm. ACM , Vol.35, No.12, pp. 61-70 (1992). 7) Shardanand, U. and Maes, P. : Social Information Filtering : Algorithms for Automating ’Word of Mouth’, Proc. CHI’95 , pp. 210-217 (1995). 8) Hill, W., Stead, L., Rosenstein, M. and Furnas, G. : Recommending and Evaluating Choices in a Virtual Community of Use, Proc. CHI’95 , pp. 194-201 (1995). 9) McCarthy, J.F., Anagnost, T.D. : MusicFX : An Arbiter of Group Preferences for Computer Supported Collaborative Workouts, Proc. CSCW’98 , pp. 363-372 (1998). 10) Terveen, L., Hill, W., Amento, B., McDonald, D. and Creter, J. : PHOAKS: A System for Sharing Recommendation, Comm. of the ACM , Vol.40, No.3, pp. 59-62 (1997). 11) Balabanovic, M., and Shoham, Y. : Fab: Content-based Collaborative Recommendation, Comm. of the ACM , Vol.40, No.3, pp. 66-72 (1997). 12) Good, N., Schafer, J.B., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J., and Riedl, J. : Combining Collaborative Filtering with Personal Agents for Better Recommendations, Proceedings of the 1999 Conference of the American Association of Artifical Intelligence (AAAI-99), pp. 439-446 (1999). 13) Joachims, T., Freitag, D., and Mitchell, T. : WebWatcher: A Tour Guide for The World Wide Web, Proc. of the 15th International Joint Conference on Artificial Intelligence, pp. 770-775 (1997). 14) Pazzani, M. : A Framework for Collaborative, Contente-based and Demographic Filtering, Artificial Intelligence Review, pp. 393-408 (1999). 15) Herlocker, J.L., Konstan, J.A. and Riedl, J. : Explaining Collaborative Filtering Recommendations, Proc. CSCW’00 , pp. 241-250 (2000). 16) Terveen, L., McMackin, J., Amento, B. and Hill, W. : Specifying Preferences Based On User History, Proc. CHI’02 , pp.315-322 (2002). 17) Sarwar, B., Karyupis, G., Konstan, J. and Riedl, J. : Item-Based Collaborative Filtering Recommendation Algorithms, Proc. of the 10th international conference on World Wide Web, pp.285-295 (2001).. 8 −66−.

(9)

図 1 設計コンセプト Fig. 1 Design concept
図 2 システム構成 Fig. 2 System architecture
Fig. 6 Transition of precision and discovery rate
表 2 各被験者についての推薦方法別の精度

参照

関連したドキュメント

As soon as an Analytic Engine exists, it will necessarily guide the future course of the

サーバー費用は、Amazon Web Services, Inc.が提供しているAmazon Web Servicesのサーバー利用料とな

■本 社 TEL 〒〇62札幌市豊平医平岸3条5丁目1番18号八ドソンビル ■八ドソン札幌 TEL

Oracle WebLogic Server の脆弱性 CVE-2019-2725 に関する注 意喚起 ISC BIND 9 に対する複数の脆弱性に関する注意喚起 Confluence Server および Confluence

Wärtsilä の合弁会社である韓国 Wärtsilä Hyundai Engine Company Ltd 及び中国 Wärtsilä Qiyao Diesel Company Ltd と CSSC Wärtsilä Engine Co...

• Mirrors, window lift, doors switches, door lock, HVAC motors, control panel, engine sensors, engine cooling fan, seat positioning motors, seat switches, wiper control,

(4) 「舶用品に関する海外調査」では、オランダ及びギリシャにおける救命艇の整備の現状に ついて、IMBVbv 社(ロッテルダム)、Benemar 社(アテネ)、Safety

Next, to investigate the valve train dynamic characteristics, we change the shape of the cam profile, especially the shape of the cam lift-acceleration (jerk) curve as the