協調フィルタリングにおける近傍グループの可視化

全文

(1)2004−DBS−133 （7） 2004−ＦＩ− 75 （7） 2004／5／14. 社団法人情報処理学会研究報告 IPSJ SIG Technical Report. 協調フィルタリングにおける近傍グループの可視化藤. 森洋. 昌†. 土. 方嘉. 徳†. 西田. 正吾†. ユーザの情報獲得を支援する方式の一つとして，協調フィルタリングがある．これはユーザのアイテムに対する嗜好を記録し，そのユーザと似た嗜好を持つ他のユーザグループの情報を基に，未知のアイテムに対するユーザの嗜好を推測する手法である．しかし，協調フィルタリングには，ユーザがこれまでに付けてきた評価値が大きく変わらない限り，毎回同じようなグループが特定され，毎回似たようなアイテムが推薦されてしまうという問題がある．本研究では，この問題に対処するために，ユーザが興味を持ってグループを見つけることができ，そのグループで直接推薦を受けることが出来る協調フィルタリングシステムを提案する．具体的には、協調フィルタリングに必要な評価値行列と、 e-マーケットプレイスで取得されているデモグラフィック情報から，自己組織化マップと決定木を用いた近傍グループ可視化インタフェースを構築する．. Visualizing Neighborhood for Collaborative Filtering Hiromasa Fujimori,† Yoshinori Hijikata† and Shogo Nishida† Collaborative Filtering is one of the method for helping users to acquire information. This method firstly records the user’s rating for each item. Then new items are recommended to the user based on the user’s ratings and other user’s ratings who have similar preferences. Thid method has a problem that while the user’s rating histories do not change largely, similar groups are specified and similar items are recommended every time. In our research, we propose a collaborative filtering system that visualizes the neighborhood and allows the user to directly select some groups and get a recommendation from the groups. Concretely speaking, we construct a visualizing interface using self-organizing map and decision tree created by rating matrix and demographic data.. 1. はじめに. は，単にアイテムを推薦してくれるだけでなく，ユーザは「自分と同じような嗜好を持つ人達は，どういう. ネットワークの普及で多くの情報にアクセスできる. アイテムを気に入っているのか？」ということを知る. ようになった反面，大量の情報から目的の情報を探す. ことができ，一種のエンタテインメント性を持ってい. ことが困難であるという情報洪水の問題が取りだたさ. る点が，他の情報フィルタリング方式と異なるところ. れている．この情報洪水に対処する手法の 1 つに協調. である．. フィルタリングがある．協調フィルタリングとは，他. ここで，協調フィルタリングの基本アルゴリズムの 1 つとして現在広く利用されている Resnick2) の近傍ユーザ集合に基づく評価予測アルゴリズムについて説明する．このアルゴリズムの手順は，(i) 注目してい. 人の興味に関する情報を利用して，コンテンツや商品. (以降，これらをアイテムと呼ぶ) を推薦する技術である1) ．現在，この技術を使ったシステムは書籍，音楽 CD，映画，文房具，薬，カタログ商品などの商品を扱う多くの商用 Web サイトで利用されている．現在の協調フィルタリングシステムの多くは，ユーザがアイテムに対して付けた評価値の統計量に基づいて，そのユーザと近い好みを持つグループを特定し，そのグループが高く評価しているアイテムをユーザに推薦している．そのため協調フィルタリングシステム † 大阪大学大学院基礎工学研究科 Graduate School of Engineering University. るユーザ (active user) 以外の全てのユーザとの評価値分布の相関 (類似度) を求め，(ii) 比較可能なユーザ部分集合を選び，(iii) 選ばれたユーザ部分集合が付けた評価値の重みつき和によって，あるアイテムに対するそのユーザの予想評価値を求める，というものである．具体的には，ユーザ u(1∼m) のアイテム i(1∼. n) に対する評価値 (rating)rui は，以下のような行列で表現できる．. Science,. Osaka. −59−.

(2)  u. i r11.   r21  .  .  . rm1. r12 r22 .. . rm2. ··· ··· .. . ···. r1n r2n .. . rmn. ズムを基本として，ユーザが直接に推薦の基となるグ. . ループを指定可能なインタフェースを備える協調フィ.     . ルタリングシステムを開発する．. 2. ユーザ情報と本研究の方法論一般的に協調フィルタリングを行う Web サイトに. このとき，Resnick は rui に対する予測値 pui を. て入手しているユーザ情報には，評価データとデモグ. m. (roi − r¯u ) ∗ wu,o o=1 m pui = r¯u + (1) |wu,o | o=1 と表し，ユーザ u と o との類似度 wu,o ∈ [−1, 1] をピアソン相関 (Pearson correlation). (ruk − r¯u )(rok − r¯o ) k=1. ムに対する評価値である．デモグラフィックデータとは，性別，年齢などその人の持つ特質を表すデータのことであり，多くの e-マーケットプレイスで取得され. n. wu,o =. ラフィックデータの 2 つがある．評価データとは，ユーザから 5 段階のアンケート形式などで得られるアイテ. ている3) ．本研究では，これら 2 種類のデータに対し. σu σo. てグループの可視化を試みる．. を用いて求める．ここで， r¯u はユーザ u の平均評価. n r を示し， σu は評値 (average rating) r¯u = i=1 ui n 2 2 価 rui の標準偏差 σu =. (r − r¯u ) を示す． i=1 ui 現在の協調フィルタリングシステムの多くは， Resnick2) のアルゴリズム及びその改良型を基本としているが，これらの方法には 1 つの問題点がある．これらの方法は，推薦の基となるグループを自動的に選択していると見ることができるが，逆に言えば，もしユーザに見せれば興味を持つグループが存在していたとしても，それを発見しさらに選択するような手段を持たないことになる．推薦を受ける基となるグループの選択ができなければ，ユーザがこれまでに付けて. 最初の評価データに対しては，コホーネンの自己組織化 Feature マップ (以降，これを Self-Organizing. Map:SOM と呼ぶ)4) を使ってグループの可視化を行う．SOM とは，雑然とした情報群の中からいくつかの特徴を見つけ出し，その特徴によってデータをグループに分類し，それらのグループを 2 次元のマップ上に配置するものである．分類により作られたグループのラベルには，例えばグループ内で最頻出のアイテム名や，アイテムのジャンル名を付けたりすることができる．データ同士の関係は 2 次元平面上の距離として表され，視覚的に理解しやすく，自分がどのグループにいるかはマップを見れば一目瞭然である．. きた評価値が大きく変わらない限り，毎回同じような. 2 つ目のデモグラフィックデータに対しては，決定. グループが特定され，毎回似たようなアイテムが推薦. 木を使ってグループの可視化を行う．決定木とは，各. されてしまう．その結果，ユーザはすぐにその推薦結. ノードに設定されたテストによりデータを分類させ，. 果に飽きてしまい，サービスを使わなくなってしまう. 各葉ノードにクラスとしてグループ化したデータを配. 可能性がある．このことは，協調フィルタリングシス. 置するものである．根ノードから木を順にたどること. テムを使用している Web サイトにとっては，リピー. で，自分がどんな属性を持つグループにいるかわかる. タを失うことにつながる恐れがある．. ようになっており，グループの理解は容易である．. ユーザがデフォルトの推薦に飽きても，「自分が属さ. 本研究では，以上述べた 2 つの方法を相互に組み合. ないあるグループの人は，どういったアイテムに興味. わせることで，ユーザが様々な角度から興味を持って. を持っているか？」や「評価データ以外のデータ（例. グループを指定可能なインタフェースを構築すること. えば，性別や年齢，職業などのデモグラフィック情報）. を目指す．. でグループ化すると，あるグループの人達はどういっ. 3. 設計コンセプト. たアイテムに興味を持っているか？」というような幅広い推薦が受けられれば，ユーザはその Web サイト. 本研究では，グループの可視化とその選択を容易と. を利用し続けるものと思われる．つまり，システムが. するために，SOM と決定木を使うことにした．しか. グループをうまく視覚化してやり，ユーザが容易にグ. し，これらが単に独立に機能しているだけでは，これ. ループを直接操作できるような機能を提供することに. らの利点を最大限に引き出しているとは言えない．そ. よって，このようなより付加価値の高いサービスを実. こで，本研究における協調フィルタリングシステムで. 現することが可能になると考えられる．. は，Resnick のアルゴリズム，SOM，決定木の 3 つ. 2). そこで，本研究では一般的な Resnick. のアルゴリ. の方法論を有機的に連携させる以下の設計コンセプト. 2 −60−.

(3) ラフィックデータのどの要素がユーザの分類に寄与し 1. N. ているのかを確認することができる．これも SOM と. A B. 同様，葉ノードを選択することで葉ノード中のユーザを使って，Resnick2) のアルゴリズムによりアイテム. M. の推薦を受けることができる．. SOM のニューロンと決定木の葉ノード間にはリンクが張ってあり，SOM の分類を見た後，その分類を決定付ける社会的要素を見るために決定木を見たり，逆にユーザの社会的要素で分類されたグループは，アイテムに対する嗜好で分類するとどこに位置づけされるかなどを見ることができる．具体的には，SOM 図1 Fig. 1. のニューロンをクリックすれば，対応する決定木の葉. 設計コンセプト Design concept. ノードとそこに至る根ノードからのパスが点滅後，強調表示されるような見せ方が考えられる．またこの場. を採ることとする．. 合，逆に決定木の葉ノードをクリックすると，対応す. • SOM または決定木で分類されたグループを使っ. る SOM のニューロンが点滅後，強調表示される．ま. てアイテムを推薦する機能. た，SOM または決定木の分類を見て，自分の入力し. ユーザがいくつか選択した SOM 上のニューロン. た嗜好よりもより自分の嗜好を表現していそうな評価. または決定木上の葉ノードから新たにアイテムを. 値を持つユーザまたはグループが見つかれば，その評. 推薦する．予測評価値 pui の算出は，Resnick2) の. 価値を使って自分の評価値ベクトルを更新することも. アルゴリズム (1) 式において o を SOM のニュー. できる．. ロンまたは決定木の葉ノード中のユーザとして，. 4. システム設計. 類似度 wu,o を 1 として計算する．. • 評価値による分類とデモグラフィックデータによる分類の相関を見ることができる機能これは，SOM で作られたグループを，決定木の葉ノードのクラスに対応させることで実現する． • ユーザプロファイルを変更できる機能これは，評価データに相当するプロファイルのベクトルデータを，気に入ったグループを代表したある 1 人のユーザの評価値で置き換えることで実現する．SOM・決定木の両方で変更が行えるようにする．. 4.1 システム構成図 2 に全体のシステム構成を示す．本研究で提案するシステムは，サーバ・クライアント型のシステムとなっている．クライアントは，HTML ファイルに記述された Java Applet を実行するための Web ブラウザと，音楽を試聴するための Windows Media Player や. RealOne Player から成る．サーバは，協調フィルタリング Server と内部 Web Server，そして試聴する音楽を呼び出す外部 Web Server から成る．協調フィルタリング Server と内部 Web Server は，同じマシンに存在するものとする．協調フィルタリング Server は，. 図 1 に上記の設計コンセプトを図式化する．本システムではユーザ情報として，評価データとデモグラフィックデータを取得する．このうち評価データは， Resnick2) のアルゴリズムに入力することができ，ユーザはこれまでと同様の推薦を受けることができる．また，評価データから SOM を構築することにより，評価データによるユーザ全体の分類を見せることができる．ユーザはニューロンを選択することにより，そのニューロン中のユーザを使って，Resnick2) のアルゴリズムにより，アイテムの推薦を受けることができる．一方デモグラフィックデータからは，SOM による分類結果を用いて決定木を作成する．ユーザは，デモグ. CF Engine(Collaborative Filtering Engine)，SOM Engine，DT Engine(Decision Tree Engine) の 3 つの Engine から成る．内部 Web Server には Apache を用い，外部 Web Server は，音楽のサンプルを提供する任意の Web サイトのサーバとする．. 4.2 システムの利用手順以下にシステムの利用手順を述べる．システムを初めて利用するユーザは，トップページから「初めての利用である」ことを選択し，初期評価値集合を得るための音楽に対するアンケートを受け，デモグラフィックデータの入力を行う．前者のアンケートの入力画面では，音楽データベース中からランダムに選択された. 3 −61−.

(4) 図 2 システム構成 Fig. 2 System architecture. 図 4 マップ Fig. 4 Map. 図 3 推薦フレーム Fig. 3 Recommendation frame. 図 5 ツリー Fig. 5 Tree. 曲に対しての曲名とアーティスト名を表示し，ユーザ. くつかのメニューボタンが配置されており，”サイズ. は試聴ボタンを押すことでサンプルデータを視聴でき，. 変更”ボタンにより，3 × 3，5 × 5，7 × 7，10 × 10 の. 5 段階のアンケート評価値をラジオボタンで選択する．. 価値をラジオボタンで選択する．また，この画面の下. 4 種類に SOM の大きさを変更できる．”詳細を見る” ボタンにより，選択したグループの中で，高い評価が付けられている曲の情報をランキング形式で見ることができる．”プロファイル置換”ボタンは，今の自分のプロファイルより，自分の好みを表現していると思われるグループが見つかれば（特に十分に初期アンケートを受けなかったユーザ向けの機能），このボタンを押すことで，自分のユーザプロファイルを選択ニューロンの平均評価値で置き換えることができる．”再グループ化”ボタンは，ユーザが選択した複数のニュー. 後者のデモグラフィックデータの入力画面では，次章で示す 9 種類の属性に対する属性値をラジオボタンで選択する．その次に，ユーザは最初の推薦を受ける．推薦画面（図 3) では，予測評価値の高い順に 10 曲ずつ音楽が推薦される．最初のアンケート画面と同様，曲名とアーティスト名を表示し，ユーザは試聴ボタンを押すことでサンプルデータを視聴でき，5 段階のアンケート評部には，次の 10 曲を推薦するボタン，SOM・決定木を. ロンを使って，再び SOM アルゴリズムにより新しい. 表示するボタン，初期画面に戻るボタンがある．ユー. マップを作成することができる．最後に，”再推薦”ボ. ザは，協調フィルタリングの推薦に飽きれば，SOM. タンにより，ユーザは選択したグループから Resnick. と決定木の画面を表示し，近傍ユーザ集合を可視化し. のアルゴリズムにより，新たに曲の推薦を受けること. て，興味のあるグループを探すことができる．. が出来る．. 図 4 に，SOM を表示した時の画面を示す．各ニュー. 図 5 に，決定木の表示画面を示す．葉ノードには，. ロンのラベルには，そのニューロンに属しているユー. 対応する SOM 上のニューロンと同じラベルが表示さ. ザ群が高く評価している音楽ジャンルの割合が付けら. れている．決定木と SOM は互いにリンクしており，. れている．また，その一番割合の多いジャンルによっ. SOM 上でニューロンを選択すれば，決定木上でも対応する葉ノードが点滅後に強調表示 (色づけ) され，逆. てニューロンが色分けされている．画面下部には，い. 4 −62−.

(5) に決定木上で葉ノードを選択すれば，SOM 上で対応. 表 1 ユーザから取得する属性および属性値 Table 1 Attributes and attribute values acquired from users. するニューロンが点滅後に強調表示 (色づけ) される．これにより，SOM と決定木間の相関を見ることが出来る．画面下部には，SOM の画面と同じメニューボタンが並んでおり，SOM の場合と同じ機能を持って. 属性. 属性値. 性別. 男性，女性. 年齢. 10 代未満，10 代，20 代，30 代 40 代，50 代，60 代以上会社員，公務員，自営業，主婦学生，パート・アルバイト，その他既婚，未婚あり，なし 300 万円未満，300∼500 万円未満 500∼700 万円未満，700∼1000 万円未満 1000 万円以上邦楽 : J-Pop, アニメ, 演歌, J-indies 洋楽 : Pop/Rock, R&B/HipHop その他 : Jazz, Classic, Movie/Soundtrack やさしい，明るい，まじめ，積極的，几帳面しっかり，楽天的，おとなしい，社交的，穏やか車・バイク・ドライブ，音楽，旅行，アウトドアスポーツ，映画・ビデオ，ショッピング，パソコンファッション，読書，料理・グルメ，ガーデニングアニメ，カラオケ，ペット，ゲーム，その他. いる．職業. 5. 評価実験. 婚歴子供の有無. 本章では，提案したシステムによる評価実験を行う. 所得. ことで，ユーザが協調フィルタリングによるデフォルトの推薦に飽きても，グループを指定可能なインタフェースを用いることで，再度興味を持って推薦を受. 好きな. けることができるか否かを検証する．具体的には，10. 音楽ジャンル. 曲単位で推薦される曲に対しての発見性と，その推薦. 性格. に対する満足度から評価を行う．発見性とは，後に詳趣味. 細を述べるが，知らない曲で好きなもの (あるいは知っている曲で自分が好きだという認識はないが試聴して良かったもの) をどれだけ推薦できたかという指標である．. アーティスト名，リリース年，音楽ジャンル，CM や. 次に，システム中の各機能の有効性について検証する．具体的には，SOM と決定木のそれぞれがグルー. TV ドラマのタイアップ，試聴先の URL の情報から. プ選択に有効であったか，SOM と決定木の 2 つを相. 構成される．1000 曲のジャンル構成は，市場の流通量. 互に連携するリンク機能が有効であったかについて検. の大きさを考慮した結果，J-Pop：700 曲，演歌：75. 証を行う．SOM については，SOM 上でグループ間の. 曲，アニメ：75 曲，洋楽：150 曲とした．また J-Pop. 距離に関する特徴 (グループ間の好みが近いほどマッ. や洋楽に関しては，1960 年代から現在に至るまでの. プ上で近い位置に，また遠いほどマップ上の遠い位置. 幅広い楽曲を選択した．これはできる限り多様な人に. に配置されていること) を使ってグループの探索をし. 対して，提案したシステムによる音楽推薦を受けられ. たかどうかにより評価する．決定木については，選定. るようにするためである．デモグラフィックデータの. した属性から興味を持ってグループ探索をしたかどう. 属性の選定は，ユーザから性別・年齢などの個人情報. かにより評価する．そして，リンク機能については，. を取得し，それらをサービス提供のために実際に利用. 推薦を受ける際にこの機能を利用したかどうかにより. している音楽配信サイト，通信販売サイトなど，合計. 調べる．ただし，現段階では被験者の人数が十分でな. 5.1 実験準備. 15 個の商用 Web サイトを参考にして行った．表 1 に設定した属性および属性値を示す． 5.2 実験方法実験は，ある程度音楽に興味を持つ 12 名の被験者に対して行った．ここで実験の手順を説明する．まず，. 本研究では，まず 10 代未満から 60 代以上にわたる. 被験者にはランダムに提示される 200 曲の音楽に対し. いため，SOM と決定木の有効性についてまだ評価が行えていない．そこで，本稿ではリンク機能についてのみ，考察を述べる．. 男性 103 人，女性 57 人の合計 160 人 (10 代未満：2. て 5 段階の評価付けを行ってもらい，続けて 10 種類. 人，10 代：18 人，20 代：90 人，30 代：7 人，40 代：. のデモグラフィックデータを入力してもらう．そして. 11 人，50 代：26 人，60 代以上：6 人) から，音楽の評. 全ての被験者に，以下の実験. 価データとデモグラフィックデータを収集した．具体. 実験. 的には，音楽の評価データは，合計 1000 曲からなる. を行ってもらう．. 本研究で提案したインタフェースを使用しな. いデフォルトの協調フィルタリグによる音楽推薦. 音楽データベース中の 200 曲に対して 5 段階評価 (-2. を受ける．推薦は 10 曲単位で得られるが，その. ∼2) によりアンケートを行った．このアンケートデー. 推薦に対して満足度が”あまり満足できなかった”. タを，Resnick のアルゴリズムのための学習用データ. または”全く満足できなかった”と評価付けするま. とする．音楽データベースは，各楽曲に対する曲名，. で，つまり推薦に飽きるまで続ける．. 5. −63−.

(6) 次に以下の実験実験. ∼. のいずれか行ってもらう．. 本研究で提案した 2 つのインタフェースを使. 用した音楽推薦を受ける．この実験は，自分が知らない好みの曲を探すことを目的として行う．実験. 音楽データベース中からランダムに選択され. た音楽推薦を受ける．実験. 実験に続けて協調フィルタリングによる音. 楽推薦を受ける．そして最後にインタフェースの使いやすさに関するアンケートに答えてもらう．ここで，システムの有効性を検証するのに，協調フィルタリングによる推薦に飽きた後に，ランダムでの推. 図 6 精度・発見性の推移 Fig. 6 Transition of precision and discovery rate. 薦と続けて協調フィルタリングを受ける場合と比較している．本実験ではユーザが一度推薦に飽きた後も，. ち，これら 3 タイプの曲を合計したものの割合を. さらに提案するインタフェースを使って推薦を受ける. 発見性と定める．. ことで，新たに知らない好み曲を発見できるかどうか. 良い可能性もある．これらのことから，比較対象とし. 5.4 実験結果 5.4.1 精度・発見性による比較実験において，被験者の精度と発見性がどのように変化していくかを図 6 に示す．ここで各被験者に対して，実験の期間を前半から後半まで 5 段階に等分に区切り，各区間ごとの精度と発見性を計算した (例えば 15 回繰り返して推薦を受けた被験者に対しては，3 回ごとに精度・発見性を計算する)．まず精度に注目すると，前半は 80 ％以上と高い数値を示しているが，徐々に数値が下がっていき，後半は 50 ％を下回って. てランダムの推薦と続けて協調フィルタリングを受け. いる．これは，最初はユーザの好みの曲が多く推薦さ. ることを採り上げている．. れるが，推薦を続けていくにつれて，徐々にその割合. 5.3 評価指標について本研究では，システムを評価するための指標として，精度および発見性を用いている．以下に各指標について説明する． • 精度 : 推薦された曲で被験者によって評価付けされたもののうち，5 段階評価 (-2∼2) が 1 以上の曲の割合を精度と定める． • 発見性 : ユーザが新たな曲を発見するということ. が少なくなっていることを示している．また発見性に. を検証することとしている．しかし，続けて推薦を受けているため，何らかの曲を発見することは当然である．何も提案するインタフェースでなくとも，他の推薦手法でも同じことは実現できる．問題は，知らない好み曲をどれだけ発見できたかである．他の推薦手法としては，現実的には続けて協調フィルタリングを受けることが挙げられる．しかし，これでは同じような曲が推薦され続けることが想定されるので，新しい曲を発見するのであれば，ランダムに推薦を受けた方が. 注目すると，一貫して 10 ％を下回る低い数値を示している．このように，協調フィルタリングによりユーザの好みの曲が推薦されるが，既に知っている曲が多くなりがちで，また推薦を繰り返し受けるにつれてその推薦精度は下がっていってしまうため，結果的にユーザは推薦に飽きてしまうことが確認できた．. を考えると，曲のタイプには以下の 3 パターンが挙げられる．. (1) (2) (3). 次に，実験の後に被験者に受けてもらった実験 ∼. の結果について述べる．各実験別によるユーザご. 以前に聴いたことがあり，好きだという認. との精度の結果を表 2 に，発見性の結果を表 3 に示. 識はなかったが試聴して気に入った曲. す．精度に注目すると，インタフェースを使用して自. 以前に聴いたことはないが，元々自分が好. 分でグループを選択して推薦を受ける方法は，ランダ. きなタイプの曲. ムによる推薦に比べると好みの曲が多く推薦され，協. 以前に聴いたことはないが，試聴して気に. 調フィルタリングと比較してもそれほど精度の低下は. 入った曲. 見られないことがわかる．発見性に注目すると，提案. そこで推薦された曲で被験者によって 5 段階評価. (-2∼2) で 1 以上の評価付けがなされたもののう. したインタフェースを使用した推薦 (実験. ) の発見性が，平均して 23.94 ％と他の推薦方法と比べて高い. 6 −64−.

(7) 表 2 各被験者についての推薦方法別の精度 Table 2 Precision of recommendation in each method and for each subject 実験 CF ユーザ A ユーザ B ユーザ C ユーザ D ユーザ E ユーザ F ユーザ G ユーザ H ユーザ I ユーザ J ユーザ K ユーザ L 平均. 71.66 51.59 61.80 50.00 74.18 72.06 61.38 61.68 64.00 74.67 73.10 74.56 65.89. 実験 IF あり. 実験ランダム. とが出来る．このリンク機能は，提案したインタフェースを相互に関連させる一つの大きな特徴である．しか. 実験続けて CF. し，今回の評価実験では，ユーザはこのリンク機能を. 60.00. 使って推薦を受ける行動を取らなかった．ユーザの意 39.53. 見からは，SOM と決定木を別々のフレームとして表. 61.02. 示させていたため，そのような機能があること自体気. 50.85 34.78. 付かないようであった．以上より，ユーザがリンク機 50.00. 能の存在に気付くように改良することが今後の大きな. 40.00. 課題である．解決案として，同フレーム上に SOM と. 12.24. 決定木の両方を表示させることにより，一目で対応関. 34.69 63.79. 係がわかるようにすることを考えている．. 31.91 53.66. に対応するのか，またその逆はどうであるかを知るこ. 29.61. 6. 関連研究. 43.75 47.37. この章では，協調フィルタリングに関係のある研究表 3 各被験者についての推薦方法別の発見性. をいくつか紹介する．. Table 3 Discovery rate in each method and for each subject 実験ユーザ A ユーザ B ユーザ C ユーザ D ユーザ E ユーザ F ユーザ G ユーザ H ユーザ I ユーザ J ユーザ K ユーザ L 平均. CF 2.67 9.52 7.87 9.09 0.00 3.68 0.53 3.74 8.00 2.67 5.52 8.77 5.17. 実験 IF あり 13.33. 実験ランダム. 協調フィルタリングの概念は，Tapestry6) というシステムで提唱され，その後 GroupLens 推薦エンジ. 実験. ン2) により，協調フィルタリングのコア技術となる近. 続けて CF. 傍ユーザ集合に基づく評価予測アルゴリズムが提案 4.65. された．その後続いて開発された Ringo7) ，Bellcore. 1.69. ビデオ推薦システム8) など多くのシステムでは，こ. 27.12 0.00. のアルゴリズムの改良形を採用している．また，予測 2.17. 精度を上げるという観点からの改良だけでなく，1 人. 26.00. のユーザに対してのみでなく，複数のメンバーからな. 2.04. るグループ（閉じた環境に共存するグループ）に協調. 4.08. フィルタリングで音楽の推薦を行う MusicFX9) とい. 29.31 4.26 23.94. 2.74. うシステムも開発されている．しかし，これらの研究. 6.25 3.55. では，アンケートに基づいて嗜好の似たグループを特定し，そのグループのつけている評価値を用いて評価. 数値を示していることが確認できる．これより，ユー. の高いアイテムを推薦する処理を自動で行う．そのた. ザが自分の知らない好みの曲を探すことを目的とした. め，ユーザは別の観点を持つグループを発見し，興味. 時，自分でグループを指定して推薦を受けることが出. を持てばそのグループを基に推薦を受けようとしても，. 来るインタフェースを使う方が，ランダムに推薦を受. そのような行為を支援することはしていなかった．. けたり，協調フィルタリングによる推薦を受け続けるよりも，知らない好みの曲が見つけやすいといえる．以上の考察から，ユーザが協調フィルタリングによ. また，協調フィルタリングにコンテンツに基づくフィルタリングを組み合わせる研究も数多く提案されているが（例えば，PHOAKS10) ，Fab11) ，Good12) らの. る推薦結果に飽きてしまった場合に，他の方法と比べ. 研究，WebWatcher13) ，Pazzani14) らの研究など），. ると提案したインタフェースを使用して推薦を受ける. これは sparsity 問題（評価付けを行うユーザ数が少な. 方が，自分の知らない好みの曲を探す目的には有効で. いと，推薦の予測精度が低下する問題）や first-rater. あると考えられる．. 問題（誰にも評価付けされていない新しいアイテムは. 5.4.2 リンク機能について 3 章で述べたように，SOM 上に作られたあるグループは，決定木のある葉ノードのクラスに対応している．そのため，ユーザは SOM 上で選択したあるグループが，決定木ではどのような属性で分岐された葉ノード. 推薦されない問題）1) を解決することを目的としており，近傍グループを可視化するような試みは行っていない．これまでの協調フィルタリングの研究では，アイテムに対する評価値を入力すれば，後はその推薦結果. 7 −65−.

(8) を受けて，それに対する評価値を付けるまで，ユーザとのインタラクションは存在しなかった．近年，推薦結果の出力を工夫したり，ユーザプロファイルを編集可能なインタフェースを持つものが出てきている．. Herlocker らは，推薦したアイテムにその推薦の根拠をいくつかの観点から説明付けを行う研究を行っている15) ．例えば，そのアイテムに対して，他のユーザがどのように評価付けしているかという分布を，ヒストグラムの形で提示するなどしている．しかし，この研究でも依然としてユーザは，推薦過程において何らかの操作を行うことはできない．これに対し，ユーザが協調フィルタリングの推薦結果に操作を行い，ユーザプロファイルの変更ができるシステム16) が構築されている．具体的には，アイテムの予測評価値を，アーティスト別に好みの大きさとなる棒グラフとして提示し，ユーザはその値を棒グラフの伸縮で操作することができる．しかし，このシステムでも，他のユーザがどういった音楽に興味があるのかを知ることが出来たり，推薦の基となるグループを指定したりといった操作を行うことはできない．. 7. 結論と今後の課題本研究では，ユーザが直接に推薦の基となるグループを指定可能なインタフェースを備える協調フィルタリングシステムの実装を行った．今後の課題として，被験者数をさらに増やし，より詳しい評価実験を行い．その後，評価実験の結果をふまえて，システムを改良していくことを考えている．. 参. 考. 文. 献. 1) 梅木秀雄 : ネットワークコミュニティ形成支援技術, 人工知能学会誌, Vol.14, No.6, pp. 943-950 (1999). 2) Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P. and Riedl, J. : GroupLens: An Open Architecture for Collaborative Filtering of Netnews, Proc. CSCW’94 , pp. 175-186 (1994). 3) Cabena, P., Hadjinian, P., Stadler, R., Verhees, J. and Zanasi A. : Discovering Data Mining From Concept to Implementation (1997). 4) Kohonen, T. : Self-organization and Associative Memory (2nd Edition), Springer-Verlag (1988). 5) Quinlan, J.R. : C4.5: Programs for Machine Learning, Morgan Kaufmann, San Mateo, CA (1993). 6) Goldberg, D., Nichols, D., Oki, B.M. and Terry, D. : Using Collaborative Filtering to. Weave an Information Tapestry, Comm. ACM , Vol.35, No.12, pp. 61-70 (1992). 7) Shardanand, U. and Maes, P. : Social Information Filtering : Algorithms for Automating ’Word of Mouth’, Proc. CHI’95 , pp. 210-217 (1995). 8) Hill, W., Stead, L., Rosenstein, M. and Furnas, G. : Recommending and Evaluating Choices in a Virtual Community of Use, Proc. CHI’95 , pp. 194-201 (1995). 9) McCarthy, J.F., Anagnost, T.D. : MusicFX : An Arbiter of Group Preferences for Computer Supported Collaborative Workouts, Proc. CSCW’98 , pp. 363-372 (1998). 10) Terveen, L., Hill, W., Amento, B., McDonald, D. and Creter, J. : PHOAKS: A System for Sharing Recommendation, Comm. of the ACM , Vol.40, No.3, pp. 59-62 (1997). 11) Balabanovic, M., and Shoham, Y. : Fab: Content-based Collaborative Recommendation, Comm. of the ACM , Vol.40, No.3, pp. 66-72 (1997). 12) Good, N., Schafer, J.B., Konstan, J., Borchers, A., Sarwar, B., Herlocker, J., and Riedl, J. : Combining Collaborative Filtering with Personal Agents for Better Recommendations, Proceedings of the 1999 Conference of the American Association of Artifical Intelligence (AAAI-99), pp. 439-446 (1999). 13) Joachims, T., Freitag, D., and Mitchell, T. : WebWatcher: A Tour Guide for The World Wide Web, Proc. of the 15th International Joint Conference on Artificial Intelligence, pp. 770-775 (1997). 14) Pazzani, M. : A Framework for Collaborative, Contente-based and Demographic Filtering, Artificial Intelligence Review, pp. 393-408 (1999). 15) Herlocker, J.L., Konstan, J.A. and Riedl, J. : Explaining Collaborative Filtering Recommendations, Proc. CSCW’00 , pp. 241-250 (2000). 16) Terveen, L., McMackin, J., Amento, B. and Hill, W. : Specifying Preferences Based On User History, Proc. CHI’02 , pp.315-322 (2002). 17) Sarwar, B., Karyupis, G., Konstan, J. and Riedl, J. : Item-Based Collaborative Filtering Recommendation Algorithms, Proc. of the 10th international conference on World Wide Web, pp.285-295 (2001).. 8 −66−.

(9)