• 検索結果がありません。

新技術説明会 様式例

N/A
N/A
Protected

Academic year: 2021

シェア "新技術説明会 様式例"

Copied!
24
0
0

読み込み中.... (全文を見る)

全文

(1)

履歴情報の分類と匿名化に基づく

個人好みの情報推薦モデル

大阪府立大学 大学院 工学研究科 准教授 本多 克宏

(2)

研究背景

• 情報氾濫の昨今、ユーザをいかにして嗜好に

合致したコンテンツと結び付けるか、が大きな

問題'高度コンテンツ創造流通への課題(。

• ヒトごとに異なる嗜好に合致した「

個人好みの

推薦

」を行う協調フィルタリング。

⇒通販サイト・アマゾンなどで実用化。

• 情報コンテンツが多種・大量・多様化する中で、

「個人好みの推薦」 機構のより広範な普及が

必要かつ期待されている。

(3)

情報フィルタリングとe-commerce

ユーザ満足度の向上 & 購買機会の向上

個人好み の推薦 履歴から •通販サイト・アマゾンのおすすめモデル

(4)

協調フィルタリングシステム

膨大な量の情報から利用者にあった情報を推薦する技術 データ行列中の未評価値,すなわち欠測値を推定する •評価値行列・・・アイテムに対するユーザの評価値 囲碁 将棋 園芸 テニス 太郎 5 5 4 花子 2 5 3 雄三 2 1 2 純一 5 1 5 欠測要素 予測値が大きけ れば推薦する

(5)

従来技術 ⇒ 疑似的なくちコミ

'アマゾンでも類似のモデル(

囲碁 将棋 園芸 テニス 太郎 5 5 4 花子 2 5 3 雄三 2 1 2 純一 5 1 5 '1(全ユーザと 類似度算出 友達の探索 '2(似たユーザを重視した平均化 友達の意見の参照

全てのユーザの履歴と比較して推薦

⇒全履歴の保持と推薦アイテム探索を一元化

(6)

従来技術の問題点

既に実用化されているものには、通販サイト・ア

マゾンによる「おすすめモデル」等があるが、

大量の履歴データを保持する必要

推薦探索に大規模な計算時間が必要

個人履歴の保持による情報セキュリティ

高性能・高コストな専用サーバが必要

という問題があり、安価で利便性の高いサービ

スとして普及するまでには至っていない。

(7)

新技術の特徴・従来技術との比較

• 従来技術の問題点であった、「専用サーバの

必要性」を改善することに成功した。

• 従来は高性能な専用サーバを持つ業者によ

る使用に限られていたが、

低コストでの運用

や外部への委託運営が可能

となった。

• 本技術の適用により、「個人の好みにあった

推薦」のプラットフォームの販売・普及と、それ

を利用した新規サービスの開拓が期待される。

(8)

新技術の基となる研究成果・技術

• クラスター分析によるデータマイニング

大規模データを似たもの同士のグループに要約 ⇒データに埋もれた知識の抽出 2010年度日本知能情報ファジィ学会 著述賞 受賞

• POS'販売情報(データの解析への応用

天候や暦の来客数への影響の店舗間比較分析 ⇒季節による特性の違いから店舗間の相違を分析 OSK POSデータ 売れ行き予測 仕入れ計画

(9)

• 駐車場監視カメラからの空き判別への応用

監視カメラ画像から空きスペースを高精度に探索

⇒既存の監視カメラを利用したシステムとして実用化

2011年度日本知能情報ファジィ学会 論文賞 受賞

(10)

新技術の内容の紹介

• ユーザとアイテムのグループ化による推薦

ユーザ・ アイテムの 対を推定

共クラスター構造として情報を圧縮・利用

(11)

認知科学の知見を取り入れたクラスタリングモデル

• いくつかのグループに分割 することで,グラフ構造'自 己の認知体系(が均衡化 • 購買履歴のような0-1型の データ'0が負の関係と、関 係性未知の両方を含む( の取り扱いに有利     ij s '例(購買の有無 1:正の関係 0:負の関係or未知

(12)

新規技術における計算アルゴリズム

関係性行列 S={sij} 最大固有値と 固有ベクトル の算出 'べき乗法, ヤコビ法など( 固有ベクトル wk={wki} グループに割り当て済みのユーザを排除す るため,関係性行列の対角要素を変形する. (1) 関係性行列からの固有値の算出

u-1 … u-n i-1 … i-m

u-1 0 … 0 1 … 1 : : … : : … : u-n 0 … 0 1 … 0 i-1 1 … 1 0 … 0 : : … : : … : i-m 1 … 0 0 … 0 Wki u-1 0.8 : : u-n 0.2 i-1 0.7 : : i-m 0.3 閾値より値が 大きいユーザ とアイテムを 第k番目の近 傍としてグ ループ化 (2) 関係性行列からの抽出済みの近傍を削除

u-1 … u-n i-1 … i-m

u-1 sii … 0 1 … 1 : : … : : … : u-n 0 … sii 1 … 0 i-1 1 … 1 sii … 0 : : … : : … : i-m 1 … 0 0 … sii           がアイテムの場合 がユーザの場合 i i w k s k t t ti ii 0 1 1 1 1 2  (1)へ戻り,次の近傍'k+1番(を探索 重みβは,グループの塊度合いから決める

(13)

推薦性能についての検証実験結果

•購買履歴データ 'モニタ調査による実世界のデータ( 世帯数:996世帯 製品数:18種類'各製品を所有しているか否か( 半分をテスト世帯とし、購買の有無を予測 製品 ピアノ パソコン ワープロ VD オーブン 珈琲メーカ 従来法 0.577 0.580 0.528 0.600 0.569 0.515 新技術 0.644 0.647 0.544 0.547 0.575 0.587 改善率(%) 11.6 11.6 3.0 -8.8 1.1 14.0 最大14%'平均5.4%(の精度改善 ⇒ 0-1型履歴に強い •推薦性能'ROC感度(の比較 ROC感度:推薦性能の総合的指標.大きいほど良い.

(14)

新技術の利点

• データ保持コストの軽減

グループ構造の情報のみを保持して推薦 ⇒メモリの所要量が尐ない

• 計算量の軽減

所属グループを探索するのみなので、計算負荷が小 ⇒計算CPUにかかる負担が尐ない

• 情報の匿名化によるセキュリティ向上

多数のユーザをグループ化 ⇒ 匿名性の高い情報管理 ⇒履歴情報から個人が特定される危険を回避

クラウドサーバなどの外部ソースの利用に最適

(15)

開発システムの構成図'例(

共クラスター抽出部 履歴データ 蓄積部 メインサーバ ユーザ端末 履歴入力部 推薦サーバ 推薦提示部 ユーザの 所属算出部 自社運営の情報サーバ 安 価 な 外 部 ( ク ラ ウ ド ) サ ー バ ( サ ー ビ ス ア プ リ ) 履歴を入力 推薦を提示

(16)

デモシステム・旅行先おすすめ「ワムトラ」の紹介

http://www.cs.osakafu-u.ac.jp/hi/honda/tool/

Google や Yahoo にて「ワムトラ」と検索ください

'1(観光地を評価

(17)

おすすめシステム構築ツール・「ワムナビ」の紹介

http://www.cs.osakafu-u.ac.jp/hi/honda/tool/

自分のwebページ上に、誰でも簡単に、おすすめ システムを構築できるJAVAアプレット '1(履歴データを準備 '2(自分のwebページに おすすめシステム! ユーザ ID 寿司 天ぷら そば 味噌汁 1 5 4 2 3 5 3 2 5 4 4 2 3 5 5 5 1 6 1 4 5 7 1 2 8 3 4 9 1 3 5 10 5 5 11 2 4 12 4 1 3 ツ ー ル を サ ー バ に コ ピ ー

(18)

想定される用途

• 本技術の特徴を生かすためには、推薦モデル

構築ソフトウェアをサービス提供することで、

情報インフラの付加価値向上

が期待される。

• 上記以外に、コンテンツ提供業者において、

機会向上の効果

が得られることも期待され

る。

• また、顧客'エンドユーザ(にとっても、自分好

みの情報コンテンツにたどり着く機会が増え、

顧客満足度の向上

にも寄与すると思われる。

(19)

想定される業界

• ITインフラ'サービス(提供業

インターネットプロバイダ,クラウドサービス会社 ⇒ハードウェアの提供にソリューションを付加 提供サービスの付加価値の向上

• コンテンツ発信・提供業'ITインフラ利用者(

ケーブルTV,オンデマンド配信,非営利ユーザ'観光協会( ⇒顧客の利便性に貢献,コンテンツ配信機会の増加 提供コンテンツの“質”と利便性の向上

(20)

• 各種のサービスコンテンツへの組み込み

・ネット通販での商品推薦 '広告提示( 販売機会の向上 ・特許検索の支援インタフェース '関連性の自動検索( ユーザ利便性の向上 ・携帯型ナビゲーションシステム '掘出し物への自動誘導( ユーザ満足度の向上 あなたへの おすすめは ・・・

(21)

実用化に向けた課題と企業への期待

• 現在、情報セキュリティ'情報の匿名化(のレ

ベルを

常に保証する機能

が未解決である。

k-匿名性の保証 尐なくともk人の履歴情報を単 一のグループ情報にまとめる ⇒履歴から個人が特定不能 縮約

• ソフトウェア仕様は適用課題に依存

課題に応じた匿名性

の必要条件の検討

データ提供とカスタマイズによる共同開発を期待

(22)

本技術に関する知的財産権

• 発明の名称 :協調フィルタリング処理方

法およびプログラム

• 出願番号 :特願2010-225844

• 出願人

:大阪府立大学

• 発明者

:本多克宏、野津 亮

他に3件'出願年:2009,2008,2006(

(23)

産学連携の経歴

• 2006年 JST研究成果活用プラザ大阪 「実用化のための可能性試験'FS( 」に採択

ユーザの嗜好の動的な変化に対応した協調フィルタ

リングシステムの開発

• 2008年-2011年 総務省 「戦略的情報通信研究開発推進制度'SCOPE( 若手ICT研究者育成型研究開発」に採択

潜在的な嗜好に基づくユーザ誘導とコンテンツ流通

システムの安定化に関する研究開発

(24)

お問い合わせ先'必須(

大阪府立大学 産学官研究推進センター シーズ育成オフィス 副オフィス長 阿部 敏郎 TEL 072-254-7943 FAX 072-254-9874 e-mail [email protected]

参照

関連したドキュメント

このため、都は2021年度に「都政とICTをつなぎ、課題解決を 図る人材」として新たに ICT職

研究計画書(様式 2)の項目 27~29 の内容に沿って、個人情報や提供されたデータの「①利用 目的」

解析の教科書にある Lagrange の未定乗数法の証明では,

「系統情報の公開」に関する留意事項

「令和 3 年度 脱炭素型金属リサイクルシステムの早期社会実装化に向けた実証

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

(今後の展望 1) 苦情解決の仕組みの活用.

当面の間 (メタネーション等の技術の実用化が期待される2030年頃まで) は、本制度において