Copyright 2006, Toshiba Corporation.
オントロジーを用いた
TV番組グラフ
作成システム
株式会社東芝 研究開発センター 溝口祐美子
[email protected]
発表内容
• 研究の背景
• 番組グラフを用いた番組検索インターフェース
• 番組間の関連度計算アルゴリズム
• 番組のタグ付け
• ネットワークを介したタグ付けの共有
• 速度評価
• まとめ
• 今後の課題
3
研究の背景:TV番組表からTV番組グラフへ
• テレビ番組数の増加
– 多チャンネル化(地上波、BSデジタル、ケーブルTV)
– インターネットによる動画配信
• リアルタイム視聴から録画視聴へ
– デジタルレコーダなどの普及
番組間の関連によるグラフ表示すること
で控えめな番組推薦
• 番組表(時間x局)では一覧性に限界
• 時間軸はそれほど重要な切り口ではない
東芝情報システム株式会社と共同研究
4TV番組グラフを用いた番組検索インターフェース
5
録画済み番組
7
TV番組グラフのシステム構成
番組 オントロジー 関連度計算機能 2番組情報 番組間距離 TouchGraph 描画機能 番組情報 DB 距離をノード数または線の太さで表す 番組アイコン付き ユーザタグ HDD録画済番組 インターネット 放送予定番組 タグ付け機能 8オントロジー
EPG属性
番組オントロジー
1.
放送局
2.
放送時間帯
3.
曜日
4.
タイトル
5.
ジャンル
6.
人名
出演者,監督,脚本,声優など
7.
内容・あらすじ
時間オントロジー
18クラス,12インスタンス放送局オントロジー
16クラス,14インスタンス映画作品オントロジー
2154クラス,212751インスタンス人物オントロジー
5837クラス, 192042インスタンス番組ジャンルオントロジー
地名オントロジー
9937クラス, 239676インスタンス9
オントロジー例
時間オントロジー
放送局オントロジー
映画作品オントロジー
人物オントロジー
番組ジャンルオントロジー
地名オントロジー
タレント マルチ タレント お笑い 落語家 吉本 ジャンル ドラマ全般 ドキュメンタリー教養全般 ニュース報道ドキュメンタリ・教養 日本の地理 日本の岬 日本の山 日本の登山基地 日本百名山 映画 コメディ ミステリー 時間 祝日 ウイークデー 月 火 StationPublic Station Commercial Station 日本テレビ TBSテレビ 富士山 上高地 新穂高温泉 宗谷岬 水野裕子ト 林家三平 林家いっ平笑福亭仁鶴 島田紳助 スポーツ全般 ロマンス 歴史 アドベンチャー 刑事 時間帯 朝 夜 ゴールデン NHK総合
TV番組間の関連度
∑
=
∂
=
n
i
i
i
D
p
p
p
p
R
1
))
2
,
1
(
(
)
2
,
1
(
(2) オントロジ毎に重み付け
を変える.ヒューリスティック
なルールを導入して重みを
決定.
(3) オントロジ毎に距離
を計算する(1つ前のス
ライド).包摂関係にあ
る場合は,重み付けす
る.
(1) 基本は,オントロジ毎
に計算した距離の合算
11
番組の距離
08/06 17:15-17:20 @テレビ東京 バンセン核家族 [出]林家三平 [出]爆笑王 08/05 12:15-12:45 @ NHK総合 バラエティ生活笑百科 [出]林家いっ平 [司]笑福亭仁鶴 08/09 22:00-22:54 @TBS 世界バリバリバリュー [司]島田紳助 [司]水野裕子距離2 (落語家つながりで,距離が近いと判定)
距離4
距離計算の種
(例:録画予約済み番組,
ユーザが興味を持った番組)
各番組のEPG情報から所定のキーワードを抽出
12オントロジーと番組
romanceMovie & drama
mystery adventure comedy crime history Sleepless in Seattle Grey’s Anatomy Apollo 13
CSI New York CSI Crime Scene
Investigation
Tom hanks Gary Sinise
Star United States
Las Vegas NY Seattle
movie ontology
location ontology
performer ontology
Sleepless in Seattle Apollo 13 CSI New York
Sleepless in Seattle
13
オントロジー毎の番組間の距離
6
2
5
“CSI New York” と ”Apollo 13”の距離
1
6
3
“Sleepless in Seattle” と ”Grey’s Anatomy”の距離3
6
1
“CSI Crime Scene Investigation” と
“ CSI New York” の距離
地名オントロジー 出演者オントロジー 作品 オントロジー
作品オントロジーの観点で
は最も近い
出演者オントロジーの観点
では最も近い
地名オントロジーの観点で
は最も近い
16
15
16
作品 1 出演者 2 地名 119
18
13
“CSI New York” と ”Apollo 13”の距離
11
13
10
“Sleepless in Seattle” と ”Grey’s Anatomy”の距離13
11
10
“CSI Crime Scene Investigation” と “ CSI New York” の距離
作品 1 出演者 1 地名 2 作品 2 出演者 1 地名 1 作品 1 出演者 1 地名 1
重み付けによる関連度の変化
作品オントロジー
重視
出演者オントロジ
ー重視
地名オントロジー
重視
均等
15
距離計算の高速化
映画 邦画 洋画 ホラー ヒューマンドラマ SF サスペンス XX監督 YY監督 ZZ主演 c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 映画 邦画 洋画 ホラー ヒューマンドラマ SF サスペンス XX監督 YY監督 ZZ主演 c1 c2 c3 c4 c5 c6 c7 c8 c9 c10ルートからc9への
パスP1
: c1→c3→c6→c9
ルートからc7への
パスP2
: c1→c3→c7
共通部分 深さ1 残り 深さ2 残り 深さ1両者を合算した値3が
c9とc7の距離
(1回の集合演算で求まる)
この部分は事前に計算しておく
映画作品オントロジー
映画A 映画B パスP1 パスP2リアルタイムにグラフの関連を変更するためには、オントロジ
ーの大きさに左右されない高速な再計算が必要。
16タギング機能
08/06 17:15-17:20 @テレビ東京 CSI New York[出] Gary Sinise 08/05 12:15-12:45 @ テレビ朝日 Applo13
[出]Tom Hanks, Gary Sinise
08/09 22:00-22:54 @テレビ東京 Sleepless in Seattle [出]Tom Hanks
笑える
泣ける
出演者 出演者スリリング
emotion tears Heart-warming sorrow funny tragic 感動 泣ける 笑える スリリング 設定17
タグの作成と共有
インターネット
romance
Movie & drama
mystery adventure comedy crime history 4 3 1 2 horror romance
Movie & drama
mystery adventure comedy crime history 4 3 1 2 5 romance
Movie & drama
mystery adventure comedy crime history 4 3 1 2
番組にタグ
付け
タグを追加
タグ付けの共有による恩恵
• 一人ひとりの少ない労力で大量番組の分類を実現。
• 追加されたタグから新しい分類の切り口を発見。
• 賛同できる分類を取捨選択。
• 視聴者間のコミュニケーション。
• タグどうしの関係付けを共有することで、オントロジーのメンテナ
ンスを支援。
19
速度評価
time by ontology size
0 1000 2000 3000 4000 5000 16 18 24 2154 5837 ontology size ti m e (m s e c ) time(msec)
time by EPG size
0 20000 40000 60000 80000 100000 100 200 300 400 500 EPG size ti m e (m s e c ) time(msec)
オントロジーのクラス数と距離計算時間
番組数と距離計算時間
20まとめ
• 録画番組などのユーザが興味のある番組に関連する番組をグ
ラフ表示することによって番組をひかえめに推薦。
• Light weightなオントロジーを組み合わせ、総合的な関連度を
計算するアルゴリズムを開発。
• ユーザが組み合わせるオントロジーや重要視するオントロジー
をカスタマイズすることで自分の嗜好に合うよう関連度を調整。
• 関連度計算の高速化手法によってオントロジーの大きさに因ら
ない高速な計算を実現。
• 番組にタグ付けすることによってユーザの観点で分類。
• ネットワークを介して番組へのタグ付けを共有し、ユーザ同士の
番組推薦を実現。
21