• 検索結果がありません。

評価情報とは

ドキュメント内 WISDOM Web (ページ 182-187)

第 7 章 リンク解析 111

付録 9. A TSUBAKI API

11.2 評価情報とは

意見や評価は様々な形で表明される.例えば,Martin [6] によると評価には,次の3つの側面がある と言われている.まず,「好き/嫌い」や喜怒哀楽,欲求といった感情 (affect), そして「賢さ」「誠実 さ」など物事の善悪や行為についての判断(judgement),もう一つは「美しさ」など感覚的,美的な判

断 (appreciation) が想定されている.WISDOMはこのように感情や判断を含めた多様な評価を対象

とする.WISDOMにおける意見(評価)とは,テキスト中で,何らかの対象に対して述べられた肯定

(否定)的判断や態度もしくは叙述を指すこととする.意見(評価)として読み取れる情報(文)を評価情 報と呼ぶ.評価情報は典型的には「製品Aは素晴らしいと思う」のような,その文を書いた著者による,

ある対象に対する肯定/否定的な判断や態度が述べられた文が相当する.つまり,評価情報は,(1)で示 すような,「評価をする者(評価保持者)」,「評価の対象(評価対象)」,「言語によって表現された判断や態 度(評価表現)」の三項目を基本構造として持つ情報(文)とする.以降では,具体的な評価情報を提示

11.1 意見・評価タブ画面

する際には,評価対象には 下線 を付与し,評価表現は太字で表すこととする.

(1) 花子は

評価保持者

金閣寺 が

評価対象

大好きだ

評価表現

さらに「製品Aは{買って三日後に壊れた/グッドデザイン賞を受賞した}」といった事実的な言明で あっても,その客観的事実が,ある対象への肯定/否定的な評価に結び付く事実を述べた叙述であれば,

評価情報とみなされる.

WISDOMは入力されたクエリをトピックとみなし,そのトピックを評価対象とする直接的,間接的な

評価情報を抽出し,出力する.

11.2.1 評価対象

WISDOMはユーザの興味に応じて様々なトピックを分析する必要がある.それはすなわち,評価対象

としてあり得る意味的なクラスも多様であることを意味する.例えば,商品のような具体物に限らず,人 や組織,「年金制度」のような制度や「地球温暖化」のような現象や出来事も評価対象としてWISDOM で分析される.WISDOMで分析され得るトピックを整理すると,以下に挙げる「利用物」「人・組織」

「行為・制度」「現象・出来事」の4種を想定すれば大方網羅される.

1. 利用物

! アガリクス,バイオエタノール,マイナスイオン,保険など.

11.2 評価情報とは 171 2. 人・組織

! 坂本龍馬,京都大学など.

3. 制度・行為

! 年金制度,捕鯨,首都の移転など.

4. 現象・出来事 (社会や自然に関する現象)

! 子どもの体力低下,CO2の増加,円高など.

利用物を評価対象とする評価情報は,典型的には評価保持者がその利用物に対する利便性,有用性お よび,嗜好などに関する肯定/否定的な感情や判断,経験などが相当する.利用物はサービスなど無形で あっても,人間が利用するものであれば「利用物」としてみなすことができる. 例えば,(2) は「マイナ スイオン」が有用であると主張されているので,利用物に対する評価とみなすことができる.

(2) マイナスイオン は血液をきれいにします.

人や組織が評価対象とみなされる場合,当該人物/組織に対する評価保持者の感情や価値判断が評価情 報としてあり得る.利用物との大きな違いは,人・組織がトピックの場合,トピック自体が評価保持者に なりうる点が挙げられる.

(3) a. 坂本龍馬 を尊敬している.

b. 坂本龍馬は 西郷隆盛 を慕っている(評価保持者は「坂本龍馬」).

制度・行為は人間や社会の意志的な取り決め,行いとしてみなすことができる.制度・行為に対する評 価は評価保持者の当該制度・行為に対する賛否が典型的な評価として該当する.例えば,(4) は「捕鯨」

という行為について賛成している例である.当然,その行為を行ったことによって生じるメリットやデメ リットなども評価情報となる.

(4) 捕鯨を行うこと に賛成です.

現象・出来事は,制度・行為以外の事態を指す.現象・出来事に対する評価は,評価保持者が当該現象・

出来事についての望ましさやそれが期待される現象であるのか否かについての判断が注目される.例えば 次のような例が挙げられる. (5) は著者が「子どもの体力低下」を望ましくない現象とみなしているの で,「子どもの体力低下」という現象に対する評価である.

(5) 子どもの体力低下 は深刻な問題だ.

ところで評価情報からは少し外れるが,情報分析という観点からいえば,現象・出来事はそもそも,そ の現象や出来事が起こっているのかといった,現状に関する情報や,起こっているとすれば,その原因は 何であり,結果としてどのようなことが起きるのか,といった,原因や結果(影響)に関する情報も重要 な周辺情報である.さらに当該現象を阻害,もしくは促進させる対策に関する情報も有用である.例え ば,「地球温暖化」を止める対策や,「景気安定」を促進させる対策などが相当する.これら現象に関する トピックに対応する分析項目としてWISDOMでは「原因・対策」タブを設けている.「原因・対策」タ ブに関しては14.6で説明する.

11.2.2 評価表現の種類

Martin[6]が指摘するように,評価には感情や判断などいくつかの側面があり,評価保持者の評価の仕

方によって,評価表現の種類も多様になる.評価情報は評価保持者による主観的な表現によって述べられ ることもあれば,評価に結びつく客観的な事実の叙述によって表明されることもあり得る.例えば,前節 で述べたとおり,評価情報は,評価対象に対する利便性や特長について客観的に述べられたものや制度・

行為に対する賛否などがあり,それらはいくつかのカテゴリに分けることができる.WISDOM における 評価情報は「テキスト中で,何らかの対象に対して述べられた肯定(否定)的判断や態度もしくは叙述」

と定義しているが,その適用範囲は厳密かつ詳細化する必要がある.評価情報をカテゴリ化することに よって,評価情報の適用範囲を明確化することができる.WISDOMのユーザにとってもトピックに対す る「肯定」「否定」といった極性だけでなく,様々な観点から情報の分析ができるようになるというメリッ トがある.我々は評価情報を主観性や極性の有無などの観点から次のように分類した.

• 感情+/感情−

評価保持者の欲求や喜怒哀楽・好き/嫌いといった感情的評価情報.

例.「好き」,「うれしい」,「嫌い」,「悲しい」.

(6) 電子マネー が大好きです.

• 批評+/批評−

賛成/反対・称賛/批判等の態度の表明や,出来事や動作に対する主観的評価情報.

例.「素晴らしい」,「同意する」,「納得できない」.

(7) 私は 裁判員制度 に賛成している.

• メリット+/メリット−

利点や欠点,特長や課題について述べられた評価情報.

例.「〜できる」,「効果がない」,「うるさい」.

(8) 首都圏の私鉄・バスがPASMO一枚で利用できます

• 採否+/採否−

積極的に利用したり選択する姿勢を述べたもの.

例.「利用する」,「導入する」,「採用する」,「推進する」.

(9) A社は バイオエタノール車 の開発を積極的に進めている.

(10) 電子マネー をいつも使っています.

• 出来事+/出来事−

評価対象によって引き起こされた良い(悪い)状況や個別的経験について述べられた言明.

例.「壊れた」,「受賞した」.

(11) この製品 は買って三日後に壊れてしまいました. (12) この製品 は今年グッドデザイン賞を受賞した.

• 当為

提言や助言,対策を述べたもの.

例.「〜すべきだ」,「〜しましょう」,「〜するのがよい」.

11.2 評価情報とは 173 (13) 裁判員制度にはまず国民の理解を得ること が必要だ.

→ 「国民の理解を得ること」に対して,それが「必要だ」という提言がなされている.

• 要望

希望や要求を述べたもの.

例.「〜してほしい」,「〜を求める」,「〜を望まない」.

(14) 電子マネーの規格を統一して ほしい. (15) 消費税は上げて 欲しくない.

これらの評価タイプの中で,「感情+/−」「批評+/−」や「メリット+/−」の一部は主に主観的な評 価表現となり,また「メリット+/−」の一部と「採否+/−」「出来事+/−」は客観的な記述により表 現されることが多い評価情報となる.当為や要望については,極性が付与されない.

11.2.3 評価対象とトピックとの関連性

WISDOMで行われる評価情報分析の目的はユーザの入力したクエリに関する評価をWeb上から収集

し,俯瞰的に提示することにある.そのためにクエリから解析されたトピック(8節を参照) に対する肯 定/否定評価の分布を提示する必要があり,トピックそれ自体が肯定もしくは否定されていると解釈でき る情報が抽出されなければならない.しかしコーパスの構築を通じてその抽出条件の決定には困難が伴う ことが明らかになった.例えば以下で例示するように,トピックに対する評価には必ずしも結びつけられ ない情報やその判断自体が難しい場合もある.なお「【】」で囲まれた部分は入力されたトピックを想定す る.

(16) a.【iPod】はとても便利だ.

b. 山田は【iPod】の音質 が気に入っている.

c. 【iPod】の発売予定日を誤って紹介した 雑誌Xはもう信用できない.

例えば,(16a)はトピックであるiPodが直接肯定的に評価されている.一方,(16b)はiPodの属性が評 価されており,iPod自体への評価は間接的である.ただし,この場合は,iPodそれ自体に対する肯定評 価だと解釈できる.しかし,(16c) のような例になると,直接評価されている対象は雑誌であって,iPod が評価されていると考えるのは難しい.このように直接評価されている対象がトピックに対する評価とは 無関係な場合がある.以上の問題は,文中に現れる直接的な評価対象とトピックとの関係性に起因すると 考えられる.

これまでの評価情報コーパスは評価情報の抽出を主とするタスク設計にとどまり,トピック自体に対す る肯定/否定評価に結びつく情報を抽出する際に課題となる,評価対象とトピックとの関係性については 深く議論されてこなかった.我々はトピックと評価対象の関連の度合いに応じた意味的な関係を整理し た.その結果トピックとと評価対象の関連の仕方は表11.1のように表される.このように整理すること で,文中から抽出された評価表現が,与えられたトピックと強く関連する評価なのか,トピックとはあま り関連しない評価なのかが明らかになる.

ドキュメント内 WISDOM Web (ページ 182-187)