• 検索結果がありません。

解答群に対するスコア付け

ドキュメント内 2006 3 (ページ 31-34)

第 4 章 解答リストの作成

4.4 解答群に対するスコア付け

一般に解答群AG(ki, attr)は複数得られる.ここでは,これらの解答群の中から,最終 的にユーザに提示する解答群を1つ選択するために,解答群にスコア付けを行う.

解答群AG(ki, attr)に対するスコアScoreAG(ki, attr)を式(4.2)のように4つのサブスコ アS1S2S3S4の重み付き和であると定義する.

Score(AG(ki, attr)) =w1S1+w2S2+w3S3+w4S4 (4.2)

S1 = |AG|

AS2 = Atype

|GA|S4 =

a∈AG s(a)

|AG| (4.3)

A· · ·解答候補の総数

• |AG|· · ·解答群が持つ解答候補の数

Atype· · ·解答群中の解答の異なり数

a∈AG s(a)· · ·解答群に存在する解答のスコアの総和

s(a)· · ·解答候補aに対して質問応答システムが与えるスコア

w1, w2, w3w4· · ·それぞれのスコアの重みで,それぞれ0.3,0.4,0.2,0.1に設定

解答候補数におけるスコア(S1)

分母は解答候補の総数であり,分子は解答群が持つ解答候補数である. これは,多くの 解答候補中に限定表現が出現することで解答毎の曖昧性を検出しやすくなるという考え である. 従って,スコアは解答群がたくさんの解答を含むほど高くなる. 前節4.3の質問

「アカデミー賞を受賞したのは誰ですか」を例に挙げる.質問に対して得られた解答の総 数は100個であったとすると,表4.3の解答群AG(アカデミー賞,数+回)に存在する解答 の数は9個であるのでスコアは9/100となる.また表4.4の解答群AG(アカデミー賞,男 優賞)に存在する解答の数は18個であるのでスコアは18/100となり,数量表現+接尾語 の解答群より末尾3文字の解答群のほうがスコアが高くなる.

限定表現の異なり数によるスコア(S2)

分母は解答群が持つ解答候補数,分子は解答群中の解答の異なり数である. もし,解答 の異なり数が少ない場合,同じ解答候補が異なる限定表現を持つことが多いということ を意味する.しかし,適切に限定表現が抽出されているのであれば,1つの解答に対し て得られる限定表現は1つのはずである.この項は,異なる限定表現が同じ解答候補に対 して出現する場合に低いスコアを与える. 例えば,表4.7のような解答群を考える.これ は4.2節で挙げた質問で得られたグループの1つで,末尾3文字の「女優賞」という属性 を持つ.このグループには全部で解答が14個存在するが,「ヒラリー・スワンク」が「主 演女優賞」と「アカデミー主演女優賞」という2つの限定表現を持つので異なり数は13 個となり,このグループのスコアは13/14となる.一方,同じ末尾3文字という属性を持

つ表4.4のAG(アカデミー賞,男優賞)を見ると,解答候補は重複しないのでスコアは1と

なる.

表 4.7: 解答が複数の限定表現にまたがる例

解答候補 キーワード 限定表現

ロバーツ

ヒラリー・スワンク ジュリア・ロバーツ エミー

ヒラリー

マイ アカデミー賞 主演女優賞

ジャネット・マクティーア カンヌ国際映画祭

シドニー・ポワチエ オン

アリス

ヒラリー・スワンク アカデミー主演女優賞 マーシャ・ゲイ・ハーデン 助演女優賞 アンジェリーナ・ジョリー

属性のスコア(S3)

S(attr)の式は基準となる限定表現の属性毎に与えられるスコアである.表4.8に属性毎

に与えられるスコアを示す.スコアは人手によって調整した.これはスコアが高い属性ほ ど限定表現間の共通性が高く,ユーザに提示する解答リストとして適切であるとみなして いる.

表 4.8: 属性のスコア

属性 スコア

かっこ 1

数量表現+接尾語 1 意味クラス 0.4 末尾3文字 1 末尾2文字 0.5 末尾1文字 0.2

解答群中に存在する解答の平均スコア(S4)

この式の分母は解答群が持つ解答候補数であり,分子は解答候補が持つスコアの平均で ある. この項は,限定表現が持つ解答がどのくらい信頼性があるかを表しており,高いス コアを持つ解答が解答群中にたくさんあるほど解答群としてのスコアは高くなる.例を 表4.9に示す.これは表4.3の解答群中の限定表現が持つ解答候補のスコアを示している.

そして解答候補のスコアの総和を解答候補数で割ったものがグループのスコア,S4=0.225 となる.

表 4.9: 限定表現が持つ解答とスコアの例

解答 キーワード 限定表現 解答のスコア

行定勲 25回 0.122

グラディエーター 73回 0.114

アン・リー 0.118

頭山 0.134

マイケルムーア アカデミー賞 75回 0.770

スピリテッド・アウェイ 0.426

ウイリアム・A・ウェルマン 1回 0.082

タイガー・ウッズ 0.129

シドニー・ポワチエ 10回 0.129

全ての解答群について(4.2)式のスコアを計算し,最も高いスコアを持つ解答群を1つ 選択する.

ドキュメント内 2006 3 (ページ 31-34)

関連したドキュメント