加減アルゴリズムの評価実験

第 4 章信頼感の醸成方法の高度化と効率化

4.6 加減アルゴリズムの評価実験

本節では加減アルゴリズムを評価する．実験では正規分布から作成した予測確信度と予測結果のデータセットに対してしきい値を調整する．最終的なしきい値をデータセットから求める正答率と見逃し率に適する真のしきい値と比較する．比較対象は過去の予測から計算的にしきい値を求める統計計算アルゴリズムとした．

評価実験は，理想条件と実環境条件に分けて行った．理想条件とは，予測した家電操作が正しいかどうかがすべて推定可の条件である．実環境条件とは，予測した家電操作が正しいかどうか推定不可を含む条件である．

4.6.1 統計計算アルゴリズム

本実験でのしきい値の計算方法を図4.5に示す．予測確信度の分布を正規分布に仮定する．過去の予測N個を対象に信頼区間95%での正答率の下限を式(4.8)，信頼区間95%

での見逃し率の上限を式(4.9)で求める．

まず，ユーザの指示する正答率を満たすしきい値の範囲を計算する．しきい値を1.00 から順に減らし，式(4.8)により正答率の下限（しきい値より予測確信度の高い家電操作の正答率の下限）がユーザの指示する正答率に最も近く，かつ，ユーザの指示する正答率よりも大きくなるしきい値を求める．このしきい値を正答率を満たす最小のしきい値と呼ぶ．

次に，ユーザの指示する見逃し率を満たすしきい値の範囲を計算する．しきい値を 0.00 から順に増やし，式(4.9)より見逃し率の上限（家電操作が正しい数としきい値より予測確信度の低い家電操作が正しい数から見逃し率の上限）がユーザの指示する見逃し率に最も近く，かつ，ユーザの指示する見逃し率よりも大きくなるしきい値を求める．

このしきい値を見逃し率を満たす最大のしきい値と呼ぶ．

最終的なしきい値は正答率を満たす最小のしきい値と見逃し率を満たす最大のしきい値の中間値とした．ただし，正答率を満たす最小のしきい値が見逃し率を満たす最大のしきい値より大きい場合，正答率と見逃し率を満たすしきい値が存在しない．正答率を満たす最小のしきい値と見逃し率を満たす最大のしきい値の中間値がユーザの指示した予測能力に適するしきい値とした．

図4.5 統計計算アルゴリズム Nデータ現在

th_min

正答率を満たす最小しきい値見逃し率を満たす最大しきい値 th_max

○

× ○

○

○ ○

× ×

○

○ ○

○

データ数予測確信度

信頼区間95%での正答率の下限＝P_hit(a)− k√^P^hit(a)^(1−P^hit(a)⁾

N_act ・・・式(4.8) (ただし，Nact=Nhit(a)+Nfalse(a)

Nact≦30のとき，k=t(0.025, n-1) Nact>30のとき，k=1.96）

信頼区間95%での見逃し率の上限＝P_miss(a)+ k√^P^miss(a)^(1−P^miss(a)⁾

N_correct ・・・式(4.9)

(ただし，Ncorrect=∑ⁿ_b=1N_hit(b)+N_miss，

Ncorrect≦30のとき，k=t(0.025, n-1) Ncorrect>30のとき，k=1.96）

実験では，しきい値の計算に用いる過去のデータは2000データとし，しきい値は0.01 間隔で計算した．ホームエージェントでは，学習アルゴリズムやユーザの行動環境によって家電操作回数が異なる．たとえば，MavHomeの実験[80]では一日での照明操作回数が18回であった．この場合，2000データはおよそ100日分と推測できる．

4.6.2 実験に用いる予測行動のデータセット

予測確信度の分布は，図4.6に示すように正しい場合と誤りである場合で別の正規分布として決めることにした．正規分布の平均と分散によって予測能力を調整できる．データセットの各データは，まず確率的に予測した家電操作が正しいかどうかを決め，次に予測確信度を正規分布から確率的に決める．以降において，データセットの予測した家電操作を1データと呼ぶ．

図4.6 データセットの生成イメージ

実験に用いる3つのデータセットの生成条件を表4.3に示す．データセット2は，データセット1より正しい予測の予測確信度の平均を小さく，誤った予測の予測確信度の平均を大きく，予測を間違う比率を大きくした．データセット2は正しい予測の予測確信度分布と間違った予測の予測確信度分布が重なる部分が多くした．データセット2はユーザの示す正答率と見逃し率を同時に満たすしきい値が存在しにくい条件である．デ

○

×○

○

× ○

○

○ ○

× ××

×× ×

○ ×

○

○ ○

○

時間正答（○）の

予測確信度分布

誤答（×）の

予測確信度分布確信度

ータセット3はデータセット2と同様の生成条件だが，データ数が20000である．

理想条件での評価実験ではデータセット1と2を用いた．実環境条件での評価実験ではデータセット 3 を用いた．実環境条件での評価実験では，さらに，データセット 3

の 90%のデータを予測した家電操作が正しいかどうかが推定不可データとした．ただ

し，予測確信度がしきい値よりも大きい場合，エージェントが代行や説明をすることでデータセット3の予測した家電操作の予測結果が判明するとした．

4.6.3 実験に用いる予測能力と加減アルゴリズムの加減値

実験に用いるユーザの示す予測能力と真のしきい値，加減アルゴリズムの加減値を表 4.4に示す．本実験では，エージェントの行動を2つとし，しきい値はしきい値1としきい値2とした．

まず，ユーザの示す予測能力は能力AからEの正答率を等しくし，見逃し率を変えた．見逃し率が低いほど，正答率と見逃し率を同時に満たすしきい値が存在しにくい．

また，能力Fは能力Eと見逃し率が等しいが，しきい値2の正答率を高くした．能力 Fが最も正答率と見逃し率を満たすしきい値が存在しにくい．

次に，各予測能力での真のしきい値はデータセットのすべて5000データを用いて統計計算アルゴリズムによって求めた．データセット1よりもデータセット2のほうが正答率と見逃し率を満たすしきい値がない場合が多くなった．データセット3の真のしきい値はデータセット2と同じ生成条件であるため，真のしきい値も同じとする．

また，加減アルゴリズムの加減値は式(4.7)より求めた．予測確信度に対する加減値の最大変化が1%となるように，しきい値1の増加値を0.01とした．

表4.3 データセットの生成条件

データセット

予測した家電操作の正誤率正：誤

予測確信度の分布正しい誤りデータ数

平均偏差平均偏差

1 1：1 0.8 0.2 0.3 0.2 5000

2 3：7 0.7 0.2 0.4 0.2 5000

3 3：7 0.7 0.2 0.4 0.2 20000

表4.4 予測能力と加減アルゴリズムの加減値

※ 真のしきい値において，( )付きの数値は予測能力を満たさない

4.6.4 実験 1：理想条件での評価

データセット1と2を用い，加減アルゴリズムと統計計算アルゴリズムのそれぞれで調整したしきい値を比較する．

データセット 1における能力 Eの条件でのしきい値の変遷を図 4.7に示す．加減アルゴリズムでも統計計算アルゴリズムでも少ないデータ数からしきい値が下がった．

2000 データ以降で加減アルゴリズムと統計計算アルゴリズムの両方でしきい値が定常状態となった．統計計算アルゴリズムは，しきい値1と2の両方がデータ数15の時点

で0.725まで下がり，そこから徐々に下がっていき，データ数3000で真のしきい値ま

で下がった．実験をはじめてから早い時点でホームエージェントが操作代行をするようになった．これに対し，加減アルゴリズムでは，しきい値 2 がデータ数240 で 0.665 まで下がり，その後，しきい値1がデータ数726で0.73まで下がり，その後，それぞれが徐々に下がり，しきい値2はデータ数557で真のしきい値まで下がり，しきい値1 はデータ数1930で真のしきい値まで下がった．実験を始めてから，まず，ホームエージェントは提示をするようになり，その後，提示していた操作の操作代行をするようになった．ホームエージェントからのユーザへの対話が変化することで，ユーザはホームエージェントの操作代行に対する自信の変化を理解することにつながる．

すべての予測能力における3000-5000データ間での平均のしきい値を表4.5に示す．

加減アルゴリズムでのしきい値と真のしきい値との差は最大 0.04，統計計算アルゴリズムのしきい値と真のしきい値との差は最大0.10であった．

加減アルゴリズムにおいてしきい値が定常状態となることが確認でき，加減アルゴリズムにおいて統計計算アルゴリズムと同等のしきい値が求められた．これによって，ユーザは，その時点でホームエージェントに任せられる信頼性を正答率と見逃し率でホームエージェントに示すことができる．これまでのユーザがしきい値を調整する方法では，

その時点でのホームエージェントに適するようにユーザがしきい値を調整しなければならなかった．しきい値を調整することでホームエージェントの提示や操作代行がどの

予測能力

しきい値1 しきい値2 データセット1 データセット2 加減アルゴリズムでの加減値

正答率見逃し率正答率見逃し率真の

しきい値1 真の

しきい値2 真の

しきい値1 真の

しきい値2 Δth1up Δth1down Δth2up Δth2down

A 90 95 70 90 0.77 0.71 0.94 0.79 0.01 0.0011 0.18 0.00429

B 90 90 70 70 0.76 0.67 (0.91) 0.73 0.01 0.00056 0.035 0.00429

C 90 90 70 50 0.76 0.62 (0.91) 0.69 0.01 0.00028 0.0125 0.00429

D 90 70 70 50 0.72 0.64 (0.85) (0.70) 0.01 0.00167 0.025 0.00429

E 90 50 70 30 0.67 0.62 (0.81) (0.67) 0.01 0.00278 0.015 0.00429

F 90 50 90 30 0.67 0.67 (0.81) (0.80) 0.01 0.00278 0.015 0.00111

ように変わるか分からないため，手探りで何度も調整しなければならなかった．ユーザが正答率と見逃し率でホームエージェントに指示できることで，調整後のホームエージェントの変化を想像して調整ができるため，以前より効率的である．

図4.7 データセット1における予測能力Eでのしきい値変遷 0.4

0.6 0.8 1

0 1000 2000 3000 4000 5000

予測確信度

データ数

加減(しきい値1）加減(しきい値2）統計(しきい値1）統計(しきい値2）

ドキュメント内人間の行為選好と信頼感に対応したホームエージェントの設計と (ページ 65-74)

第 4 章 信頼感の醸成方法の高度化と効率化