信用・信頼度，匿名度・プライバシの測定方法

第３章課題分析

３.３.３信用・信頼度，匿名度・プライバシの測定方法

（１）信用・信頼度の測定方法

信用もプライバシも何らかの定量的な計測方法がなければ，獲得の目当てもその検証確認もできない．以下，それらの測定方法の考え方について述べる．まず信用度の定量化について考え，次項でプライバシについて考える．

信頼度の測定方法は，いろいろな方法が考えられようが，ここでは定量化するための手法として「３ステップ手法」について述べる．

第 1 ステップ：ｎ段階の信用レベルを設定する．各信用レベルに対応するサービス内容と考えてよく，サービスプロバイダがアプリケーションのサービスコンテンツの内容を鑑みて定義する．例えば，ｎ＝５であれば，ｎ＝１より段階順にNo_Service,

1 具体事例を第４章４.４.２（図４.２０）に示す．

第３章課題分析

Minimal_Service, Limited_Service, Full_Service, Privileged_Service などと命名され，その中身はプロバイダが決める．

第２ステップ：それぞれの信用レベルti に対するTrust benefit function B(ti) を定義する．B(ti) の値は，サービスプロバイダかユーザのいずれかが決め，相互に確認，

承諾し合うとする．

第３ステップ：信用レベルがt1からt2に増加する場合，以下に示す式により，B(t_i) の値によってTrust gain G(t1, t2) の値が計算される．計算式は以下である．

Trust gain = G(new_trust_level, old_trust_level)

= B(new_trust_level) – B(old_trust_level) ここでは，測定手法の基本的な考え方について述べるに留める．

（２）匿名度・プライバシの測定方法

次にプライバシの測定方法について述べる．いろいろなプライバシ保護手法が適用される場合，どの程度のパーソナル情報の開示や取得などのやりとりによって，どの程度のプライバシが犠牲になったり守られたりするのかを，プライバシ保護方式の如何に関わらず定量的に測定でき，評価，検証できるための手法が必要である．二つ方法がある．Anonymity set size 方式とEntropy base方式である．

Anonymity set size方式は，集団の中に個人を隠す考え方で，

Anonymity set と呼ばれるＡのサイ

ズが大きければ，匿名度が大きくなるというものである．そのイメージを図３.１２に示す．図は，集団の規模が小さければ匿名度は小さく，集

団の規模が大きければ匿名度も大き図３.１２集団の中に個人を隠すときのいことを示している．匿名度表示[9]

Anonymity setは，p_iを対象siの割当

て確率（出現確率：プライバシデータのアクセス確率）とすれば，

A = {(s1, p1), (s2, p2), ..., (sn, pn)}

で表され，実効的なAnonymity set size Ｌは，p_iを考慮すれば次の式で表され，これを匿名度として使う．p_iは通常均一と考え要素数nが匿名度となる．

第３章課題分析

一方，Entropy base方式は，Entropyがシステムのランダム性を表す概念を持つことを利用して匿名性を定量化する．つまり全体の中である対象に注目するとき，全体の中でその注目する対象の占める割合が多ければEntropyは下がり，注目する対象の大きさが同じでも全体が大きくなって占める割合が小さくなればEntropyは上がる性質を利用する．図３.１３にそのイメージを示す．

図３.１３エントロピーの変化[9]

エントロピーの概念を説明する例として 50 人の男女から成る 100 人のユーザの集合を考える．エントロピーが最大になるのは「性別」のような全てが同じ確率で発生する情報を与えられた場合であり，この時匿名性が最も高いと定義する．この状態は，

ある一人を選んだとき，男性にあたるか女性にあたるかが最も分かりにくい状態である．逆にエントロピーが最小になるのは，発生確率が１になるプライバシ情報を与えた場合であり，この時匿名性が最も低いと定義する．つまり，100 人の中で「Alice」という名前の人が１人しかいない場合，Alice と

いう名前を情報として受け取ること図３.１４エントロピーと匿名性の関係で匿名性が最小になる．（図３.１４参照）

属性の開示などで状況が変化する場合，開示前後のプライバシロスは，Entropy変化Ｇで表され，以下の式となる．

G  H

₀

 H

但し，Ｈ_０，Ｈ_Ａはそれぞれ属性を開示する前のEntropy最大の状態および開示後の

Entropyである．Ｈは以下のエントロピー定義式である．ただしｐ_ｉは開示属性によっ

て決まる発生確率である．

エントロピ

│

ｐ 0.5

不確定度最大 → 最も匿名性が高い

0 1.0

不確定度最小 → 最も匿名性が低いエ

ントロピ

│

ｐ 0.5

不確定度最大 → 最も匿名性が高い

0 1.0

不確定度最小 → 最も匿名性が低い

第３章課題分析

46 図３．１５は，エントロピー変化の例である．属性開示前，６人中１人（対象：Alice）

の Entropy は０.６５だったのが，属性開示

後，男性４人，女性２人（含 Alice）に分類図３.１５ Entropy 変化の例後， Entropy は０.３３に減ることを表している．

全体の枠組みと対象が定義されれば，Anonymity set size方式とEntropy base方式とは互換性があり，双方での匿名度の値は一対一で対応し，どちらを利用するかは該当するシステムでの利便性による．Anonymity set size方式を利用するとき，場合の組合せの数 _ｎＣ_ｒを数え上げる状況が発生する場合があり，その際はEntropy base方式の方が処理コスト的に有利になる場合もある．

（３）本研究における匿名度・プライバシの測定方法

本研究においては，ユーザ処理の面では

Anonymity set size方式（集合匿名性），内部処

理的にはEntropy base方式の折衷方式である．

但し，ユーザ集合の規模に依存しない汎用的な匿名レベル（４レベルの希望匿名度Ｌ）を導入し，Anonymity set sizeとしては，Ｌの各レベル

に応じたＳを定義し匿名性を担保する．図３.１６希望匿名度ＬＬは各ユーザごとに設定され,レベル数やレベル間の切れ目は実装オプションである．100人規模のときの各Ｌに対応するＳの範囲を図３.１６に示す．なお，Ｌが意味を持つにはある程度のＤＢ規模が必要であるが，既存の団体など一定のユーザ集合をベースにスタートすることでコールドスタート問題を避ける．

Anonymity 方式で学会，業界で広く認知されているＫ－匿名性の基本概念は，ＤＢ

のどのタプルを取り出しても同じタプルがＫ個以上存在する状態をいうが，本研究における匿名性は，①タプルではなく属性の組合せとして取出したい．②取出すときプロバイダの背景情報と組合せたときの匿名性を考えたい．③属性値は元のままとし，

何の操作も加えない．を基本に属性開示の際，同じ属性を持つ人数を一定Ｓ以上にしたいという趣旨で，本研究独自の考え方に基づく集合匿名性“Ｓ”を導入する．

第３章課題分析

３．４課題，考察事項

本章の３.２.１項で述べた解決課題を，図３.９を参照して述べる．パーソナル情報などをＰＰＳに集約し，ユーザ背景情報やコミュニティ状況をチェックし，その結果を匿名度調整や開示情報調整に反映させ，調整された開示情報をプロバイダに提供しサービスコンテンツを受けるという一連の流れのなかで，（２）～（３）においてどのようにチェックし，どのように匿名化処理や開示処理に反映させるかが課題である．

以下，基本的な対処の考え方も含め，それらについて述べる．

ドキュメント内電気通信大学大学院情報システム学研究科博士（工学）の学位申請論文 (ページ 50-54)

第３章 課題分析

３.３.３ 信用・信頼度，匿名度・プライバシの測定方法

（１）信用・信頼度の測定方法

（２）匿名度・プライバシの測定方法

G  H

 H

（３）本研究における匿名度・プライバ シの測定方法

３．４ 課題，考察事項

第３章課題分析

３.３.３信用・信頼度，匿名度・プライバシの測定方法

（３）本研究における匿名度・プライバシの測定方法

３．４課題，考察事項