機械学習・データマイニングにおける公平性

(1)

1．は

じめに

本稿では，機械学習やデータマイニング分野における公平性と，この公平性を扱う手法を概観する．こうした分野は公平性配慮型データマイニング（fairness-aware data mining）や公平性配慮型機械学習（fairness-aware machine learning）などと呼ばれている．公平性配慮型データマイニングでは，公平性，差別，中立性，独立性などの潜在的な問題を考慮に入れてデータ分析を行う．この機械学習における公平性の研究は 2010 年以前ではわずかに行われていたのみだったが，2010 年から徐々に研究者が増え，2017 年には急速に注目されるようになった．これは，EU の新しいデータ利用法制 General Data Protection Regulation [GDPR]や，2016 年の米大統領選挙に伴う Fake News 問題が大きく影響していると考える．また，The IEEE Global Initiative on Ethics of Autonomous and Intelligent Systems [IEEEGIoE, 江間 18] による Ethically Aligned Design や，ACM Code of Ethics and Professional Conduct [ACMCoE]などの倫理規定制定の動きとも連動しているだろう．本稿の構成は以下のとおりである．2 章では，データ分析において公平性が関連した事例を紹介する．3 章では，公平性配慮型データマイニング分野で考案された形式的な公平性の規準を述べる．4 章ではこの分野でのタスクを，5 章ではこれらのタスクを実行する手法を，6 章ではその他の観点を紹介する．7 章のまとめでは関連資料や研究コミュニティを紹介する．

2．データ

分析で公平性が議論された背景

データマイニング・機械学習で公平性が議論されはじめた背景を紹介する．単純にデータ分析を適用すると，性別や人種など生得的地位に対する不公平な扱いが，意図的ではないにせよ生じた事例を二つ紹介する． 2･1 ネット広告配信の事例まず，ネット広告配信における Sweeney による指摘を紹介する [Sweeney 13]．読者は，多くの文書や Web ページから，必要な情報を見つけ出す情報検索サイトを毎日利用していることと思う．これらのサイトでは，キーワードに関連した項目に加え，そのキーワードに関連した広告も併せて表示される．Sweeney はこの広告が，人種に対する偏見に基づいている可能性について調査した．具体的には，マサチューセッツ州の新生児の記録から，アフリカ系とヨーロッパ系の間で偏りが大きい 2 000種以上の名前を選び，これらの名前で検索サイトとニュースサイトで検索し，表示される広告を調査した． Sweeneyは，米国の各州で公開されている逮捕歴の情報などを検索する Instant Checkmate などのサイトに関する広告に注目した．図 1（a）は，アフリカ系に多い名前“Latanya Farrell”で検索した場合に表示された広告の例である．1 行目の広告は『Latanya Farrell は逮捕されたか？』という逮捕歴を示唆するような広告文になっている．一方で，ヨーロッパ系の名前“Jill Schneider”で検索した図 1（b）では，2 行目の『Jill Schneiderを見つけました』のように，特に逮捕歴を示唆しない中立的な広告文であった．より詳しく調べると，実際のリンク先のサイトで逮捕歴があるか，また，その名前のレコードが存在するかに基づいて広告文が選択されているわけではなかった．アフリカ・ヨーロッパ系の区別と，広告文が中立かどうかの独立性を統計的に検定したところ，有意にアフリカ系で逮捕歴を示唆する広告文が多かったと報告している．

機械学習・データマイニングにおける公平性

Fairness in Machine Learning and Data Mining

神嶌　敏弘

産業技術総合研究所

Toshihiro Kamishima National Institute of Advanced Industrial Science and Technology（AIST）. [email protected], http://www.kamishima.net/

小宮山　純平

東京大学

Junpei Komiyama The University of Tokyo.

[email protected], http://www.tkl.iis.u-tokyo.ac.jp/~jkomiyama/index_jp.html

Keywords:

fairness, machine learning, data mining, ethics, intepretability. 「道徳判断の自動化をめぐる問題：規範の選択と協力の進化」

† 冊子版「人工知能」Vol. 34, No. 2, p. 198, 201, 202 では誤った情報が記載されている．

(2)

そこで，Instant Checkmate 社に対してインタビューによる調査を行ったが，単純に広告の収益率を最大化するようなものを選択しており，恣意的な差別は認められなかった．このテンプレートは姓のみに基づいて選択しており，他の規準はないとのことであった．これは，データ分析技術自体には偏見はないが，データに含まれる社会の悪意が，意図せず反映されてしまった事例といえる． 2･2 再犯リスクスコアの事例次に，データジャーナリズム NPO の Propublica による再犯リスクスコアに対する指摘を紹介する [Angwin 16]．データジャーナリズムとは，データ分析を用いたエビデンスに基づくジャーナリズムで，記事とともに分析過程やデータをも公開している．ここでいう再犯リスクスコアは，被告人が 2 年以内に再び犯罪を犯す可能性を評価するものである．過去の裁判システムには人種に対する主観的な偏見があったとの反省に立ち，エビデンスに基づく決定を重視するという方針で導入が進んでいる．この記事中でも指摘していることではあるが，スコアの導入自体ではなく，そのスコアに偏りがあることを問題視している点が重要である．このようなエビデンスを重視する方針がなければ，統計分析に基づいたこうした厳密な議論すらできなかったであろう．本題に戻り，再犯リスクの予測の傾向が人種間で異なっているとの ProPublica の分析結果を紹介する．具体的には，実際には 2 年間に再犯しなかった人が，再犯すると誤って予測されてしまった割合は，アフリカ系が 45％であるのに対し，ヨーロッパ系では 23％であった．すなわち，アフリカ系の人について，実際には更生する人を再犯すると予測してしまいやすい．逆に，その後 2 年の間に実際に再犯しまった人を，再犯しないと誤って予測してしまった割合は，アフリカ系が 28％でヨーロッパ系が 48％であった．すなわち，実際には再犯するヨーロッパ系の犯罪者を見逃しやすい．ここで注意すべきは，全般的にはアフリカ系の場合のほうが実際の犯罪率は 51％対 39％と高いので，アフリカ系の人を全般的に高リスクであると判定してしまうことを問題としているわけではない．予測には不確実性が必ず伴うが，大まかにいえば，この不確実性に人種間で差があるという指摘である．予測アルゴリズムはデータ量が十分であるなど条件が整えば，こうした予測の不確実性には偏りが生じないように設計されている．しかし，実際にはこうした条件が十分に満たされない場合もあり，特に悪意ある操作をしなくても，この事例のような差が生じ得る．

3．データマイニングにおける

公平性規準

特徴と目的変数についていくつかの記号を定義したあと，データマイニングや機械学習分野における形式的な公平性の規準を示す．公平性の規準として確率論的なものを先に述べ，その後でゲーム理論・経済学の概念に基づく公平性を紹介する．最後に，形式的な公平性のその他の要素を紹介する． 3･1 表記 確率変数 S と X は，それぞれセンシティブ特徴 （sensitive feature）と非センシティブ特徴（もしくは，単に特徴；non-sensitive feature）を表す．公平性配慮型データマイニングでは，センシティブ特徴の表す性質に対して公平性を保証しつつ分析する．例えば，与信，採用，保険などの決定について扱うとき，社会的公平性の観点からその関与を排除すべき対象者の性別や人種といった個人属性情報を，このセンシティブ情報とする．なお，このセンシティブ特徴に何を設定するかは，データマイニングで扱うタスクと，法や規制などの社会的環 境を考慮して与えるものとする．S は，連続変数でも離 散変数でも，またスカラでもベクトルであってもよい．しかし，既存の研究では主に定義域が {0, 1} である 2 値変数でスカラの場合が扱われており，本稿はこの場合に限定する．値 1 と 0 をとるときを，それぞれ非保護状態（non-protected）と保護状態（protected）にあるといい，あるデータ集合中で，保護状態にある事例の集合を保護グループ，それ以外の事例集合を非保護グループという．保護グループのほうが少数で，不利な決定を受ける可能図 1 人名で検索した場合に表示される Web 広告の例＊1

（a）アフリカ系の“Latanya Farrell”で検索した場合（b）ヨーロッパ系の“Jill Schneider”で検索した場合

＊1 [Sweeney 13] Communications of the ACM by Association for Computing Machinery Reproduced with permission of ASSOCIATION FOR COMPUTING MACHINERY in the format Republish in a journal/magazine via Copyright Clearance Center.

(3)

性が高いと仮定する．一方の非センシティブ特徴 X は， 対象を表す特徴の中で，上記のセンシティブ特徴以外の すべてを含む特徴ベクトルである．確率変数 Y は目的変 数で，与信・採用・保険などの決定を表し，分析者はこの変数の表す内容に関心がある．公平性配慮型データマ イニングでは，Y は，与信などで有利な決定をする場合 を正クラス 1 で，不利な場合を負クラス 0 で表す二値変 数となる場合が主に研究されている．この Y については， さらに結果の予測値を Yˆ，観測値を Y として区別する． 3･2 確率論的な公平性最初に最も議論が進んでいる確率論的な公平性を紹介 する．これは，変数 S, Yˆ, Y，および X の間の独立性や 無相関性で形式的な公平性を定義する．この種の公平性は，米国の Uniform Guidelines on Employee Selection

Procedure [Feldman 15]の優遇されたグループとそうでないグループの雇用の比率を定めた規則などを参考に考案されたものである．最も単純な規準は，センシティブ特徴を取り除い てモデルを訓練する，すなわち目的変数は S とは独 立で，X のみに依存する，Pr [Yˆ｜X]＝Pr [Yˆ｜S, X] と いうものである．この条件は条件付き独立性 Yˆ S｜X に該当する．この条件を満たさない場合は，直接差別（direct discrimination）[Pedreschi 08] や disparate

treatment [Feldman 15]と呼ばれている．しかし，もしセンシティブ特徴と他の特徴との間に依存関係があれば，その特徴を通じてセンシティブな情報が結果に影響してしまう．例えば，人種ごとにまとまった地域に住んでいることはよくあるため，たとえ人種という情報を直接的に使わなくても，住所の情報を用いて分析すると間接的に人種の情報を使ってしまうことになる．この現象は red-lining 効果 [Calders 10] と呼ばれている．また，この効果のために，分析過程からセンシティブ情報を取り除くだけでは予測結果を十分に公平にすることはできない．そして，現状では公平性保証のために収集しないセンシティブな情報を，逆に収集しなければ対応できないという問題もある．次に，red-lining 効果をも考慮した公平性規準について述べるために，2･1 節の広告配信の例を考えよう．この例では，社会の偏見に基づく判定がデータに含まれていることが原因となっている．すなわち，アフリカ系の人に対して犯罪歴を示唆する広告文があるとクリックするという偏見のある判断がデータに含まれている．よって，データの判断を部分的に無視して，センシティブ情報が変わっても同じ割合で広告文を選ぶようにする形式的公平性を考える [Calders 10]．すなわち，センシティ ブ特徴 S がアフリカ系とヨーロッパ系とのいずれの場 合でも，選択する広告文の比率を一定に保つようにす る．これは，図 2（a）の S ＝ 0 と 1 の二つの場合の比 率（図中の矢印で示した黒塗り部分）が一致するという ことである．この規準は，一般的には，Yˆ と S の統計的 独立性 Yˆ S に当たる．この条件を満たさない不公平性 を，間接差別（indirect discrimination）[Pedreschi 08] や disparate impact [Feldman 15] といい，特に S が二 値の場合の公平性を統計的均一性（statistical parity） [Dwork 12]という．disparate treatment はセンシティブな情報を使わないという手続き上の公平性だが， disparate impactは結果に対する公平性である [Barocas 17]． 2･2 節の再犯リスクスコアの例では別の公平性規準が必要になる．この場合は，主観的な判断ではなく，実際に再犯をしたかどうかという客観的基準によってクラスは決定される．ここでの問題は，データ量が十分ではないなどの理由による帰納バイアスにより予測結果に偏りが生じているということである．この場合，スコアによ るリスクの高低は Yˆ，実際に 2 年に以内に再犯したかは Yに該当する．このとき，実際の結果 Y に対して，予測 結果 Yˆ がどれくらい外れてしまうのかを，センシティブ 特徴の値によらないように調整する．これは，図 2（b） のように，データ Y と予測 Yˆ の間の 2 組の比率（図中 の矢印で示した黒塗り部分）が，センシティブ特徴 S の 値が 0 であっても 1 であっても同じになるようにする [Hardt 16]．この規準は，Y が与えられたときの Yˆ と

Sの独立性 Yˆ S｜Y と形式的には表せ，均等オッズ

（equalized odds）[Hardt 16, Zafar 17b] などと呼ばれている．なお，条件なし独立であっても，条件付き独立になるわけではないので，均等オッズと統計的均一性は同時には達成できない場合がある．特定の条件・文脈が成立するときにのみ差別的かどうかを扱う場合があり，相関ルールを対象に扱われている [Pedreschi 08].例えば，ローンの可否を決めるとき，アフリカ系全般では不公平な扱いはないが，ある特定の居住地に限れば不公平がある場合である．このような場合 は文脈依存独立性（context-specific independence）Yˆ S｜X＝x で表せる． 3･3 その他の観点での公平性規準確率論以外の観点の公平性規準として，ゲーム理論に基づくものと，経済学に基づくものを順に紹介する．ゲーム理論では，公平分割問題 [宍戸 03] における無羨望（envy free）の規準を導入したものがある [Zafar 17a]．

Ŷ = 1 S = 1 Ŷ = 0 Ŷ = 1 Ŷ = 0 S = 0 FPR TPR FPR TPR Y = 0 Y = 1 S = 1 S = 0 Ŷ=1 Ŷ = 0 Ŷ=0 Ŷ = 1 Y = 0 Y = 1 Ŷ=1 Ŷ = 0 Ŷ=0 Ŷ = 1 図 2 形式的な公平性の規準（a）予測の比率の一致（b）予測誤差の比率の一致

(4)

3･2 節の規準は，出力 Y の比率といった，グループ間で共通の指標に基づいていた．公平分割問題での無羨望規準では，指標はグループごとに存在し，全グループにとって自グループの規準に照らして良い状態であれば受け入れるというものである．この考えを利用して，予測器は各グループごとにあり，自身の予測器を用いたほうが他グループの予測器を用いるより，有利な判定を受ける割合が多い予測器をそれぞれ採用するという公平性規準を提案している．経済学の，社会自体の貧富の差を評価する指標（Gini 係数など）を利用する規準も提案されている [Speicher 18]．例えば，支払ができない人に対して，支払が可能と予測されると，その人は大きな利益を得て，逆であれば大きな損失を被るだろう．このようにして予測によって個々の参加者が得る利益を定義し，この利益がグループ間で貧富の差が小さくなっているかで公平性を評価する． 3･4 形式的な公平性のその他の要素公平性規準にはほかにも考慮すべき点がある．まずグループ公平性（group fairness）と個人公平性（individual fairness）について述べる [Dwork 12]．グループごとの平均がグループ間で一致しているのがグループ公平性で，3･2 節で述べたものはすべてこのグループ公平性である．一方で，センシティブ情報は異なるが，非センシティブ情報は全く同じ一対の個人がいたとしたとき，その個人は同様の扱いを受けるのが個人公平性である．この個人公平性を検証する手続きは situation testing などとも呼ばれる [Luong 11]． 公平性には S や Y の値を対称に扱う場合と，非対称 に扱う場合がある．S の対称性は，保護・非保護グルー プを同等に扱って公平にする場合と，保護グループが差別的に扱われないように，すなわち非保護グループと 同等以上の扱いを受けるようにする場合である．Y の対 称性は，有利に扱われる場合の利益と，不利に扱われる場合の損失を同等に評価するかどうかということである [Žliobait˙e 17]． 条件なし独立性 Yˆ S が成立しなくても，依存して いる条件 Yˆ S｜X（E）_{によっては公平である場合があ} る．ここで，X（E）_{は非センシティブ特徴 X の部分集合} である．X（E）_{は，たとえ間接的に目的変数に影響を与} えたとしても，専門家や分析者が問題ないと判断した要因を表し，説明可能特徴（explainable feature）や legallygrounded attributeという [Calders 13, Žliobait˙e 11]．文献の例では，女性の入試の合格率が低かったとしても，それが全般的に合格率の低い医学部を受ける比率が女性のほうが高く，また合格率の高い計算機科学を受ける比率が男性のほうが高かったためであったとした ら不公平とはいえず，このとき，受験する学部が X（E） に該当する．また，因果推論の文脈では X（E）_は交絡因子や合流点に該当し，傾向スコアを導入して扱うことができる [Calders 13]．

4．

公平配慮型データマイニングのタスク

公平配慮型データマイニングの分析タスクは，不公平発見（unfairness discovery）と不公平防止（unfairness prevention）に大きく分類できる [Ruggieri 10]．不公平発見では，判断結果に不公平なものが含まれているか，また含まれているとすればその結果を抽出する．不公平防止とは，不公平な分析結果が生じないようにしつつ，クラス分類や回帰といった分析を行う手法である．不公平発見は，データベースとアルゴリズムを対象とするものがある．データベースは，多くの事例に対する判断結果と入力の情報を保持したものである．このデータベースから，判断結果を導く相関ルールを列挙し，この中から不公平なものを発見する [Pedreschi 08]．また，データベースに対して因果推論を適用して，センシティブ情報の判断結果への影響を調査したりする [Zhang 18]．アルゴリズムは，特徴ベクトルを入力として与えると，その結果のみを観測できるブラックボックス予測器を対象とする．さまざまなデータをアルゴリズムに入力し，その出力を観測することで，センシティブ情報の目的変数に与える影響の度合いを測ってそのアルゴリズムを監査する [Adler 16]．不公平防止では，通常の予測問題と同様に，多様な目的変数が扱われている．最初は分類を対象としたもの [Calders 10] が提案され，その後，回帰 [Calders 13]，次元削減 [Bolukbasi 16]，推薦 [Kamishima 12a, Kamishima 18b]，ランキング [Zehlike 17] などのほかの予測問題に拡張されていった．これらの手法は，公平性を達成する過程の違いに基づいて，前処理型（pre- process），中処理型（in-process），および後処理型（post-process）に分けられる [Ruggieri 10]．図 3 は（Y, X, S）上の分布を表す．水平な平面で表したものは確率分布のモデル分布の族を表すモデル部分空間，垂直な平面は 3 章の規準を満たす公平部分空間である．公平性制約を満たさない可能性のあるⓐの分布から得た標本・訓練データから，公平性を満たすモデル分布の中で最も近似誤差の小さなⓑを見つけることが，不公平防止タスクの目標である．前処理型では，図 3 ⓐの訓練データを公平性を満たしつつひずみが最小なⓒに写像し，その後，通常の分類器などを使って目標モデルⓑを見つける [Kamiran12a, Feldman 15]．任意の分類器を利用できる利点があるが，分類器についてなんら仮定を導入せずに公平部分空間への適切な写像を決めるのには困難が伴う．中処理型の手法は，図 3 ⓐの訓練データから，目標モデルⓑを直接獲得する [Kamishima 12b, Zafar 17c]．この手法はモデルに対する制約が少ないので，潜在的に最

(5)

も良い公平性と性能のトレードオフを達成できる可能性がある．しかし，目的関数の設計やその最適化には技術的な困難が伴う．後処理型では，通常の予測器を使って学習してⓓのモデルを獲得し，その後，公平性制約を満たすようにそのモデルを修正して目標モデルⓑを得る [Calders 10, Hardt 16, Kamiran 12b]．この方法では，公平な予測結果は非センシティブ特徴には依存せず，通常の予測モデルⓓの予測結果とセンシティブ特徴にのみ依存する紛失性（oblivious）[Hardt 16] という制約のため，公平性と性能のトレードオフの観点からは不利である．しかし，この仮定により公平な予測器の設計とその学習は非常に簡潔になる．

5．

不公平防止の手法

分類問題とその他の問題に分けて不公平防止用の予測手法を紹介する． 5･1 クラス分類問題最も多くの手法が開発されている公平性配慮型のクラス分類器を，4 章で述べた前処理型，中処理型，および後処理型に分けて紹介する． § 1 前処理型前処理型では入力データを，クラス分類結果に影響しないように変換する．マッサージング（massaging）は，訓練データのクラスラベルを置き換える方法である [Kamiran 12a]．図 4 の上の列は非保護，下の列は保護グループである．また，丸一つが各訓練データに該当し，＋と−はそれぞれデータ中の正負のクラス 1 と 0 を表す．何らかの分類器によって変換前のデータで正クラスへのなりやすさを予測し，その順に整列する（図の矢印の方向）．そして，保護・非保護グループの正負のクラスの比率が一致する点（図中の実線）でクラスの正負が分かれるように，点線で囲んだ事例のラベルを反転させる．この例では，上段の 4 個の正クラスから負クラス，下段の 1 個を負クラスから正クラスに変換する．あとは，この変換したデータで再び分類器を学習させるものである．この方法は簡潔である点で優れるが，変換の前後で用いる分類器が異なる場合は必ずしも最適な結果は得られない． Feldman らのアルゴリズムは，クラスラベルではなく非センシティブ特徴を書き換える [Feldman 15]．形式的には，センシティブ特徴値で条件付けした非センシティ ブ特徴 X の分布 Pr [ X｜S＝s] がすべての可能な値で一 致するように，X の値を変換する．置き換える値は，こ の条件付き分布の累積密度関数を経験的に求め，S ＝ 0 と S ＝ 1 での累積密度が等しい点での X の値の中央値に する．この変換では，特徴値の大小関係は保存されるので，クラス分類への影響は小さくて済む．その他，センシティブ情報を置換する方法 [Hajian 13]や，個人公平性を考慮する [Zemel 13] などの手法がある． § 2 中処理型中処理型では，分類器の学習時に公平性を満たすようにする．正則化を用いる方法 [Kamishima 12b] は，分類器の目的関数に，公平性を強化するための正則化項を加えたものを目的関数とし，これを最小化する． s ln L（Ds;θ）＋η （ , SYˆ ）＋ λ _‖ θ（s）‖22 RPR min θ － 2 s （1）第 1 項は負の対数尤度関数をセンシティブ情報が同じデータごとに求めたものの和で，第 3 項は過学習を防ぐ L2正則化項である．第 2 項は prejudice remover と呼ぶ項で，公平性を保つための制約項である．この文献では Yˆと S の非独立性を測るためこれらの変数の相互情報量 を用いた． RPR（ , S）＝n , S Pr[ , S] ln Pr[ , S] Pr[ ] Pr[S] Yˆ Yˆ Yˆ Yˆ Yˆ （2）定式化は簡潔であるが，目的関数が凸関数と凹関数の和であり全体として非凸となるため，その最適化は難しい．また，公平性と精度のトレードオフを良くするには，確定的なクラスの決定則の影響を明示的に考慮する必要がある [Kamishima 18a]．

Zafar らの方法 [Zafar 17c] は，Y と S の独立性では なく，無相関性を制約とする．無相関でもセンシティブ情報の影響は残ってしまうのだが，目的関数の最適化は容易になる．ロジスティック回帰のような線形モデルでは次のような制約付きの最適化問題になる． fair sub-space model sub-space

fair model sub-space

c a d b c a d b c a d b 図 3 不公平防止手法の分類 -- - -S = 1 S = 0 + + + + + + + + + -+ + + Pr[Ŷ=1∣∙] 図 4 マッサージング

(6)

min θ － lnL（D ;θ） s.t. _N1 （si－¯s）（θTxi） ≤η i （3）目的関数は負の対数尤度で，この関数を相関の絶対値が十分に小さいという制約条件のもとで最小化する．制 約式中の， ¯s はセンシティブ変数の平均値で，この平均 値からの各データの乖離が si− ¯s である．一方のθTxiは決定平面からの乖離を表し，これらの乖離の積の全訓練 データについての平均が S と Yˆ の共分散となる． この共分散を小さく保つことで，無相関性を達成する．ほかには，決定木の葉ノードでのクラス分布を調整して公平性を確保する Kamiran らの方法 [Kamiran 10] や，η中立性を用いる福地らの方法 [Fukuchi 13] などがある． § 3 後処理型後処理型は，通常の分類器で得られたクラスラベルを公平性が保たれるように置換する．Calders らは，保護・非保護グループそれぞれの訓練データから通常の方法で単純ベイズ分類器を学習し，その事前分布を修正することで公平な決定をする 2‒ 単純ベイズ法（two-naive-Bayes method）を提案した [Calders 10]．Reject Option based Classiﬁcation 法 [Kamiran 12b] は，統計的均一性を達成するように決定境界に近い事例の分類 結果を書き換える．通常は Pr [Y＝1｜X]  0.5 なら正クラスに分類するが，この決定境界 0.5 付近では予測は不確実であると考える．そこで [1−θ, θ], 0.5＜θ1 の領域では，非保護グループでは正クラスと予測された事例は負クラスに，逆に保護グループでは負クラスと予測された事例を正クラスに分類することで公平性を高める．さらに，誤分類のコストを考慮するコスト配慮型学習 [Elkan 01]とこの手法との関連についても論じている．統計的均一性ではなく，均等オッズを達成するように置き換える手法は，Hardt らが提案している [Hardt 16]． 5･2 その他の予測問題分類以外の予測問題で，公平性を考慮する方法についてまとめる．目的変数の定義域が実数である回帰問題では，保護・非保護グループ間で平均を一致させる方法 [Calders 13] やη中立性と呼ぶ max ダイバージェンスに基づく制約を用いる方法 [Fukuchi 13] などがある． Pérez-Suay らは，Hilbert-Schmidt 独立性規準（HSIC） を制約項として用いて，線形回帰・カーネル回帰で Yˆ と Sの独立性を達成する手法を提案している [Pérez-Suay 17]．その他，上記の回帰で用いた HSIC は次元削減にも適用でき，データからセンシティブ情報を除去することができる [Pérez-Suay 17]．小宮山らは，回帰において統計的均一性を制約として入れた最適化は非凸な最適化問題になり正確に解くことが難しいことを示した [Komiyama 18]．また，例外的に二乗誤差の場合は正確な最適化が可能なことを示した．自然言語処理では，単語を Skip-gram などのモデルを用いて低次元空間のベクトルで表現する．このようなベクトルでは，「王」は「男性」に，「女王」は「女性」に近いといった，意味の近さがベクトル間の類似性に反映される．このとき，学習に用いたコーパスに影響されて，「船長」は「男性」に，「看護師」は「女性」に近いといった職業における性別の偏りが生じていた [Bolukbasi 16]．これら偏りの見られた単語を性別とは無相関に変換することで補正する手法を提案している．推薦は，利用者が好むであろうものを予測して，それを利用者に提示するタスクである．利用者が商品に付けるであろう評価スコアを予測する問題で，センシティブ情報を除外して公平性を確保する研究がある．神嶌らはクラス分類に用いた正則化項を推薦にも利用している [Kamishima 12a, Kamishima 18b]．また，神嶌らはグラフィカルモデルを用いた推薦モデルも提案している [Kamishima 16]．これは，トピックモデルを用いた協調フィルタリングモデル [Hofmann 99] に，評価スコアとセンシティブ情報が独立となるようにセンシティブ変数を追加したものである．これらの手法は統計的均一性を達成するように設計されているが，均等オッズ，すなわち保護・非保護グループ間で予測誤差を等しくする手法も提案されている [Yao 17]．ランキングとは，情報検索の結果などで用いられるもので，目的に適合したものから順に整列したリストを提示するタスクである．このリストは，検索内容への一致度などを個々の対象について求め，それが大きいものか ら順に整列し，上位 k 個を選択して作製する．このラン キングもデータやアルゴリズムによってさまざまな偏向が生じることが知られている [Baeza-Yates 18]．こうした偏向を除去するために FA＊IR アルゴリズムは考案された [Zehlike 17]．まずランキングにおける公平性はクラス分類など他の問題とは若干異なる点がある．クラス分類は対象を個別にクラスに割り当てるのに対し，ランキング問題では複数の対象を同時に扱う必要がある．そこで，リストの最上位から最下位までのどの順位であっても，リストのその順位までに含まれる対象の保護・非保護グループの比率が，データ全体のそれと統計的に有意な差がない場合にリストは公平であると定義する． FA＊IR では，保護・非保護のグループに対してそれぞれでリストを作製したあと（図 5 右），それらを一つのリストに併合する（図 5 左）．併合するときには，適合度の大きなものから順に選ぶのだが，そこまでのリストの保護・非保護グループの比率が全体の比率と大きく違ってしまいそうな場合は，比率の差を緩和するような対象を加える．図 5 の例では，第 3 位に非保護グループから適合度 0.9 の対象を加えようとすると，リストの上位 3 位までの比率と全体の比率との差が規定値を超えてしまう．そこで，この例では保護グループで最も適合度

(7)

の大きなものを併合リストに加えることで，この比率の差を緩和している．公平性に配慮したランキングアルゴリズムは Singh ら [Singh 18] などの研究もある．

6．その

他の話題

公平性に関わる話題を二つ紹介する．まず，ここまでは一度だけの決定について考慮したが，この決定を何度も繰り返すとどうなるかという点についての分析を紹介する [Liu 18]．銀行が貸出しを認めるかどうかの例を考えてみよう．保護グループに貸出しを認める割合を非保護グループと同じにしたとき，非保護グループで返済能力の高い個人より保護グループ中のより返済能力の低い個人に貸出しを認めたとしよう．その結果，返済率は保護グループで悪化し，そのデータから予測器を再学習すると保護・非保護グループの予測返済率の差は広がる可能性がある．すると，公平性を保証するための仕組みによって，保護グループの信用に悪影響を与える可能性がある．そこで，銀行側の効用（返済による利益）と，保護・非保護グループの借り手の信用スコアの変動の，返済率に基づくモデルが与えられたと仮定する．また，公平性を無視した場合，disparate impact，均等オッズの各条件を満たす，ローンの受理方策を想定する．そして，このモデルがどういう条件を満たせば，信用スコアが各グループで増減するのかを分析している．公平性とともに，決定に至る判断規準を明らかにする透明性（transparency）・説明可能性（explainability）や，判断過程自体を明らかにし，作為的な行為がないことを示す説明責任（accountability）も，EU の GDPR などによって重視され始めている．これらの状況をふまえ，透明性・説明可能性のため，機械学習の予測結果を解釈する手法の研究も活発になっている．ここでは，そうした研究の一つである LIME（Local Interpretable Model-agnostic Explanations）アルゴリズムを紹介しておく [Ribeiro 16]．画像を入力すると，そこに写っているのが狼かハスキー犬かを識別する例を考えよう．画像と識別結果の対応関係は，多種多様な画像があるため非常に複雑なものとなり，人間がその対応関係を見いだすのは容易ではない．この対応関係を概念的に示したものが図 6で，ハスキー犬と狼を 2 色の領域に塗り分けて表示している．LIME では，この複雑な対応関係を単純なものに変換することで説明とする．まず，対応関係全般を考える代わりに，ある特定の分類結果（図 6 の太い＋印）について注目する．そして，その画像を少し変えたときハスキー犬になるか狼になるかということを調べ，変え方の影響を調べることで簡潔な対応関係を見つけて，説明とする．図 7（a）の画像はハスキー犬だが，狼と誤識別されてしまった事例である．図 7（b）は画像の中で，狼と識別した根拠となった部分だが，背景の雪だけになっている．狼の画像では，偶然にも雪の場面が多かったため，雪が写っていることを根拠に狼と識別してしまったことがわかる．このようにして，アルゴリズムによる判断の根拠を調査することができる．

7．ま

とめ

最後にデータマイニング・機械学習における公平性に関連した会議の動向についてまとめておく．機械学習における公平性を扱うワークショップは最初に ICDM 2012に併設された．その後，NIPS 2014 で新

たに「Fairness, Accountability, and Transparency in Machine Learning」のワークショップが始まり，その後毎年開催されている．NIPS 2016 ではシンポジウム「Machine Learning and the Law」などのイベントも企画され，KDD 2017 や NIPS 2017 では基調講演のテーマともなった．チュートアリルも，不公平発見に詳しい KDD 2016併設 [Hajian 16]，法学と学習理論を中心とする NIPS 2017 併設 [Barocas 17]，および因果推論の研究者による KDD 2018 併設 [Zhang 18] などが開催されている．2018 年からは，新たな国際会議 Conference S = 0 S = 1 1.0 1.0 0.9 0.3 0.7 0.5 1.0 1.0 0.7 0.9 図 5 FA ＊ IR アルゴリズム図 6 LIME による説明の生成図 7 ハスキー犬を狼と誤識別した場合の説明（a）狼と識別された画像（b）識別結果の説明

(8)

on Fairness, Accountability, and Transparency＊2_が始まった．また，機械学習・データマイニング分野における公平性については著者もサーベイ＊3_{を公開しているの} で，関心のある読者は参考にされたい．本稿で述べたように，データ分析は公平性などに問題を生じることがあり得る．しかし，このことはデータ分析を利用すること自体の問題ではない．2･2 節の再犯リスクスコアが導入された経緯も，人間による偏見を少なくしようとするためであった．もし定量的な分析が導入されていなければ，このような不公平が存在することや，それがどのようなものであるかということすら明らかにはならなかったであろう．分析技術で生じた不公平な状況は，本稿のようなアルゴリズムの改良によって対処できるものであると考えている．機械学習・データマイニング分野での公平性の研究はまだ始まったばかりであり，多くの研究課題がある．分類問題が集中的に研究されており，他の予測問題については十分に研究されているとは言いがたい．センシティブ変数は 2 値のスカラがほとんどで，他の場合について，また説明可能変数がある場合については研究は少ない．最適化は制約のために非凸最適化問題になりやすく困難を伴うし，大規模化や，あとからセンシティブ変数を変更するなど運用上の問題もある．理論面でも，予測精度に加えて，公平性の汎化性能評価などを同時に考える必要がある．これら多くの課題があり，今後の研究の進展が期待される．

◇ 参考文献 ◇

[ACMCoE] ACM Code of Ethics and Professional Conduct, https://www.acm.org/code-of-ethics

[Adler 16] Adler, P., Falk, C., Friedler, S., Rybeck, G., Schedegger, C., Smith, B. and Venkatasubramanian, S.: Auditing black-box models for indirect inﬂuence, Proc. 16th IEEE Int. Conf. on

Data Mining, pp. 1-10（2016）

[Angwin 16] Angwin, J., Larson, J., Mattu, S. and Kirchner, L.: Machine bias（2016）, https://www.propublica. org/article/machine-bias-risk-assessments-incriminal-sentencing

[Baeza-Yates 18] Baeza-Yates, R.: Bias on the web, Commun.

ACM, Vol. 61, No. 6, pp. 54-61（2018）

[Barocas 17] Barocas, S. and Hardt, M.: Fairness in machine learning, 31st Annual Conf. on Neural Information Processing

Systems, Tutorial（2017）, https://mrtz.org/nips17/ [Bolukbasi 16] Bolukbasi, T., Chang, K.-W., Zou, J. Y., Saligrama,

V. and Kalai, A. T.: Man is to computer programmer as woman is to homemaker? Debiasing word embeddings, Advances in

Neural Information Processing Systems, Vol. 29（2016） [Calders 10] Calders, T. and Verwer, S.: Three naive bayes

approaches for discrimination-free classiﬁcation, Data Mining

and Knowledge Discovery, Vol. 21, pp. 277-292（2010） [Calders 13] Calders, T., Karim, A., Kamiran, F., Ali, W. and

Zhang, X.: Controlling attribute effect in linear regression,

Proc. 13th IEEE Int. Conf. on Data Mining, pp. 71-80（2013） [Dwork 12] Dwork, C., Hardt, M., Pitassi, T., Reingold, O. and

Zemel, R.: Fairness through awareness, Proc. 3rd Innovations

in Theoretical Computer Science Conf., pp. 214-226（2012） [Elkan 01] Elkan, C.: The foundations of cost-sensitive learning,

Proc. 17th Int. Joint Conf. on Artificial Intelligence, pp. 973-978

（2001）

[江間 18] 江間有沙，長倉克枝：倫理的に調和した設計の論点整理─ 異分野・異業種によるワークショップからの示唆，情報法制研究， No. 4（2018）

[Feldman 15] Feldman, M., Friedler, S. A., Moeller, J., Scheidegger, C. and Venkatasubramanian, S.: Certifying and removing disparate impact, Proc. 21st ACM SIGKDD Int.

Conf. on Knowledge Discovery and Data Mining, pp. 259-268

（2015）

[Fukuchi 13] Fukuchi, K., Sakuma, J. and Kamishima, T.: Prediction with model-based neutrality, Proc. ECML PKDD

2013, Part Ⅱ, pp. 499-514, [LNCS 8189]（2013）

[GDPR] General Data Protection Regulation, http://data. europa.eu/eli/reg/2016/679/oj

[Hajian 13] Hajian, S. and Domingo-Ferrer, J.: A methodology for direct and indirect discrimination prevention in data mining,

IEEE Trans. on Knowledge and Data Engineering, Vol. 25, No.

7, pp. 1445-1459（2013）

[Hajian 16] Hajian, S., Bonchi, F. and Castillo, C.: Algorithmic bias: From discrimination discovery to fairness-aware data mining, 22nd ACM SIGKDD Int. Conf. on Knowledge

Discovery and Data Mining, Tutorial（2016）

[Hardt 16] Hardt, M., Price, E. and Srebro, N.: Equality of opportunity in supervised learning, Advances in Neural

Information Processing Systems, Vol. 29（2016）

[Hofmann 99] Hofmann, T. and Puzicha, J.: Latent class models for collaborative filtering, Proc. 16th Int. Joint Conf. on

Artificial Intelligence, pp. 688-693（1999）

[IEEEGIoE] The IEEE Global Initiative on Ethics of Autonomous and Intelligent Systems, https://ethicsinaction.ieee. org/

[Kamiran 10] Kamiran, F., Calders, T. and Pechenizkiy, M.: Discrimination aware decision tree learning, Proc. 10th IEEE

Int. Conf. on Data Mining, pp. 869-874（2010）

[Kamiran 12a] Kamiran, F. and Calders, T.: Data preprocessing techniques for classification without discrimination,

Knowledge and Information Systems, Vol. 33, pp. 1-33（2012） [Kamiran 12b] Kamiran, F., Karim, A. and Zhang, X.: Decision

theory for discrimination-aware classiﬁcation, Proc. 12th IEEE

Int. Conf. on Data Mining, pp. 924-929（2012）

[Kamishima 12a] Kamishima, T., Akaho, S., Asoh, H. and Sakuma, J.: Enhancement of the neutrality in recommendation, 2nd Workshop on Human Decision Making

in Recommender Systems（2012）

[Kamishima 12b] Kamishima, T., Akaho, S., Asoh, H. and Sakuma, J.: Fairness-aware classiﬁer with prejudice remover regularizer, Proc. ECML PKDD 2012, Part Ⅱ, pp. 35-50（2012）, [LNCS 7524]

[Kamishima 16] Kamishima, T., Akaho, S., Asoh, H. and Sato, I.: Model-based approaches for independence-enhanced recommendation, Proc. IEEE 16th Int. Conf. on Data Mining

Workshops, pp. 860-867（2016）

[Kamishima 18a] Kamishima, T., Akaho, S., Asoh, H. and Sakuma, J.: Model-based and actual independence for fairnessaware classification, Data Mining and Knowledge

Discovery, Vol. 32, pp. 258-286（2018）

[Kamishima 18b] Kamishima, T., Akaho, S., Asoh, H. and Sakuma, J.: Recommendation independence, Proc. of the

Conf. on Fairness, Accountability and Transparency, Vol. 81 of

PMLR, pp. 187-201（2018）

[Komiyama 18] Komiyama, J., Takeda, A., Honda, J. and Shimao, H.: Nonconvex optimization for regression with fairness constraints, Proc. 35th Int. Conf. on Machine Learning, pp. 2742-2751（2018）

[Liu 18] Liu, L. T., Dean, S., Rolf, E., Simchowitz, M. and Hardt, ＊2 https://fatconference.org/

(9)

M.: Delayed impact of fair machine learning, Proc. 35th Int.

Conf. on Machine Learning, pp. 3156-3164（2018）

[Luong 11] Luong, B. T., Ruggieri, S. and Turini, F.: k-NN as an implementation of situation testing for discrimination discovery and prevention, Proc. 17th ACM SIGKDD Int. Conf.

on Knowledge Discovery and Data Mining, pp. 502-510（2011） [Pedreschi 08] Pedreschi, D., Ruggieri, S. and Turini, F.:

Discrimination-aware data mining, Proc. 14th ACM SIGKDD

Int. Conf. on Knowledge Discovery and Data Mining,

pp.560-568（2008）

[Pérez-Suay 17] Pérez-Suay, A., Laparra, V., Mateo-García, G., Muños-Marí, J., Gómez-Chova, L. and Camps-Valls, G.: Fair kernel learning, Proc. ECML PKDD 2017, PartⅠ, pp. 339-355, [LNCS 10534]（2017）

[Ribeiro 16] Ribeiro, M. T., Singh, S. and Guestrin, C.: “Why Should I Trust You?” Explaining the predictions of any classiﬁer, Proc. 22nd ACM SIGKDD Int. Conf. on Knowledge

Discovery and Data Mining（2016）

[Ruggieri 10] Ruggieri, S., Pedreschi, D. and Turini, F.: Data mining for discrimination discovery, ACM Trans. on

Knowledge Discovery from Data, Vol. 4, No. 2（2010） [宍戸 03] 宍戸栄徳，曽道智：公平分割と公平割当，オペレーショ

ンズ・リサーチ，Vol. 48, No. 3, pp. 203-209（2003）

[Singh 18] Singh, A. and Joachims, T.: Fairness of exposure in rankings, Proc. 24th ACM SIGKDD Int. Conf. on Knowledge

[Speicher 18] Speicher, T., Heidari, H., Grgic-Hlaca, N., Gummadi, K. P., Singla, A., Weller, A. and Zafar, M. B.: A unified approach to quantifying algorithmic unfairness: measuring individual & group unfairness via inequality indices, Proc. 24th ACM SIGKDD Int. Conf. on Knowledge

[Sweeney 13] Sweeney, L.: Discrimination in online ad delivery,

Commun. ACM, Vol. 56, No. 5, pp. 44-54（2013）

[Yao 17] Yao, S. and Huang, B.: Beyond parity: Fairness objectives for collaborative filtering, Advances in Neural Information

Processing Systems, Vol. 30（2017）

[Zafar 17a] Zafar, M. B., Valera, I., Rodriguez, M., Gummadi, K. and Weller, A.: From parity to preference-based notions of fairness in classiﬁcation, Advances in Neural Information

Processing Systems, Vol. 30（2017）

[Zafar 17b] Zafar, M. B., Valera, I., Rogriguez, M. G. and Gummadi, K. P.: Fairness beyond disparate treatment & disparate impact: Learning classification without disparate mistreatment, Proc. 26th Int. Conf. on World Wide Web, pp. 1171-1180（2017）

[Zafar 17c] Zafar, M. B., Valera, I., Rogriguez, M. G. and Gummadi, K. P.: Fairness constraints: Mechanisms for fair classiﬁcation, Proc. 20th Int. Conf. on Artificial Intelligence and

Statistics, Vol. 54 of PMLR, pp. 962-970（2017）

[Zehlike 17] Zehlike, M., Bonchi, F., Castillo, C., Hajian, S., Megahed, M. and Baeza-Yates, R.: FA＊IR: A Fair Top-k ranking algorithm, Proc. 25th ACM Conf. on Information and

Knowledge Management（2017）

[Zemel 13] Zemel, R., Wu, Y., Swersky, K., Pitassi, T. and Dwork, C.: Learning Fair Representations, Proc. 30th Int. Conf. on

Machine Learning, pp. 325-333（2013）

[Zhang 18] Zhang, L., Wu, Y. and Wu, X.: Anti-discrimination learning: From association to causation, 24th ACM SIGKDD

Int. Conf. on Knowledge Discovery and Data Mining, Tutorial

（2018）

[Žliobait˙e 11] Žliobait˙e, I., Kamiran, F. and Calders, T.: Handling conditional discrimination, Proc. 11th IEEE Int. Conf. on Data

Mining（2011）

[Žliobait ˙e 17] Žliobait ˙e, I.: Measuring discrimination in algorithmic decision making, Data Mining and Knowledge

Discovery（2017） 2019年 1 月 15 日受理

著　者　紹　介

神嶌敏弘（正会員） 1968年生まれ．1992 年京都大学工学部情報工学科卒業．1994 年同大学院工学研究科情報工学専攻修士課程修了．2001 年博士（情報学）．1994 年電子技術総合研究所入所．2001 年電子技術総合研究所は産業技術総合研究所へ再編．推薦システム，データマイニング，機械学習に関する研究に従事．AAAI， ACM，電子情報通信学会各会員．小宮山純平 2009年 4 月から 2012 年 6 月まで株式会社ドワンゴにソフトウェアエンジニアとして勤務．2012 年 10 月より東京大学大学院情報理工学系研究科数理情報学専攻に入学，2016 年 3 月に博士（情報理工学）を取得．2016 年 4 月より東京大学生産技術研究所助教．機械学習・データマイニング分野に関する研究に従事．2015 年 IBISML 研究会賞（IEICE TC-IBISML Research Award）．

機械学習・データマイニングにおける公平性

1．は

じ め に

2．データ

分析で公平性が議論された背景

機械学習・データマイニングにおける公平性

Fairness in Machine Learning and Data Mining

神嶌 敏弘

小宮山 純平

Keywords:

3．データマイニングにおける

公平性規準

4．

公平配慮型データマイニングのタスク

5．

不公平防止の手法

6．そ の

他 の 話 題

7．ま

と め

◇ 参 考 文 献 ◇

著 者 紹 介

じめに

神嶌　敏弘

小宮山　純平

6．その

他の話題

とめ

◇ 参考文献 ◇

著　者　紹　介