探索的データ解析およびイメージ描画のためのヒュ
ーマン・インターフェイスの研究
著者 杉本 富利 学位授与大学 東洋大学 取得学位 博士 学位の分野 工学 報告番号 乙第114号 学位授与年月日 1999-03-15 URL http://id.nii.ac.jp/1060/00000132/探索的 データ
解析およびイメー
ジ描画のための
ヒューマン・インターフェイス
の研究
レ│
川9
8
目 次
1 2 章ヒューマン・ 2.1 2.2 ヒューマン・インターフェイス のた め の 認知モ デル ………8 2.2.1 視覚 認 知 の 空 間モ デル ………8 2.2.2 感 覚 距 離空 間 の構成 法 ………10 2.2.3 写 像関 数 の同 定 法 ………152.3 探 索 的 データ 解 析 の ため のヒューマン・インターフェイス ………17 2.3 ∠1 探索 的 データ 解析 ………17 2.3.2 多 次元 グラフ 表 現 法 の 比較・ 評価 ………192.4イメー ジ描 画 のた め のヒューマン・インターフェイス ………24 2.4.1イメー ジ探索 問 題 ………24 2.4.2 IGA(Interactive Genetic Λlgorithm) に よ るインターフェイス ………24 2.4.3ファ ジイ 推 論 に よ る 知的インターフェイス ………262.5 まと め ………28
3 章 探 索 的 データ 解 析 の た め の 図 形 的 特 徴 を 利 用 し たインターフェイス …… ……31 3.1 序 言 ………31
3.2 極 座 標フーリエ 級数 グラフ ………32 3.2.1 多 次 元 データ の一 般的 表 現 法 ………32 3.2.2 一・般的 表 現 法 の 問題点 ………353
丿 極 座標フーリエ 級 数 グラフ によ る多 次元 データ 表 現 過 程 の定 式 化 …………383.4 図 形的 特 徴 に データ の量 的 特 性 を 反映 さ せ る表 現 法 ………40 3. 乱 I RDM(Radiated Distance Method) ………40 3.4.2
RDM の 適用 例 ………45
3.4.3 DAM(Divided Area Method)
… …493.4.4 DAM の 適 用 例 ………513.5 ま と め ………53 4 章 探 索 的 データ 解 析 の た め の 表 情 認 知 特 性 を 利 用 し たインターフェイス ………55 4.1 序 言 ………55 4.2 表 情 認 知 特 性 に 優 れ たフェース グラフ の 設 計 ………57 4.2.1 線画を用いた 表情解析 ……… 57 4.2.2フェース グラフ 作 成 ………634.3 フェース グラフ にお け る一 般 的 表 現 法 ………66 4.3.
↓ OTOD 法(One-To-One Direct assignment) ………66 4.3.2 0 TOD 法の 問題 点 ………684.4フェース グラフ の表 情 を活 用 す る た め の表 現 法 ………71 4.4.1 フェース グラフ の表 情認 知 空 間構 成 ………71 4.4.2 フェース グラフ による多次元 データ 表現 過程の定 式化 ………72 4.5 5.1 5.6 6 △L 74 77 5 章 探索的判別分析 のためのフェース グラフ 表現法 ………77 5.2 統 計 学 にお け る 判 別関 数 法 ………78 5.2 ∠L 2 群 の判 別 ………78 5.2.2 多 群 の判 別 ………835.3 判別 分析 の た め の変 数 割 当て 探索 法 ………835.4 変 数 割 当て 評 価 関数 の 比較 ………89 5.4.1 評 価 関 数 と 評価 項 目 ………89 5.4.2 判 別 特性 の比 較 ( 比較I ) ………91 5.4.3 トレーニン グデータ に対 す るロ バスト 既の 比較 ( 比 較H ) ………92 5.4.4 トレーニン グデータ 個 数 に対 す るロ バスト│ 生の 比 較 ( 比 較 m ) …‥935.5 判別 関 数 法 と の 比較 ………95 5.5.1 トレーニン グデータ の個 数 と 判 別 特 性 ………95 5.5.2 異常 データ の検 出 特 性 ………100 6 章 探索的クラスター 分析 のため のフェース グラフ 表現法 ………107 6.2 統 計学 にお け るクラスター 分 析 ………108
6.2.1 クラスター 分 析 の特 性 ………108 6.2.2
類 似 度 又は 距 離 の定 義 ………109 6.2.3クラスター の 妥 当性 の 基 準 ………Ill 6.2.4
計算アル ゴリ ズム ………1136.3 表 情 の感覚 的 距 離を 考慮し た 表現 法 ………114 6.3.1 IF 法(Inverse Function representation) …∠114
6.3.2 IF 法の 基 本特 性 検 証 ………1206.4 IF 法の 適 用 例 ………123 6 ズ 7 ∠L 130 3 7.5 まと め ………153 参 考 文献 ………… 160 7 章 対 話的イメー ジ描画 のた めのインターフェイス ………133 7.2 顔 画 像イメー ジ探 索 ………135 7.2.1 顔 空 間 ………135 7.2.2 顔 画 像イメー ジ探索 ………137 7.2.3 適 合 度割 当 て 戦略 ………137 7.2.4 適 合 度割 当 て 法 の 比較 ………1437.3 感 覚 距 離 空 間で のfuzzy 法 の実 行 ………147 7.3.1 顔 画 像 の感 覚 距 離 空 間 ………147 7.3.2 顔 空 間か ら感 覚 距 離 空 間 へ の 写 像………1487.4 rating all 法 と 顔空 間 及 び 感覚 距 離 空 間 で のfuzzy 法 の 比較 ………150
1 章 序 論
マン・マシン・システム を 取り巻く 環境は,コン ピュータ の発展によって 大きく 変 わりつつあ る. 1 つの変化は集中制御方式 によるシステム の大規模化・ 複雑化で ある. 大規模システム は多くの場合,データ ,エネル ギー ,あるいは危険物質 の集積を伴う・ したがって,そこで の事故は,システム そ のものやシステム の使 用者に対して のみな らず,周囲の環境や一般人に対しても深刻な 結果をもたらす. 自動安 全システム が導 入さ れているにもかかわらず,産業事故は実際に発生しており ,事故後の 分析にお い て,オ ペレータ の過失が重大な 要因であっ たとい う指摘がよくな される.スリーマイル 島やチェルノ ブイリ などにお ける 数多く の事故によっ て, 複雑な 異常 事態 にお けるオ ペレータ の役割 とオ ペレータ への支援体制の最適化問題が指摘さ れるよ う に成っ て き た. もう1 つ の大きな変化 は,安価で強力なコン ピュータ を基盤 にした 近代的 情報技術 の急速な発展である.集 中方式 の経営 決定システム や産業用 生産 設備 におけるコン ピュータ による制御システム は, 意志決定 者やオ ベレータ の作業 状況 を様々な 形で変化 さ せており, 人間及び自動化システム に対する仕事の振り分けが重要な問題と 成っ て きている. このような時代背景の中で更に重要性を 増しているヒューマン・インターフェイス[Rasmussen 90] を本論文では研究 の対 象とする.ヒューマン・インターフェイス は, 人間−コン ピュータ 相互作用の中で 最も中心と成る部分であり,物 理的インターフェイス と知的インターフェイス の部分 から構成さ れている[Hancock 911. 従 来 のインターフェイス 研究で は物理的インターフェイス のみを対 象とする 傾向にあった が,ヒューマン ’インターフェイス 研 究ではコン ピュータ 内部の情報処 理の一部 まで をも含 めた 領域を対 象とする.高度 の人間−コン ピュータ・インターフェイス をど のよ うに構築するかを一般的 に論ずるのは難しいが,ユー ザーフレン ドリー なヒューマン・インターフェイス がどのようなものかといえば,あるタスク に関するユー ザー・モ デル とコン ピュータ の入出力タスク との間の感覚的距離を最小にするツール を含 んだインターフェイス である といえる.つ まり,コン ピュータ の情報処理,及び入出力はユー ザー の感覚的な認知過程に適合さ せる べきであるということである. 本論文では, このような 発想に基づいて 探索的 データ 解析 にお けるヒューマン・インターフェイス と対話的イメー ジ描画 におけるヒューマン・インターフェイス を構築 するための研究 を行う.本論文の主要な研究項目を示すと,以下 のとおりである. (1 ) 人間の情報認知を感覚距離空間への写像とする認知モ デル の作成. (2 ) 認知モ デル に基づい た探索 データ 解析 のためのヒューマン・インターフェ イス の構築. (3 ) 上記インターフェイス とし て, 極座標フーリエ 級 数 グラフ の図形的特 徴を 利 用し た表現法 の開発. (3 )同 様に上 記インターフェイス とし て, 表情を活用でき るフェース グラフ に よる表現法の開発. (4 )イメー ジ探索 問題 にお いて ,人 間の負 荷を軽 減し ,かつ 人間の感覚 をで き るだけ反映させら れるヒューマン・インターフェイス の開発. ヒューマン・インターフェイス の設計に関わる研 究を概観すると, 4 つ の一般的なア プローチ が取られていることが解る[Eberts 87]. そ れは以下 のとお りであ る・ (1 ) 経験的ア プローチ : (2 )予測モ デル 的ア プローチ : (3 )神 人同形同性説的ア プローチ (4 ) 認知的ア プローチ : 経験的ア プローチ は直感ではなく 実際の実験 結果に基づいてインターフェイス を設 計する 立場であ るShneiderman は実験を通してユー ザー が最もよく 反応するメツ セー ジの提示法を示している[Shneiderman 82]. また情報の提示 にお いてRobinson
やTullis は グラフィックス の有効性を報告しているが[Robinson 87][lYillis 81])
方で グラフィックス は意味のある 程には 優れていないという 報告 もあ る[Stern 841. また人 力装 置の効率性を 比較し た研究などがある[Albert 82][Hallor 841. 予測モ デル 的ア プローチ は人間−コン ピュータ の相互作川の最良の状態を予測して, その予測モ デル に基づいてインターフェイス を設計する立 場である.代 表的なモ デル に GOMSモ デル がある[Card 831. こ れはユー ザー がテキストエ ディタ を使う ときのエラー の少ない効率的な操作方法をモ デル 化したものである.こ のモ デル はコン ピュータ のエ ディタ を作成するときの指針を示している. 神人同形同性 説的ア プローチ は非人間的 実体を擬人化することによ って, 人間 一人 問コミュニケーション の プロセス を人間−コン ピュータ 相互作用 のモ デル として 用い る.コン ピュータ は人間らしい特性を取り入れて 人間らしい感覚に合わ せる べきであ るという立場を取っ ている.ユー ザー・フレン ドリー なシステム とは,人間同 士が相 互 に交流するような 方法でコン ピュータ がユー ザー と交流することであると定義さ れ る. Ochsman は人間同士 の対 話を調査し,コン ピュータ と 人間とが 相互作川 する と ざ のモー ドを決定している[Ochsman 74] , またKelly は2 人チーム が問題 を解 決す るとき に使用する語彙を調査レコン ピュータ にインストール する語彙の データ ベース を決定している[Kelly 77]. 認知的ア プローチ で は人間とコン ピュータ の両者による 情報処 理が容易に,し かも 効 率よく行 われるよ うに,認知科学や認知心理学の諸理論を人間 −コン ピュータ・インターフェイス に応 用している.認知理論とは, 人間が情報を認知し,貯蔵し ,情報 を 長期あるいは短期 記憶から検索し,意思決定や 問題解 決をするた めに情報を操作し , 最 後に反応する過程を理論化し たものである.具体的には,類推,空間的推理[Gomez83],スクリ
プト プラン ゜目 標[Robertson'83],メンタルモ デル[Ebei・ts 85], 注意リソース[Robinson
こ れらのア プローチ の幾つかは,互いに重複していて明確に区別することはできな い .認知的ア プローチ と神人同形同性 説的ア プローチ のもとで の研 究には 大い に重複 が 見ら れるし,予測モ デル 的ア プローチ の予測の根拠が 実験に基づいてい れば経験的ア プローチ とも重複する.しかしな がら,ヒューマン・インターフェイス を構築する 立場を このよう に分類するならば,本研 究は神人同形同性説的ア プローチ に立脚して い るといえる. 次 に本 論文 の概要を 各章ごとに示す. 2 章では探索的 データ 解析のためのヒューマン・インターフェイス と,対 話的イメー ジ探索 のためのヒューマン・インターフェイス を構築するために 人間が視覚情報 を認知する過程を感覚距 離空 間への写像としてモ デル 化し, またイメー ジ探索 は感覚 距 離空 間で の目 標イメー ジの探索としてモ デル 化する.加えて,こ れらのモ デル 化の ために重要な多 次元尺度構成法と GMDH について概説する.更に探索的 データ 解析 においては多次元 グラフ 表現法が重 要な役割を果たすが, 6 つの多 次元 グラフ 表現法 を データ の分類 におけ る性能と操作の難易度について比較・ 評価する. 3 章で は極座標フーリエ 級数 グラフ で多 次元 データ の各変数の量的な特性を図形 の 幾 何的特徴 パラメータ として 表現する方 法,すな わちメトリック 極座標フーリエ 級数 グラフ を提案する.この方法では,図形の幾 何的特徴 パラメータ を表現する関数 力 の 逆関数カ' を求 めること ができ れば,こ の逆関 数カ' によって データ を処 理し ,そ れを極座標フーリエ 級数の係数へ代入して グラフ を描く と, データ の各変数 の量的な 特性が図形の幾 何的 特徴パラメータ に反映さ れる.図形 の特徴パラメータ としては次 の2 つ を定義する. (1 )図形 の中心から等角度に放射線を引き,図形の曲線との交点まで の距離 . (2 ) 図形 の中心か ら等 角度に放射 線を引き,2 本の放射線 と図形 の曲線で囲 ま れる領域 の面積の大きさ. 4 章で は, 様々な 表情の変化が実際の人間の顔に則して描き出せるフェース グラフ を作成する.フェース グラフ を 作成するに当たって は, 線 画を川いで 表情解析を 行い・ そ の解析結果に基づいて表情 要素と 表情要素の変化 パターン を 決定 する.フェース グラフ には, データ の変数と表情要素を対応づけする変 数割 当て問題 があ る. データ の 各変 数と表情要素との適切な対応づ けが難しいのである. こ の運川 上の問題を 解決す る表現法を5 章,6 章で提案 するため,そ れの準備として4 章で は,フェース グラフ によって データ を表現し,その表情をユー ザー が認知するまでの過程を表 情の感覚距 離空間という概念を導入して数 学的に定式化する. 5 章では多次元 データ の判別分析において,フェース グラフ を用いて 判別 関 数法を 支援し,より有効な判別 分析を行う方 法を提案する.そ れは,多 次元 データ の変 数を 表情要素へ1 対1 に直接割り当てて 表現する方 法において,クラスター 間の 表情がで きるだけ懸け 離れたものに成るように表現するという評価基準を設けて,最適な変 数 割 当てを探索 する方 法である.この方 法は, データ のクラスター 同士 の表 情の非類似 度が最も大きく 成るように つ まりクラスター 間の表情 の違いをできるだけ 際立たせ て表現できるよ うに変数割当てを決定するも のである. 6 章ではデータ の距離関係と表情の感覚的な距離関係が同一 に成るよ うな 表現 法を 提案する.クラスター 分析にお いては,多 次元データ の個々の変 数の量的 な特 性を知 る 必要はなく, データ 全体 の距離関係が把握できる こと の方が重 要である .そ のた め に本章では データ の距離関係と表情の感覚的距離関係の線形性が 満たされるた めの表 現 法を導き出し ,そ の基本的な特性 について検 証する. 7 章では顔線画というイメー ジ空間の中から「│的 の顔線 画を探し出す探索問 題を解 く ためにIGA とファ ジイ 推論を用いたインターフェイス を提案する. 適 合度を決定 するためのfuzzy 法におけるファ ジイ 推論過程に人間の感覚尺度を導入する ことによ っ てrating all 法により近い適合度決定を行うことができ る.ある1 つ の顔線 画は こ れを描く パラメータ で作られる多 次元空間 ’(顔空間) の1 点 に配 置さ れて いる が, これを感覚的類似度に基づいて顔線 画が配置さ れている空間(感覚距離空間) へ写像
レ この感覚距 離空間でファ ジイ 推論を行うことで 人間 の感覚が適合度 の評価に反映 さ れるよう に成る. この方法では,ユー ザー はター ゲット と最もよく似 た顔線 画を選 抜する という 単純な 作業のみを行え ばよく,そ の他の多く の感覚的判断は,予 め用意 さ れた感覚距離空間 の中でファ ジイ 推論によって一律に行われる.このため, 感覚的 判断 の一貫 性や 再現性 が確保さ れる.このような理由から本手法は感覚的判断に付随 する恣 意性やあ いまい性をできるだけ排除しつつ,人間の感覚を活用する方 法である といえる. 以 上,本論文の概要を示し た.全体を通じ て本研究の基本と成って いる考えは 人間 の感覚的認知過 程に適合し たヒューマン・インターフェイス を実現するという もので ある .
2 章ヒューマン・インターフェイス
2.1 序言
ヒューマン・インターフェイス は 人間−コン ピュータ 相互作川の中で 最も中心と 成 る 部分であり,物理的インターフェイス と知的インターフェイス の部分から構 成され て いる.従来 のインターフェイス で は物理的インターフェイス のみを対 象とす る傾向 にあったが,ヒューマン・インターフェイス ではコン ピュータ の内部で行わ れる情報 処理の一部まで をも含めた領域を対象とする. 高度 の人間−コン ピュータ・インターフェイス をどのように構築 するかを一般的に論ずるのは難しいが,ユー ザーフレン ドリー なヒューマン・インターフェイス がどのような ものかといえ ば, あるタスク に関 するユー ザー・モ デル とコン ピュータ の入出力タスク との間の感覚的距離 を最小 にす るツール を含 んだインターフェイス であるといえる.つ まり,コン ピュータ の情報処 理,及 び入出力はユー ザー の感 覚的な認知過程に適合させる べきであ ると いうことで ある. 本論文では,このような立場から探索的 データ 解析のためのヒューマン・インターフェイス と, 人間とコン ピュータ の共同作業 によって人間が考えて いるイメー ジを具 体化するという対話的イメー ジ描 画のためのヒューマン・インターフェイス を構築す る, このために 人間が視覚情報を認知する過程を感覚距離空間 への写 像としてモ デル 化する. また,イメ J-ジ描画は感覚距離空間で の目標イメー ジの探索 としてモ デル 化 する. どちらのモ デル の場合においても, 認知 の対象と成るも のが感覚距 離空間 へ 写像され,そ の空間で の距離関係に基づいて 情報処理が行われる.ヒューマン・インターフェイス を構築するためには,こ の感覚距 離空間を前もって 構成しておく 必要が あるが,ここでは多 次元尺度構成法を用いてこれを行う. 2.2 節では 感覚距離空間 を構成するた めの手 法と写像関 数を同定 す るた め の手 法につ いて 説明する. 2.3 節では 探索的 データ 解 析について 述べ,幾つか の多 次元 グラフ 表現法を比較して ,探索的 データ 解析のインターフェイス として有効な グラフ 表 現法を 明ら かにする. 2.4 節ではイメー ジ探 索について述 べ,対 話的インターフェイス
を実現する ために用いるIGA(Interactive Genetic Algorithm) とファ ジイ 推論に つ いて 説明する.
2.2 ヒューマン・インターフェイス
のための認知モ デル
2。2.1 視 覚 認 知 の 空 間モ デル ヒューマン・インターフェイス と人間 の視覚 認知モ デル との関係を図2.2.1 に示す。 探索 的 データ 解析 のためのヒューマン・インターフェイス をモ デル 化しかものを図2.2.2 ●● ■ ● 啼 岫 ● ● ● 軍 曹 會 帯 締 ●・ ● 瞳 ● I 書 置 ● 書 書 ● ● 匂 ‐ 皿 ● ● 憧 ■ P ● ●* ヒューマン・インターフェイス 認知モ デル 図2.2.1ヒューマン・インターフェイス と認知モ デル ヒューマン・インターフェイス 図2.2.2 探索的 データ 解析のヒューマン・インターフェイス ヒューマン・インターフェイス 図2.2.3 対 話的イメー ジ探索 のヒューマン・インターフェイスに示す. このインターフェイス に求められる要件は, データ の表現に解析 の目的が反 映されなけ ればならな いことである.つ まり, データ の量的な特性を知りたい解析に お いては,そ の特性が明示的にかつ 人間 の感覚尺度(感覚距離空間で の距離)と一致 するよ うに表現されることが必要である.例えば,クラスター 分析を行う 場合は, データ の総合的な距 離関係とそ れが表現さ れて いる グラフ の感覚的距離関係とが一致す るよう に表現さ れる必 要がある.また判別分析において は, データ の グルー プ間の感 覚的距 離ができるだけ隔たるよう に表現された方が 人間にとっ て判別 が容易に成る. 一方, 対 話的イメー ジ探索のためのインターフェイス をモ デル 化し たものを図2.2.3 に示す.こ のインターフェイス に求 められる要件は, 人間の負荷を軽減すると同時 に 人間の感覚を全体の処理の中にできる限り反映させるために 人間とコン ピュータ と のタスク の配分を適 切に行う ことである. 以 上の2 つ のヒューマン・インターフェイス に求 められる要件を満たすために 本 研 究で は図2.2.2 と図2.2.3 に示し たように人間の感覚距離空 間のコ ピー をコン ピュータ に持たせ,コン ピュータ 上でそ れに基づく処理を行うシステム を構築する. 2.2.2 感 覚 距 離空 間 の構 成 法 人間の視覚 認知を 前節で述べたよう に感覚距 離空間への写像とし て捉えるな らば, 探索的 データ 解析 において人間の情報認知特性に適合し た情報表現を行っ たり, 人間 の負荷の一 部を代行するなどして 人間の意思決定をコン ピュータ によって 支援 するた めに感覚距離空間を具体的 に構成しておく必要がある.ここで は,そ のための有効な 手法である多 次元尺度構成法とそ の入力と成る対象個体間の類似度を求める手法につ いて 簡単にまとめておく. (I )多次元尺度構成法 多次元尺度構成法(Multi-Dimensional Scaling, 以降MDS と略す) は, 個体 間 の類似度あるいは非類似度の距離 関係を満足するよう にできるだけ少数の次元 の空間 に個体を配置する手 法であ る.個 体間の距離として 間隔尺度あ るいは 比例尺度を用い るMDS をメトリックMDS, 順序尺度を用いるものをノンメトリックMDS という. ここでは後者の1 つであるKruskal のM-D-SCAL[Kruskal (刈 につい てそ の処 埋法 を簡単に述べる[杉本83b]. M-D-SCAL では・ 個体i' j の類似度 貼ノ が与えられたとき,n{ 固の 個体のt 次元 空 闇布置 几/を・ その空間で の距離 七.と与えられた類似度 剣yが最 もよく適合するよ う に求める方 法である.そのための適合度の指標としては,式(2.2.1)に示 すよ うなストレス と呼ばれるものを用いる.
タ =ソ
プブ ̄
=
Σ IJ ・ ● ㎜IJシ
弟 ノ ー ノ ‘2 (2.2.1) ここで, t 次元 空間で の個体h,j の距離は,一般化されたミンコフスキー 距離 を川 い て 計算する. また 貼 は与えられた類似 度(七 と単調性のみを保持しながら・ 彫 と同 じ 領域で定義される中間変 数である. M-D-SCAL の処理手順 は図2.2.4 のように成る.そ の処理手順 を以 下で 説明する. (1 ) 個体間の類似度∂ りを求める. 個体の 数が多 い場合における 類似度 の求 め方 は後で 説明する. (2 ) 初期 座標を与え る. これは疑似 乱 数を川いた り,式(2.2.2)のよ うな 形で 与 えたりす る.(り を大小の順に並べ 初 期 座 標 ×, 座標 ×,勾配 Gの標準化 ストレス S F 負の 勾配 箭 「 ステッ プ幅 α 1 途 中 結 果PRINT i 「 収 束判定 空間付置PRINT, PLOT END (0 (1 2 0 ぐ ぐ 0 0 0 1 1 1 1 ● ● ● * ● O / ‥) ) ) (2.2.2) (3 )中間変 数 亀 を求 める. ≪,.を非類似 度 デ ̄夕ならば 小さい順に・ 類似 度 データ ならば大きい順 に並べる.空間布 置での距離 べ・ノを 剣丿 二同じ順 に並 べると,必ずし も小さい順 には並んで いない.そ こで連続す る幾つ かの 叱 を1 つ の ブロック にまと め,そ れぞ れの ブロック 内で の距 離 の平均 値が 小 さ い順 に並 ぶよ う に ブロック を作 る.そ して, 同一 ブロック 内 の中 間変 数 として,この平均値 を共通に与え る. (4 ) 負の勾配 を計算す る.最急降 下法 によ って, 座標 を少し ずつ変更 しな が ら 最適な座標を求 める のであるが,次のステッ プの座標を求めるには式(2.2.3) によって負の勾 配 みlを計算する. 乱, =5Y(.5*' − 6幻)レソ。 剣I 0. l =i' 0, k^^i d り − y 1. ^il - ^jl signum(Xij  ̄Xjj) ゛10・ ^ll  ̄^jl -1, 影/  ̄^jl
ドゾダ
>0 =0 <0 r-1 signum( 影ノーxノ,) (2.2.3) (5 ) 収束条件の判定を行う. 収束 条件には以 下のような も のが使 われる. ①ストレス =0 ②負の勾 配≧ O ’ ③ストレス が変化しなくなっ た. 距 離 D 中間変数 D 図2.2.4 M-D-SCAL の処理手順④ストレス が基準以下になった. ⑤繰 り返し 回数が最大値に到達. (6) 次のステッ プの座標 如'を式(2.2.4)によって計算する. ^k] - ^ kl + a ffk/ 廠 萌
mag(^) =
伊
伊
a:ステッ プ数 ( H) 類 似 度 の 計 算 (2.2.4) M-D-SCAL の入力 データ とし て用いる類似度 は, 被験者によ る個体サン プル の類 似している もの同士 の グルー プ化( グルー プ数は任意)の結果を用いて求 める.そ れ は以下 の手順 による[Shepard 721. 被験者 Å・がn 個 の個体サン プル を分類する場合に その グルー プ数を ∠\瓦 グルー プa へ分類される個体サン プル 数を ら よ する.被験者数は y 名とする. ここで,n 個 の個体サン プル からラン ダム に2 つを抽 出するとき, この2 つ のサン プル をi ,j として,そ れらが同じ グルー プa へ含 まれる確率は式(2.2.5)で与えられる. 弓a び臨口 畑 −リ n(n −l) (2.2.5) また,^' ノ が別 々の グルー プと成るという事 象が持つ情報量は−iog2(砧)と 成る.な お 吼 は式(2.2.6)で 与え られる. 計 ら =1.00 −Σ 弓。 (2.2.6) そこで,被験者k が表情サン プルi' ,j に対して示す判断から式(2.2.7)の測度 が得ら れる. ^ ijk --^ogJ 弓丿 :yとノ が同じ グルー プぷこ含 まれる とき リ ゛{ +10g2(盾):y とノ が別々 の グルー プにあ るとき (2.2.7) す な わち ,i,j が 同じ グルー プ 叫 こ含 まれ る とい う 事 象 は yとノ の 類似 の 程度 を正 の 方 向 に 増加さ せ,また yとノ が 別々 の グルー プと 成 る 事 象は 類 似 の程 度 を 減 少さ せ る . 被 験者 訓 こつ いてλし の平均 値並 び に標 準 偏 差を 求め ると,そ れぞ れ 式(2.2.8),式(2.2.9) のよ う に 成る .∠
\k
凡 =−Σ 八a^^^2弓。 +店M^l 仇
Ak
弓 卵0g2弓丿 十盾log, 店
(2.2.8) (2.2.9) " し こで' ぶjk を 全 被験 者 に つい て 規 格 化 す る と, 式(2.2.10)の 値 が求 まる . y タ- ・ = V ^ え C'k こ のs. を 類似 度 と する . 2.2.3 写像 関数 の同 定 法 凡 (2.2.10)GMDH(Group Method of Data Handling)[Ivakhnenko 71] の一般原 理について, 本論文に必要な 最小限度 の説明を加えておく. GMDH で用いら れている 自己 組織化 法は,与えられた限られた 入出力情報を もとにし て,入出力変数のラン ダム な 結合を 発生させ,その 結果生ずる 数多く のシステム の中から外 部環境に対 する適 合性 に基づ
いて 最良のものを選択するという 過程を繰り返し 自動的 に外部環境 に適合するシステム を形成していく 手法であ る. GMDH のアル ゴリ ズム はシステム の完 全表現式 を ど のよ うに 選ぶかによって 異なる.完全表現式として,例えばKolmogorov − Gabor の多 項式(2.2.11)があ るが, φ= 吊)+ Σa^x^ + Σ Σa : a : X : X y 】 j 7 +. . . (2.2.11) これは2 変 数の2 次多項 式(2.2.12)を部分表現式 に用いること によって 構成すること ができ る. 2 2y = -% 十 両x. 十 ぶ2 ×2 十^3 ×1 ×2 十a^ ×^ 十 ∂h ×2 (2.2.12) 部 分表現式 に2 次多 項式を用いたアル ゴリ ズム を図2.2.5 に示す. GMDH の構造 は, パーセ プトロン と同じく多 層構造をしており,式(2.2.12)の2 次多 項式を用いた 場合, 第7 層を通過す れば, もとの入力変数に関して2^ 次の多 項式と成る. 式(2.2.12) の係数を決めるには6 個以 上の データ があればよ いが,一般に同じ2^ 次の多 項式 を 式(2.2.11)から直ち に求 めよう とすれば非常 に多く の データ が必要であり, 係数 を決 めるために解かねばな らな いGauss の正規方程式 の次元も大きく成る.この意味で, GMDH は 少ない 入出力 データ で 高次 の多 項式 近似が可能である. 図2.2.5 に示した GMDH のアル ゴリ ズム の概要を説明し ておく . (1 ) 予測 式に 関与する と思わ れる全て の変 数の中から, 相関係数な どを使って 予測に用いる変 数,すなわち人 力変数を自己 選択する. (2 )任意の入力変 数の結合で出力を表し,トレーニン グデータ を用いて, Gauss の正規方程式 を解き 最適係数値を決める.組合せ数は 刃, と成る. (3 ) この,,c.個の関数を,チェッキン グデータ に適用し,二乗誤差を計算して, 闇 値よ り小さな ものを若干 残して他は捨て る. H H (4 ) こ の閥 値 を 通 過 し たIll 個 の関 数 を 中 間変 数 と みな し, (2 ), (3 ) のステ ッ プを繰 り 返 す . (5 ) 計算 停 止 規 範 :(2 ), (3 ) の 繰り 返し 操 作 を 進 めて い く と , 二 乗 誤 差 が 前 層 よ り も 増 大 し 始 め る . こ の と き 計 算 を 打 ち 切 り , 最 小 の 二 乗 誤 差 を 与 え る 関 数 を採 用 す る . (6 ) 各闘 値 ら を 変 え ,(5 ) の 最終 結 果 が 最適 と 成 る よ う に 叫 を 設定 す る . Xm 組 合せの発生器
図2.2.5 GMDH
のアル ゴリ ズム
2。3
探索的 データ
解 析のた めのヒューマン・インターフェイス2.3.1
探索的データ 解析
多 次元 データ 解析 にお いては主 成分 分析,クラスター 分析,判別関 数法な どの様々 な多変 量解析 法が開発され実用に供さ れている[Ganadesikan 79 ][奥 野71,7G][ 竹内72 ]. これらの統計的な 解析手 法は,あ る限 られた 前提 条件 のもとで多 量の データ を処理することができ,特定 の目的 のためには非常 に有効であ る.し かしな がら,複雑 な構造を持った データ( 例えば,標準的な 統計分布を持だな かったり,異常な データ を 含んでいるような データ) の解析 にお いて は,そのような 前提条 件が満たさ れない こと もある.そ の場合はデータ を解析するものが, データ について の知識や過去の経 験 に基づいて データ から何らかの構造を探索的 に探し 出す必要がある.こ れが探索的 データ 解析である[Tiikey 77]. この探索的 データ 解析を有効に行う ためには, データセット の全体像や個々 のデータ の距 離関 係な どの情報を解り易く,かつ簡潔に示すこ と のできるインターフェイス が必要である.多 次元 グラフ 表現法はそ のインターフェイス として 重要な 役割を果たす.データ のグラフ 表現によって,一度にデータ の多 側 面を 統合的 に読 み取ることができ,そこから データ の規則性 ばかりでなく,予期しな かっ た特 徴をも抽出する可能性が生まれる[渡部851. 探索的 データ 解析は, 統計的仮説検定な どを中心とし た,いわゆる確認的 データ 解 析と対 立す るものであるというより は,むし ろ相互 に足 りないところを補い合うとい う 関係にある.探索的 データ 解析で 得られた洞察 は,別のデータ を用いた確認的な解 析で実 証さ れる必要もあるし ,また探索的に得られた成果は解析を次の段階 へ進める のに役立て られる べきである. 統 計的クラスター 分析においては,結果 とし て初期のデータ を幾つ かのクラスクー ペ分割できるが,そ れが適 切なクラスター である か否かは容易 に判断できない.解析 し よう としている データ にクラスター の妥当性を保証する何らかの外的基準がある わ けで はなく ,まさ にそ れを 見つけ出すことがこの手法の目的 だからである .このよう な 場合には, データセット 全体を概観する ことができるフェース グラフ のような グラフ 表現法を併用して探索的 に分析を行う 必要があ る.フェース グラフ は データ の全体 像を把握する のには 非常 に優れた表現法であり,おおよそ のクラスター の存在や妥 当 なクラスター の数を 比較的容易に見つけ出すこと ができる. 判別関 数法 においては,事 前に判別すべきクラスター の数が解っており ,かつ 各ク テスター を代表するトレーニン グデータ が得られることが前提 条件であり,そ のデータ に基づいて 判別 関数を求める のであるが,ここ に幾つ かの問題 が存在する .そ の1 つは十分な 数のトレーニン グデータ が得られない 場合に起こる 問題であ る.この場合 は満足でき る判別 関数が求められないことが多く ,正しい判別 結果 が得られな いこと がある.他には解析 データ の中に既存 のクラスター に属さないような データ が有っ た として も,そ れを発見できないという 問題がある .しかし, これはフェース グラフ を 利用することによっ て容易に解決できる問題であり,ここにフェース グラフ の支援を 受けた探索的な 判別関数法が成立するのである. 2.3.2 多次元 グラフ 表現法の比較・ 評価 多 次元 グラフ 表 現 法 とし て 様 々な ものが 考案 さ れて い る が[Andrews 72] r脇 本79], ど のよ うな 図 形 を用 い る のが 表 現 法 とし て 有 効か と い う 図 形 の評 価 の問 題 は 極 め て 重 要であ る.し かし ,こ れ は複 雑 で定 量化し 難 い 人 間 の知覚 心 理 にか か わ る 問 題 な ので , 一般的 に論 ず る こ と は かな り 難し いと い えよ う. そ こで , こ こで は 各種 の次 元 グラフ 表現 法につ い て , データ 処 理 の最 も 基本 と 成 る 分 類と い う操 作 に限 っ て 被験 者 実 験 を 行い, そ れ によ っ て 比較・ 評価 を 行っ て , そ れぞ れ の表 現 法 の 特 性 を明 ら か に す る . こ の実 験で 比較・ 評価 を行 う 表 現 法 は以 下 の とお りで あ る.そ れら の具 体 例 を 図2.3.1 に示 す. (1 ) 折 線 グラフ :多 次 元 データ をJC = 隔, 心 …,石 )と し , 横軸 に等 間 隔 に y の 位 置 を定 め, Xiの 値 を 各位 置 の 高 さで 表し , そ れ ら を 直 線 で 結 ぶ・ (2 )多 角 形 グラフ : 中 心 か ら 等 角 度 間 隔 に 放 射 線 を 引 き ,X, の 値 を 各 放 射 線 の 中 心か ら の距 離 で 表し , こ れら を 直線 で 結ぶ . (3 ) 線 形フーリエ 級 数 グラフ :y を 式(2.3.1)の係 数a, に割 り 当て て 横 軸 にt ,縦 軸 にP (t) を と っ て 波 形 を描 く[Everitt 821.
μ(t)ニ 両 /百 十^2 sin^ 十 亀cost 十‘ ゜’ (2.3.1) (4 ) 極座標フーリエ 級数 グラフ :ぐ を式(2.3.2)の係数 馬 に割り当てて 極座標上 で 閉じ た波形を描く . p(θ )= 卵 鹿 十 両sin 0 十 両COS θ 十 ‥ ’ (2.3.2)
(5 )フェース
グラフ:^,
を顔の各表情要素に割り当てて一つ の表情として表現
する.
(6 )数字表現:データ の数字自体を並べて表示する.
○○巴 半千千
(1 )折 れ 線 グラフ (2 )多 角 形 グラフ∧千千コoo
(3)線 形フーリエ 級 数 グラフづ
(5
づ づ
フェース グラフ (4 ) 極 座 標フーリエ 級 数 グラフ ( 6.7, 5.0, 5.0, 1.8, 4,6 ,5 .0, 0.3 ) 7.5, 5.0,5.0 ,5.9, 3.7, 5.0, 1.7 )9.9, 5.0, 5.0 ,8.7, 4.0, 5.0, 2.8 ) (6 ) 数 字 表 現図2.3.1 比較・ 評価に用いた多次元グラフ 表現法
評価基準は分類 の精度と分類操作における難易度である.また グラフ 表現 に用 いる データ は3 つの グルー プから成る7 次元 データ で, 各グルー プ10サン プル ずつ, 合 計30サン プル から成っている.なお,本 データ は3 種類のアイリス の花の特 性を示 すデータ で ,文献[Chien 78 ]に使用されているものである. まず,この データ を各表現 法によって表し, 各表現法ごとに 被験者 へ提示 し,似た もの同士 を10サン プル ずつ3 つの グルー プへ分類させる.そ の分類 結果から,ど れ だけ正確に分類 が行 われるかを調べる.この実験を6 種類全て の表 現法につ いて 行っ た後に こ れら の表現法ごと の分類操作の難易度をScheffe の一一対 比較 法[Scheffe 52] を用いて求 める. これは任意の2 つ の組合せ(A =15 対) につ いて,ど ちら の表現 法が容易に分類 が行えるかという 分類の難易の程度を7 段階で 判定させた結果を, 全 ての被験者 につ いて 集計して1 次元尺度化 するものであ る. 26 名の 被験者 の回 答を 集計して得た分類 の精 度並び に分類操作の難易度の結果を示 すと,それぞ れ表2.3.1 と図2.3.2 のよう に成る. 表2.3.1 に示 すよう に,極座標フーリエ 級 数 グラフ では 被験者1 人当たりの平均 誤 り個数が約 川固であり, この表現法の分類精度が非常に高いこと が解る. 次に線形フーリエ 級数 グラフ とフェース グラフ の分類精度が優れている.またこの3 つ の表現 法 において は,標準偏差も他の表現 法と比べて小さく ,分類の精度 に安定性があ ること が解る.一方, 分類の難易度につ いてみると,図2.3.2 から明らかなよう に フェース グラフ と極座標フーリエ 級数 グラフ がともに分類が非常 に容易であるという結果に 成っている.なお, Mezzich が精神病患者の診断 データ (4 つの グルー プから成 る17 次元 データ ) を使って行った 同種の 比較 実験にお いても,極座標フーリエ 級数 グラフ の分類精度が最も高く評価されている[Mezzich 78]. し かし, Mezzich は 分類操作 の 難易度につ いては 比較 を行って いな い. 折線 グラフ と多 角形 グラフ では, データ の 各変数の大きさを正確に図形上に表すことができる.これらは1 つ の データ の中で 各 変数の バランス などを解析するには適した表現法である.し かし , データ 間で の類似性や 違いを見い出 す用途 には適し た表現 法とはいえない.折線 グラフ や多 角形 グラフ のよ うに図形が極めて 合理的で冗長性を持だない 表現法においては,データ の特性の 違い を図形の特徴的な 形状とし て見い出 すことが難し い. 極座標フーリエ 級数 グラフ では,そ の式 の係数へ代人し た データ が変 わると図形全 体 の形状が大きく変化する.このことは,多 角形 グラフ では データ の値が変 わっても 頂点 の位置が移 動するだけで 全体の形 状そのものはそ れ程大きく は変化し ないのとは 対照的である. 極座標フーリエ 級数 グラフ は図形として の表現力が大きく多 様な 形状 を描くことができる.このため にデータ の グルー プごとに特徴的な 形状を表現できる ので,分類という操作が正確かつ容易に成ると考えられる.このよう に滑 らかな 閉曲 線の図形が, データ の類似や 相違を表現する方 法として適し ているということは,人 間が 図形を 判別する とき曲線 の曲率を認 識して いるという知 見[梅 谷75] か らも裏づ けられる. フェース グラフ もまた表情という非常に多 様性に富んだ表現媒体を持っている.こ のフェース グラフ で データ を表現し た場合, データ の特性や 個々 のデータ の相異は表 情あるいは表 情の違いとして 表現さ れる.人間は特定の表情を認識し たり表 情の違い を認知し たりする優れた能力を持っ ているので,表情によって表現された データ の分 類は容易にかつ 正確に行える.表情は一 見してあいまいで確かな 基準のないものに思 われるが, 人間は表情に対し ては厳密な 基準を持っており,微細な 違いでも識別でき るし , また大 局的な 表情の分類 も正確に行える.さらにまた,表情そ のも のを言い表 す言葉やそ れを形容する言葉を 使っ て データ の特性等を端的 に表現し 伝達することが で きる. グラフ の形状やイメー ジを言葉で簡 潔に表現できるという点は, 他の多 次元 グラフ に比べてフェース グラフ の方が優れているといえる. 極座標フーリエ 級数 グラフ は図形自体にはい かなる意味も持だな いが,一方でフェース グラフ は表 情という情緒的 意味を持っている.このことがこの2 つ の グラフ 表現 法の対照的な 違いである.し かし,両 グラフ とも多様性に優れているという点では共 通している,こ の多 様性こそが優れたヒューマン・インターフェイス とし て必 要な 要 囚であるといえる. 5) (4︲ ︲ ︲ 1 1 −1 1 1 1 1 3 1 1 1 1 1 11 ︲ I1 −1 )(2 6 1 1 1 1 1 −0。5 (1)折 れ線 グラフ (2)多 角形 グラフ (3)線 形フーリエ 級 数 グラフ 0 .0 0 .5 1 (4 )極座 標フーリエ 級 数 グラフ (5 )フェース グラフ (6 )数 字 表現 図2.3.2 データ の分類操作における6 つ の多 次元 グラフ 表現法の難易度の1 次元尺度 表2.3.1 6つ の多次元 グラフ 表現 法の分類特 性 多 次 元 グラフ 表 現 法 (1)折 れ線 グラフ (2)多 角 形 グラフ (3)線 形フーリエ 級 数 グラフ (4)極 座 標フーリエ 級 数 グラフ (5 )フェース グラフ (6)数 字 表 現 分類誤り個数の平均 5.23 7.77 3.23 1.08 3.58 5.35 標 準偏 差 2.34 3.58 2.72 2.16 1.66 4.01
2.4イメー
ジ描画 のた め のヒューマン・インターフェイス2.4.1 イメー
ジ探索問題
人間が意識 の中で考えて いるイメー ジを具体的な絵 に描いたり,適 切な言葉で表現 し たりすることは,特別な 能力を待っ た人間でない限り相当に難し いことであ る.こ こでいうイメー ジ探索 とは,そ のような 人間の意識の中に存在するイメー ジをコン ピュータ と の共同作業によって 具体的 に絵として描く ことを意味し ている.これは人間 の 意 識 の 中 にあ る 目 標イメー ジを探 索 する 問 題 とし て 定式 化 でき る. 本 論 文で はIGA(lnteractive Genetic Algorithm) を用いてイメー ジ探索問題を解くシステム を作 る が, 人間の感覚をコン ピュータ の情報処理の中にできるだけ多く 反映させ,かつ人 間の負荷を少なく するためにイメー ジが存在し ている感覚距離空間のコ ピー をコン ピュータ に持たせ,そ の空間でファ ジイ 推論を行うことによって 人間が行っている処 理の一部を代行させる.以 下で はIGA とファ ジイ 推論 について述べる.2.4.2 IGA(lnteractive Genetic Algorithm)によるインターフェイス
GA は 生物 の進化 の原理を模倣し た探索手法で あり, 複雑であ いまい 性の多い探索 問題に有効な手 法である. GA では再生成,交叉,突 然変 異という操作を繰り返し 行 うこと によっ て 生物が 自然淘汰されていく のと同 様に,最終的に最適な 解を求 めるこ とができる.再 生成を 行う前にはそ の世代における個体群 の適合度を求 めなけ ればな らない .通常はある目的 関数 によって適合度を算出するが,類似性,魅力,好 みなど のよ うに 人間の感覚的な 判断基 準に基づ く目的 関数は一般に明確なルール にするのが 難しく ,GA の処 理過程に内 挿できない.このような 場合には人間が介在して 適合度 を決 める のであ るが, このように人間が介在する GA がIGA であ る. また,目的関 数が 複雑な とき には人間の優れた総合判断能力にそ の処 理を ゆだねた方が効率がよい 場合 も あ る. IGA はそ のよ う な 複雑 な 目的 関 数 を 持 っ た 探 索 を 人 間 の 感 覚 的 判 断 に 目的 関 数 の役割 を ゆ だ ねる こ と によ っ て 成し 遂げ よ う と する も ので あ る.
Caldwell とJhonston は, 犯罪 容 疑 者 の探 索 に IGA を適 川 し た 例 を 報 告 して い る[Caldwell
91]. こ の 中で は 目撃 者 が 全て の世 代 に 渡9 で20 個 の顔 に9 段 階 の 評価 を 与 えるとい うrating all法(rating all method) によって 適 合 度 を 決定 し て いる. ratingall
法は 各個 体を 直 接 評価し て , 全 て の個 体 に 適 合度 を与 え る と い う 意 味で は , 従 来 の GA で行 われ て い る 適 合 度 決定 法 を踏 襲し た も ので あ る . 一 方, Smith は幾 つ か の個体 を 選抜し て , 選 抜された個 体とそ う で な い 個体 に 異な っ た 適 合 度 を割 り 当 て る 方 法を提案 し て い る[Smith 91]. こ の方 法で は ,ユー ザー は次 の世 代 を 進歩 さ せ る こ と が期待で きる個 体 ,つま り目的に適 合し た個 体を幾 つ か 選 抜 す る だけ で よ い . こ の2 つ の適 合 度 割 当 て法 の 違 いは,IGA が探索問題 にお いて , よ りユー ザーフレン ドリー であ り得るか , よ り 効率的なツール で あ り 得 る かを 議 論 す ると き には 重 要な 点 で ある. 選 抜 法 はrating all 法よ りもユー ザー の負 荷 が 非 常 に軽 く , 素 早く処理 で き る ので進化 を速 く 進 め る こ と ができ, 限られた時 間内でよ り先 の世代まで 進化さ せ る こ とがで きる点て優れ て い る. し かし, rating all 法で は 全て の世代で 全 て の個体の 評 価に人間 の感 覚 が 直 接 的 に 反映されて おり , 人間 の感 覚 を適 合度 の決定 に反映さ せ よ うとす る目的 に かな っ て い る.ユー ザー の負 荷 を軽 減す る こ と と適 合 度 の 評価過 程 へ 人間の感 覚 を多 く 反 映さ せ る こと と は ,ある程度トレー ドオフ の関係 に あ る が , こ の2 つの条 件 は IGA のインターフェイス を構築 す る 際 に は非 常 に重 要で あ る . 本 論 文 で は先のモ デル で 述 べた よう に人 間が意 識 の中に 持っ て い るイメー ジが 存 在す る 空間 であ る感 覚 距離空間 のコ ピー をコン ピュータ に持 た せ, そ の空 間 の中 でファ ジイ 推論 を行っ てrating all 法 に近い処理 がで き るシステム を作 る. 以 下 に そ のファ ジイ 推 論 につ いて 述べる .
2.4.3 ファ ジイ 推論 によ る知 的インターフェイス ファ ジイ 推 論について 説明する前に ファ ジイ 命題,ファ ジイ 集 合について簡単に 述 べておく .ファ ジイ 命題とは言明にファ ジイネス が含 まれている命題 のことである. 例え ば,“距 離が大きい”といったよう に 言 明の中に“大きい”と いうファ ジイネス が含 まれて いる場合,この命題はファ ジイ 命題 である という. (一般 にいう 命題と ぱ 距離は2 km であ る” といっ たも のである).ファ ジイ 推論では 入力 値をこのよ うなファ ジイ 命題で捉 えて 推論 を行 う.更 に,こ の“距離が大き い”と いったよ う なファ ジイ 命題 戸 を本論文では式(2.4.1)のように表現する. ” ? ″dist is D jarg e” (2.4.1) ここで, dist は距離 の値を, 刀几イ バま距 離が大きいということを示すファ ジイ 集合 を 表している.ファ ジイ 集 合にはクリス プ集合と区別するために「 ∼」 をつ けること とする.つ まり, (listがI arg e に含 まれている度合いが大きければ 戸 はより真で あり,逆 に小さければより偽である. また,ファ ジイ 集 合は,次 に述べるメン バーシッ プ関数 μ を決めること によ り定 義さ れる.例え ば距 離が大きいとい うファ ジイ 集合Dlarge の場合メン バ ̄シッ プ関 数 μフ:'/ are eは式(2.4.2)のように定義さ れる. μDl nrg e:DIST → [0,1 ]
(DIST =距離の値の全集合; dist e DIST)
(2.4.2) メン バ  ̄シッ プ関数 μ脳rg e とは・ 距離の値dist がj]し p に属する度合いを示 す特 性関 数のことであり,値が1 に近け れば近い 程ファ ジイ 集合 ■^ largeに属する度合い が高く 成る.つ まり, dist が大きいことが真である度合いが高く 成る.逆 に Oに近 ければ近い程ファ ジイ 集合Dlsrg に 属する 度合いが低く成る.つ まり, dist が大き _ _ い こ と が 偽 で あ る 度 合 い が 高 く 成 る・ ま た1 iirg oの 一 般 的 な 表 記 の 方 法 と し て^oxpd と い う 方 法 を と る も の と す る . 一 方 ,クリス プ 集 合 に 於 い て はメン バーシッ プ 関 数 は 式(2.4.3) の よ う に 成 る . μD:DIST → (0,1) (2.4.3) 以 上のように ファ ジイ 命題にはファ ジイ 集 合が存在し,そ のファ ジイ 集 合はメン バーシッ プ関数を決めることにより定義されることが解る.なお ,ファ ジイ 命題,ファ ジイ 集合 の真理値はそれに対 応するメン バーシッ プ関数の値と成る. 本論文で使うファ ジイ 推論は式(2.4.4)のよ うに前提1. 前提2 から結論を導き出 す ことを目的とし ている. 前 提1 几。 た?jJCθ /-y P angje /-ノ P genNum : ”dist is:"ang is^oxpd II A exp d” :"gen is ^ expd 皿2 (な ねanc∂ and 耳/ぶむand P^t^jj^im)→Q:
if ("dist is Dexpd” and ″ang is 大
仰/^^^^ "gen is 呪即 いthon("fit is 几 バ) 結論 Q "fit is I キexp f” (2.4.4) ∼ ∼ ここで・ang, gen, fit はそ れぞ れ角度・ 世代・ 適合度の値を示し・ ぺxpd
' と]臨バ は 角度・ 世代 がexpd ,expg であるというファ ジイ 集合を表し・ 刈xpfは適 合度がexpf であるクリス プ集合を表して いる. ■^ expfをクリス プ集 合にする 理由は・ 適合度 ぱ だ いたい 大きい ”と いうよ うにファ ジイ 値で 与え るので はなく , あ る定 まっ た 値で 与 えるからである. またここで, 新しく出てき た 夕≒expい ま"fit is 瓦xpf″の真理値, すなわち・ ″fit is 尺 ヅ″がど の程度確かであるかを示す値である.
次 に推 論のメカニ ズム につ いて 説明する.前提1 にある命題 の真理値は距離,角度,│ii-代,そ れぞ れのファ ジイ 集合に応じたメン バーシッ プ関数を定 めることによ り決定 できる. 前提2 は 推論 を行うための条件文 を示して いる.なお, if 部分のand は, 3 つ の値の中からminimum を選ぶ演算により 実現される.結論では,前提1, 前提2 によって推論さ れた結果から, 前提2 のthen 部分の正確さ の程度 を示す真理値が得 ら れる. 1 つ のルール から得られる真理値は 実際 には式(2.4.5)に示すようにメン バーシッ プ値のminimum 演算によって 算出さ れる. μ ゜(/七‰ (dist)Aμ≒ ヽリ(ang) Aμら 町(即n)A )A μ ら が(万〇 (2.4.5)
ぷ 個if−thenルール
全てについて真理値を求め,最終的に実際の適合度は重心法に
より式(2.4.6)
のように成る[Honda 86b][本多89]・
i( μ''exp f(r) ゛μ戸exp バ' 与 え ら れ る 適 合 度r =! y Σ μ 戸exp f r =1 2。5 ま と め (2.4.6) 本 章で はヒューマン・インターフェイス を,あるタスク に関するユー ザー・モ デル とコン ピュータ の入出力タスク との間の感覚的距離を最小にするツール を含 んだインターフェイス で あると定義し た.こ のことは具体的 には,コン ピュータ の情報処理, 及び 入出力をユー ザー の感覚的な 認知過程に適合さ せる ことであ る. また,探索的 データ 解析のためのヒューマン・インターフェイス と,対 話的イメー ジ探索 のためのヒューマン・インターフェイス を構築するた めに 人間が 視覚 情報を 認知する過程を感覚距離空間尚 の写像として,またイメー ジ探索 は感覚距離空 間で の 目標イメー ジの探索としてモ デル 化した. これらのモ デル のために最も重 要な のは感 覚距離空間を構成することである.そこでこの感覚距離空間を構成するため に川いる 多次元尺度構成 法とそ の入力データ である個体間の類似度の計算方 法を示した. また, 空間から空間への非線形な写像関数を同定するための手法である GMDH につ いて も 説明した. 探索的 データ 解析とは何で ある かを説明し,フェース グラフ を用いた探索的クラスター 分析と探索的 判別分析の考えを示し た.探索的データ 解析にお いて は多 次元 グラフ 表現法が重要な 役割 を果たすので,6 つの多 次元 グラフ 表現法を データ の分類と い う操作において,そ の性能と操作の難易度につ いて 比較・ 評価し た.そ の結果を まと めると以下のとお りであ る. (1 )極 座標フーリエ 級数 グラフ は分類精度 が非常に高い. 次に 線形フーリエ 級 数 グラフ とフェース グラフ の分類精度が優れている. (2 )この3 つ の表現法にお いては,分類 の精度に被験者間の差が余りな い. (3 ) 分類の難 易度について は,フェース グラフ と極 座標フーリエ 級 数 グラフ が 共に分類が非常 に容易である. 本論文で扱うイメー ジ探索 問題を人間の意識の中に存在する目標イメー ジをコン ピュータ との共同作業によって具体化することとして定義した.本論文では IGA とファ ジイ 推論を応用してイメー ジ探索 のためのインターフェイス を構築する.そこで,IGA とファ ジイ 推論 について簡単な 説明を行った.3 章 探索的データ 解析のための図形的特徴を利用したインタ
一フェイス
3.1 序言
探索的な データ 解析を有効 に行うためには, データセット の全体 像や個々 のデータ の距離関係など の情報が解り易く, かつ簡潔に示されること が重 要であり ,多次元 グラフ 表現法はそ のよ うなインターフェイス として重要な 役割 を果た す. データ 解 析 の 中でも データ の各変 数の量的な 情報を知る必 要があり,かつ 総合的な 分類や 変化 の傾 向を把握し たいときには,本論文で筆者が提案するメトリック 極座標フーリエ 級数 グラフ は極めて有効な表現法であ るといえる[杉本83a,85]・ 極座標フーリエ 級数 グラフ は,滑 らかな 閉曲線として図形が描かれてお り,そ の形 状の変化が非常に多 様であるので図形の幾何的な 特徴を見極め易く,そ のために データ 同士 の類似や 相違を判別し易いという極めて優れた特 色を持って いる.しかし, 一 方でこの表現 法は級数 の各項(各周波数) に多 次元 データ の各変数を割り 当て ,そ れ らを統合して1 つ の図形として 表現するので データ の各変 数を均 等 に図 形の形状 に反 映させることが困 難である.また データ の各変 数は図形全体に埋没してし まい表 面的 には表現されないので,個々 の変数の読み取りが求めら れる場合には全く 無力と 成る. 本来,幾何的な グラフ に於いては,多角形 グラフ でも解るよ うに 辺 の長さや 面積 の大きさな どの幾 何的な特徴量に データ の量的な特性を反映し 易いことが1 つ のメリット である.極座標フーリエ 級数 グラフ は図形の特徴が見極め易い とい う多 次元 グラフ 表現法とし て有用な特性を備えているので, 上記の問題を解 決し ,幾 何的 グラフ と してのメリット を確保できれば,多 次元 グラフ 表現法として更 に優 れたも のと成る. 本章では,多 次元 グラフ 表現 法として の極座標フーリエ 級数 グラフ の優れた特 色を 活かしつつ,上記の問題点を解決する表 現法,すな わち データ の各変 数を歪みなく 図形 の幾 何的特徴と結びつけて表現できる表現法を視覚認知モ デル の枠組みを応 用す る こ とによって作り上げる.そし て,マン・マシン・システム や探索的 データ 解析 のた め のインターフェイス として, この表現 法が有効なことを示す. 3.2 節で は, 極座標フーリエ 級 数 グラフ を使って の多 次元 データ の一 般的な表 現 法を示 し, 前述し たよ うな ,こ の表現 法が持って いる問題点 を具体的 に示 す. 3.3 節で は, まず多 次元 データ を図形へ変 換して表現する過程を一 般的 に定式化 する.そ して, この定式化 に基づいて, データ の量的な特性が図形の幾 何的特徴 パラメータ と して表現可能と成る 極座標フーリエ 級 数 グラフ の表現法を新たに提案し,従来 の表現 法と の違いを 明らか にして本表 現法 の有効 性を示す. 3.4 節では, 視覚認知モ デル に基づ いた 本表現 法の考え方 によって ,一般的 に多 次元 データ の量的特性を極座標フーリエ 級 数 グラフ の種々 の幾 何的特 徴パラメータ へ対応させて表現できることを示す.
3。2
極 座 標フーリエ
級 数 グラフ3.2.1
多次元データ の一般的表現法
フーリエ 級数を使うとどのよ うな 形状で も関数として表現できる[福島87]. 逆にこ の級数の 各項の係数に多 次元 データ の各変数の値を代入することによって 様々な 形状 の線を描き出す ことができる.式(3.2.1)は線形のフーリエ 級数であ る.P(t) =印 西 十亀sin t十a-, cost十 ‥ ゛ (3.2.1)
この線 形フーリエ 級数で多次元 データ を表現するときは,一般的には多 次元 データ をX =(a-,, 心 …, 恥)とすると,そ の変 数y を式(3.2.1)の係数 馬へ割り当てて曲線を描 ぐ 式(3.2.1)の独立変 数t の変 化領域を[一 肌 帽 として波形を描くと図3.2.1 に示し たような 波形が描ける.線形フーリエ 級 数を極座標系で表現した ものが極座標フーリエ
級数であり,式(3.2.2)のように表さ れる.
p( θ)こ 卵 翁 十^2 sin θ 十a-i cos 0 十 ‥ ’ (3.2.2)
この極 座標フーリエ 級 数で 多 次 元 データX =(X,, A',,…, 孔) を 表現 す る に は , 線 形フーリエ 級 数 と同 様 に多 次元 データ の変 数^, を 式(3.2.2)の 係数^ ちへ割 り 当て , 独 立 変 数∂ を[0, 2k] の区 間で 変 化 さ せて 図3.2.2 に 示 すよ うな 閉じ た 波 形 を描 く . こ れ が 極座標フーリエ 級 数 グラフ で あ る . 極 座標フーリエ 級 数 グラフ は ,2.3 節 の多 次 元 グラフ 表 現 法 の 比 較 実 験 で も 明 ら かにし たよ う に, 図 形 の幾 何的 な 特 徴 を 見 極 め易 く ,そ のた め に データ 同 士 の 類 似 や 相違を 判別 し 易 い と い う 極 めて 優 れた 特 徴 を持 っ て いる . こ の特 徴 は, 極 座 標フーリエ 級 数 グラフ が 滑 らか な 閉 曲 線 の図 形で かつ , そ の形 状 の変化 が多 様で あ る の で , 図 形の幾 何的 な 特 徴 に データ の グルー プご と の特 徴 の違 い が的 確 に 反 映さ れ, 分 類 と い う操作 を正 確 かつ 容 易 にして い るた めと 考え られ る . こ のよ う に滑 ら かな 閉 曲 線 の図 形が, データ の 類似 や 相違 を 表 現す る方 法 とし て 適し て いる のは , 人 間 が 図 形 を 判別 する とき 曲 線 の曲 率 を 認 識し て い る ため だ と い わ れて い る. し かし, 一方 で こ の 極 座標フーリエ 級 数 グラフ の一 般的 な 表 現 法で は 級 数 の 各項( 各 周波数) に多 次 元 データ の各変 数 を 割り 当て ,そ れら を 統 合し て1 つ の図 形と し て 表 現する ので 幾 つ か の問 題 が 生じ る.そ れ らは データ の各 変 数 を均 等 に 図 形 の 形 状 に 反 映させ る こ と が困 難で あ る こ と と, データ の 各変 数 の量 的な 特性 が 図 形 全 体 に埋 没 し てし まい, データ の個 々 の変 数 の 量的 な 特性 が読 み 取れ な い な ど の問 題 で あ る. 以 下 にこ れら の 問題 を 具体 的 に示 す .
図3.2.1 線 形フーリエ 級 数 グラフ の 表 現 例 図3.2.2 極 座 標フーリエ 級 数 グラフ の 表 現 例 l l
3.2.2 一般的表現法の問題点
極座 標フーリエ 級 数 グラフ では 式(3.2.2)か ら 明 らか な よ う に 多 次 元 データ の 各変 数 蜀がp( ○ とし て 統 合さ れてし まう ので , データ の 持つ 量 的 な 情 報 は 図 形 の 形 状 に 必 ずし も 直 接 的 かつ 表 面 的 に は 反 映 さ れな い . こ のた め に データ の 各変 数A', 並 び に データ x 全 体 の 量的 な 特 性 を 図 形 か ら読 み取る こと は困 難 で あ る . また , こ の 表 現 法 では定 数 項 や 低 い 周 波 数 の 項 へ割 り 当て ら れた 変 数が よ り 高い 周 波 数 の 項 へ 割 り 当て られた変 数 によ っ てマスク さ れ るた め に データ の各変 数 の重 み が 図 形 上 に均 等 に 表 現 さ れな い . こ れ ら の 問題 を 以 下 の実 験で 具 体的 に明 ら か にす る . 式(3.2.2)の中 の2 つ の 係 数3 い a^ U <j ) だけ に 正 の値 を 与 え , 他 の 係 数 は 全 て Oとし た と き の図 形 をA, (0)とし, a,と 侑 のうち1 つ の 係数 だ け に 正 の値 を与 え・ 他の係 数は 全て Oとし た とき の 図 形 をそ れぞ れ 片 昨Pj( ○ と す る . こ の とき 係 数a, と ら.の どち らが 図 形Pr ゾ(θ)に図 形 的 によ り 強 い影 響を 与 え てい る か を 比 較 す る た めに μ・ ゾ(∂)が μ・(θ)と 乃( ○ のど ち ら によ り似 て い る か を 被 験 者 実 験 に よ っ て 調 べて みる . 実 験 は, Si, らS4 , ^Gの4 つ の係 数 を取 り上 げ , そ れ ぞ れ2 つ を 組 み 合 わせ て 計6 通 り に つ い て 行っ た .実 験 に 用い た 図 形サン プル の 一 部 を 図3.2.3 に 示 す . 表3.2.1 は・Pi ゾ(0)が μ・(θ)と 乃( ㈲ の どち ら に似 て い る と 判断 さ れ た か を・ 被 験 者30 人 の 判 断 結果 の 度 数 で示 し た もの で あ る . こ の 結果 か ら・Pi- バ ○ は 全 て 高 い 周 波 数項 の 係数 に 数 値 を 与 え た図 形 鳶( ㈲ に類似 し て い る と判 断 さ れ る こ と が 解 る . こ れ は明ら か に低 い 周 波 数 の 成 分 が, 高 い 周波 数 の成 分によ っ てマスク さ れて お り , データ の 各変 数 の重 みが均 等 に 表 現さ れて いな い こと を示し て い る . 極座標フーリエ 級 数 グラフ は, 分類 のよ う に データ 全体 の 傾 向 の 表 現が 重 要な 場 合 ,2.3 節 の多 次 元 グラフ 表 現 法 の 比較・ 評価 で 示し たよ う に 優 れ た 特 性 を 持 つ が , 上 記 のよ う に データ の量 的 な 特 性 を的 確 に 表現 す る と いう 観点 か ら は 問 題 の あ る 表 現 法 と いえ よ う .し かし 筆 者は 本 章 に 於い て 極 座 標フーリエ 級 数 グラフ の図 形 と し て 備 えた 特 色を 活 か し つ つ , 上記 の 問題 点 を 解 決 する 表現 法 を提 案 する . 八(○ 八(○ 八(○ 八川(○