科学可視化のポスト処理

(1)

科学可視化のポスト処理

Post-Process for Scientific Visualization

白山晋

1

Susumu SHIRAYAMA

1

東京大学人工物工学研究センター

1

_{RACE, the University of Tokyo}

Abstract: Owing to the volume of data generated in recent computations and experiments, it is quite

difficult to extract useful information from these data even if using scientific/information visualization techniques. Method or methodology to extract useful information from such data should be considered. Several concepts of very large scale visualization are proposed in this situation. Most of them are based on high-performance computing techniques or highly-efficient devices for computer graphics. Although such studies have succeeded in visualizing ultra-scale data, several issues remain unsolved. In this paper, a flexible visualization methodology based on “post visualization process”, which includes a human recognition process and quantitative evaluations of visualized results is introduced. Finally, a possibility that a visualization agent designed from a process model helps to reduce the difficulty of handling huge data is described.

1.背景

Varian と Lyman は，1999 年に生み出された全情報を 1 エクサバイト，2002 年では，新たに保存された量が 5 エクサバイト，電子チャネル（電話，テレビ・ラジオ，インターネット）で伝送された量が 18 エクサバイトと見積もっている[1]．その後の光ファイバー網への移行， 1 テラバイト超の記憶容量を提供するハードディスク装置の大容量化，DVD，Blue-ray へと移行する記録媒体，さらに PC の 64bitOS への移行と主記憶容量の急増が続き，膨大な量のデータ・情報の，個々人での蓄積と広域分散化を加速している．この状況は様々な分野・領域において情報爆発 [2][3]として取り上げられ，ゼッタバイト，さらにはヨッタバイトという総量，個々人に対してはペタバイトという量に対応するための，データ・情報の革新的な処理法が模索されるようになる．科学技術計算，実験，観測においても，テキストデータ，音声や映像データよりも数値データに比重をおいたデータ処理という違いはあるが，同様にデータの大規模化，広域分散化が問題になっている．実験や観測におけるデータ取得技術は，点から面，そして空間へと進展し，技術計算においては時空間の高解像化が進み，PC の飛躍的な性能向上によってデータは個人の側に蓄えられることが増えたためである．例えば，図 1 上図は流体計算に用いられる格子点のおおよその推移である（95 年以前は主として AIAA Paper や Journal から，95 年以降はウェブからのデータである）．大学や企業の研究者へのヒアリングや著者の経験からであるが，現在，日常的な計算はパーソナルコンピューティングによる数十万から百万点規模の計算が多い．図 1 計算規模の推移と予測人工知能学会研究会資料 SIG-DMSM-A903-04 (03/29)

(2)

また，Butler の報告[5]にあるように，2015 年までに 128，あるいは 256 コアのマルチコアプロセッサの登場が予測される（さらに 512 から 1024 コアになるという予測もある）．実現すれば小規模 PC クラスタでさえ，数千の CPU を提供するようになる．現在， Super computing として行われている計算がパーソナルコンピューティングとして実施できるようになるだろう．図 1 下図に示すように数千万点規模の計算が日常的に行われると考えられる．現状の百万点であっても，座標，速度場，圧力場を求めるなら，１つのパラメータに対して，１時刻ステップあたり単精度で 28M（=1x106 _{x 7 x}_4）バイトの生データが生成する．100 ステップで約 3G バイトとなる．解析には物理パラメータに加えて計算パラメータに対するものも必要になるので，この程度の計算規模であっても膨大なデータが生成され，解析を難しくする．この状況を打開する一つの方法は，可視化1の利用である．事実，可視化によってデータは視覚情報にまとめられ（無意なものが棄却され），データ増加にともなう解析の困難が克服できると期待された．しかし，直接的な可視化では，副次的に派生するデータ（可視化パラメータやシステム情報など）や，生み出される視覚情報自身の増加を考慮すると，解析の難しさは変わらないとの見方が大半である[4]．また，数百，数千の CPU が生み出すデータに対応できる手法やシステムの確立が急がれている．本研究では，一つの方向性として戦略的な可視化を検討し，その戦略を示すことを目的とする．なお，科学可視化の対象は，計算，実験，観測，理論（例えば数式の表現）であるが，本稿では主として計算データに対する可視化を考える．

2.可視化の現状と課題

繰り返し述べることになるが，現在，日常的に行われている技術計算の規模は数十万から百万点程度と考えられる．対象と目的が限定されると，型通りに処理が進められることも多いので，格子生成から可視化までが一両日で終了することもあると聞く．ただし，著者の経験であるが，扱った経験が少ない 1_{可視化は，”みえないものを見えるようにする”，”みえ} ない関係性を顕在化する”ものとされるが，単に，データを視覚情報に変換することを，データの視覚化，あるいは可視化と呼ぶことも多い．実験・観測・計算からのデータの可視化（サイエンティフィックビジュアリゼーション， Scientific Visualization）に関しては，文献[17]での定義が定着している．なお，Scientific Visualization の訳語として科学可視化が一般化しており，本稿でもそれを用いる．対象に対して探索から始める場合，同規模の計算であっても詳細な分析結果を得るためには数週間を要する場合もある．可視化に限定しても同様である．可視化は探索（発見を含めて）と分析（解釈や利用を含めて）のプロセスに分けられるが，探索型の場合，目的があっても多くの時間を要する．例えば，図 2 に示す球を過ぎる流れの後流における渦構造[6]の抽出には可視化のみで１ヶ月以上を要した．数千万点を超える大規模な計算データの場合，対象と目的が決められた定型的な処理でも必要な情報を得るための労力は大きい．探索型の場合は更に効率が悪くなると予想される．図 2 球後流の渦構造(Re = 500，格子点数：200x100x81) Ma は，可視化が超大規模データに適応できるためには，並列化可視化（parallel visualization），知識ベース可視化（knowledge-based visualization），同時的可視化（in situ visualization），可視化インタフェース（visualization interface）が重要な鍵であることを指摘している[16]．並列化可視化，同時的可視化は計算環境に関連するものであり，可視化技術として扱われる．また，高性能計算の研究者の取り組みも多い．一方，知識ベース可視化，可視化インタフェースは人間を系に含むものであり，可視化研究者にとっての敷居は高いようで，取り組みは多いとはいえない[2][3][4]．しかしながら，可視化は，情報，あるいは知識の抽出過程とされ，得られた結果は，その分野や領域での知識を表すものとして扱われるため，知識の蓄積と活用という点では，可視化技術以上に重要である．しかし課題も多い．例えば，可視化操作によって生データが視覚情報に変換される際にユーザーの経験，あるいは知識が利用され，ユーザー毎に解釈が異なる場合がある．この場合，その分野，領域の知識になり得ないこともある．課題の多くは， (a) プロセスの記述性とプロセスの分析の問題 (b) 解釈の問題 (c) 定量性の問題

(3)

に帰着される[7][8]．これらの３つの問題は互いに関連するが，本稿では，(a)と(b)について検討する．なお，(c)の定量性とは，特に非定常データの可視化において問題になるものである．詳しくは文献[8]を参照されたい．さて，(a)と(b)の問題は，可視化プロセスの（半）自動化に向けた研究の中で扱われることが多い [3][4]．可視化は，図 3 に示すように可視化対象となるデータの選択の後，可視化操作（手法）の選択，結果の表示，結果の解釈を，解析者（ユーザー）が繰り返すことで進められる．可視化の意味づけや効果は，このサイクルの中で見いだされることが多く，この中で学習が行われることもある．この一連のながれを，改めて可視化プロセスと呼ぶことにする．そして，このプロセスを（半）自動的に行うことが試みられている．図 3 可視化プロセス科学可視化における可視化操作（手法）は，グラフ化などの統計的処理に関わる部分を除くと，格子線表示，格子面表示，等値線抽出，等値面抽出，等値領域抽出，ボリュームレンダリング，ベクトル表示，粒子追跡の８種類程度（分類法によっては多少変化する）である．数は多くないので，一見すれば可視化プロセスの記述性は問題にならないと考えられる．しかし，操作の履歴情報が残されることは少ない2．また，操作の選択や表示法には任意性があり，評価は曖昧なことも多い．このため，可視化プロセスの（半）自動化に向けた研究においては，履歴情報を蓄積し，再利用する仕組みや，プロセスの進め方が研究対象になっている．代表的な進め方に，操作手順のテンプレート化 [4]と，興味領域（ROI : Region(s) Of Interest(s)）と詳細度（LOD: Level(s) Of Detail(s)）にもとづくもの[9] がある．後者は，特徴量にもとづき ROI を定め（あるいは示唆し），あるいは単に ROI を定め，細部を 2_{利用するソフトウエアによっては履歴情報を残すもの} もあるが，そのソフトウエアでの再現性のためのものである．調べるというものである．また，事前知識やクラスタリングなどを利用して情報に階層的な構造を持たせることが多い．階層構造によって階層毎の情報の把握は容易になる．この方法では，詳細度にもとづいて予め階層化された情報（LOD）に対して，指標を定めて ROI のいくつかの候補を示し，人間の判断によって階層間を移動する[9]．階層間の移動において，詳細度の低い階層のある起点（基点）から高い階層へ（ドリルダウン）とその逆（ロールアップ）が，インタラクティブに行われる．このインタラクティブなプロセスに，人間が可視化結果を理解し，判断（意思決定）とともにプロセスを進めるというユーザーの解釈に依存する部分が含まれる．これらは結果にユーザーの主観が含まれることを意味する．このため，ユーザーの解釈に依存する部分を明らかにするような方法や方法論が模索されるようになる．例えば，解釈の方法や，人間の理解まで含めた可視化プロセスの検討である．また，可視化（あるいは可視化結果）の善し悪しの評価基準がされるようになっている．科学可視化に限らないが，可視化システムとしての評価[3][10]，利得の設定による可視化自身の評価[11]，視認性を可視化の善し悪しに利用した方法[12]，被験者実験による認知特性の評価[13]，視線移動と PageRank のような定量的指標を評価に関連付ける方法[14]などがある．インタラクティブなプロセスの中での，履歴情報の記述，システムの評価，解釈に関連する評価基準が(a)と(b)の問題を解決する鍵になっている．

3.可視化プロセスの分析

本研究では，可視化プロセスの分析から可視化戦略を検討する．可視化は技術計算という文脈では，ポスト処理に相当し，ポストと略されることも多い．このポスト処理は，解析結果を分析し，設計情報などを抽出するものである．一方，可視化自身もプロセスであるので，可視化プロセスの分析はポストのポスト処理といえる．可視化プロセスを一般的な意味での作業と考えると，目的と目的を達成するという観点が重要になる．例えば，可視化では「何のために何を視るか」が目的に相当し，「何がわかるか，わかったか」によって目的の達成度が決まる．しかしながら，可視化の多くは探索（発見）型であり，目的があいまいであることや，可視化の途中で目的が変更になることも多く，目的を同定することは難しい．一方，可視化の目的が決められ，定型化されたものも少なくはない．定型化された可視化プロセスの場合，可視化の目的に対して，目的を達

(4)

成するための方向性（方策，方針）を与える方法の提案はある．文献[15]では，２次元スカラー場の可視化には可視化操作の一つである等値線表示を選択するといった一般的な方法論が述べられている．しかし，これらは，可視化の目的を達成するという点では不十分であることが多い．例えば，｢２次元スカラー場の可視化｣には，‘物体に加わる局所的な力を知るために物体表面の圧力分布を調べる’や‘数値振動の有無や生じている場所を調べる’という，可視化プロセス全体における「何のために」に属する目的が存在し，単なる等値線表示ではそのような目的を達成することが難しいからである．本研究では，「何のために」に相当する目的を上位の目的とし，可視化操作や見方（表示）に直接関連する目的を下位の目的と呼ぶことにする．目的を，｢目的＝ねらい＋機能｣とした場合に，上位の目的が｢ねらい｣に，下位の目的が｢機能｣に関連付けられる．探索（発見）型の場合は，上位の可視化目的が一連の可視化プロセス後に同定されることが多い．例えば，２次元スカラー場の可視化のために，圧力場に対して等値線表示を行った結果，‘数値振動が生じている場所がわかった’というようなものである．上位の目的と下位の目的を結びつけるためには可視化対象に依存する分野（ドメイン）固有の知識が必要であることが多い．しかしながら，「物体表面の圧力分布を調べるために圧力場に対して等値線表示を行った」というように，可視化プロセスを繰り返す中で関係性が明確になる場合もある（目的があいまいであっても行う作業の種類は多くない）．ここで可視化戦略として，エージェントによる可視化の可能性や，可視化インタフェースの改良による可視化の効率化を考える．可視化の目的を同定することは難しいが， (1) 目的が階層的に表せる (2) 可視化プロセスの分析によって上位と下位の目的間の対応付けが可能になる (3) 下位の目的に関しては可視化操作と目的が対応付けられることを仮定する．可視化プロセス全体に対するエージェントを設計することは難しいが，どちらかの可視化目的が与えられた場合は一連の作業手順を決定できることが多い．本稿では，この点に着目し，可視化作業を分析することによって，可視化目的が与えられた場合の可視化エージェントに担わせうる作業や可視化インタフェースの改良のための情報を抽出する．

3.1 情報化と構造化

プロセスの分析は，機械処理に適した形式に履歴データや情報を再構成し（構造化，さらに階層化），再構成されたデータや情報に対して機械学習を含めたデータマイニングの方法を活用して行われることが多い．本研究においてもこの方針を採る．はじめに，データの情報化，データと情報の構造化が必要になる．第１のポイントはデータの記述法である．XML，RDF を利用してメタデータが追加できればよい．標準化の問題があり，そのような形で記述できるとは限らないが，部分的であっても機械処理に適した形式で記述できればよい．第２のポイントはパラメータ化と符号化である．可視化パラメータは， ●可視化対象の選択のためのパラメータ ●可視化操作に対するパラメータ ●表示方法に対するパラメータに分類される．例えば，圧力場に対する等値線の本数や３次元の視点である．また，可視化操作自体もパラメータ化されていた方がよい．はじめに， A：格子線 B：格子面 C：等値線 D：等値面 E：等値領域 F：ボリュームレンダリング G：ベクトル表示 H：粒子追跡のように操作を記号化する．これらの操作に，可視化パラメータが付随する．可視化パラメータを以下 の３種類のカテゴリ変数群(Oi,Di,Pi)で分類する． ・ O：操作に関わるもの（等値線(次元，分布，範 囲，本数，アルゴリズム等)，粒子追跡(状態，時間刻み幅等)など） ・ D：表示属性を示すもの（色，透明属性，矢印 等） ・ P：可視化精度に関わるもの（時間精度，空間 精度等）また，変数の意味，および取り得る値を予め定義しておく．等値線の範囲や本数，粒子追跡の時間刻み幅など，連続変数のものも多いが，一旦カテゴリ変数で表す．例えば，等値線に対するカテゴリ変数として， ・次元：O1 = {２次元,３次元} ・分布：O2 = {等間隔,不等間隔} ・等値線の値の範囲：O3 = {自動,デフォルト,入力} ・等値線の本数：O4 = {自動,デフォルト,入力} ・アルゴリズム１：O5 = {分割, 直接} ・アルゴリズム２：O6 = {直接,フラグ利用, MCube} ・表示属性：D1 = {色付き,モノクロ} ・空間精度：P1 = {線形補間, 双一次補間}

(5)

というようなものを考える．ここで，“自動”は，可視化対象のデータに依存してシステム側で自動的に設定するものである．“入力”は，数式表現されたものの係数を入力するもの，テーブル表現されたものからの選択などを意味する．このような変数に対しては，カテゴリを選択後に具体的な値を決めるとい う形式にする．例えば，等値線の値の範囲：O3 = {自動，デフォルト，入力} において，“入力”の選択後，最小値と最大値を要求する場合， O3 = “入力”｜(最小値, 最大値) のように属性値が付随する．また，表示属性や可視化精度に関しても同様に扱う．例えば，色の算出式やカラーテーブルといった更に詳細な情報が階層的に加えられることになる．さらにカテゴリ変数を符号化する．例えば，等値線の場合， C O1O2O3O4O5O6 のように符号化する．次元は“２次元”，分布は“等間隔”，値の範囲は“入力”，本数は“デフォルト”，アルゴリズム１は“分割”，アルゴリズム２は“フラグ利用”であれば，C002111 となる．このように可視化操作を，操作を表す記号と可視化パラメータによって符号化する．

3.2 構造化（ワークフローの記述）

可視化対象となるデータの選択後，可視化は目的に関わらず， (i) 可視化対象の場の決定（対象量，領域） (ii) 可視化操作の決定 (iii) 可視化結果の表示 (iv) 結果の解釈と判断を繰り返しながら遂行される．可視化操作と見方(表示)の繰り返しは，(i)→(ii)→(iii)，あるいは(ii)→(iii) の中で生じる．表示を経て，結果の解釈を行い，継続か終了かの判断を行う．そこで，表示（結果を見る）までの段階を一つの手続きとする．この手続きをパラメータの並びで表すことができれば，作業に対するワークフローといった，工程の繋がりや処理順序を記述し，管理することができるようになる．これが第３のポイントである．このためには，可視化操作のパラメータ化に加えて，(i)と(iii)についてもパラメータ化が必要になる． (i)の可視化対象の場は， (i-1) 可視化対象となるデータの種類 (構造型，非構造型，散逸型，複合型など) (i-2) 対象となる物理量（圧力，温度，速度など） (i-3) 対象領域 {面(格子面，切断面)，ボリューム(格子領域，切断領域)など} 等によって決まる．(iii)の表示は， (iii-1) 表示領域 (iii-2) ３次元の視点によってパラメータ化できる． 一つの手続きを Skとし， Sk≡{対象の場,可視化操作(可視化パラメータ),表示} によって表し，可視化結果 Vkと対応付けて，可視化結果がどのように生成されたかを示す．これは構造化された要素を，順序をつけて関連づけることに相当する．例えば，可視化操作の部分だけ示すと，等値線，格子線，ベクトルで表示するものは， S1= {...,C A G, ...} と表される．実際には，C002111 のようにより詳細なパラメータがともなう．パラメータによるワークフローの記述後，{対象の場, 可視化操作(可視化パラメータ), 表示}と，対象データ，および可視化結果を機械処理可能な形で結びつける．また，この際に，可能であれば，可視化結 果 Vkをパターン化しておく．パターン集合を Pmと すると，Vkは Pmのいくつかの要素に対応付けられる．このように，ある可視化結果を得るためのプロセスをパラメータ化と符号化によって機械処理可能な履歴情報として蓄えることが可能になる．

3.3 分析手法

得られた履歴情報に対して，目的，可視化作業，可視化結果の対応付けを行う．この際に，可能ならば，Fekete ら[11]のように可視化に対する利得を与える．より具体的には，X という対象に対して，目的 Yiと手続き Skの意図をヒアリング等で明らかにし，目的の達成度，知見獲得の有無，手続きの必要度な どを４件法や５件法で調べ，利得 Fkとして与える．この繰り返しによって，対象 X，目的 Yiに対して 可視化結果 Vkが手続き Skとともに蓄えられていく (k=1,...,N)．また，利得 Fkが与えられる場合もある．この履歴情報に対するデータマイニングによって手続き（操作や見方）の類型化を行い，連関規則のようなルール抽出を試みる．著者の経験からであるが，可視化プロセスの分析で得られるルールは多いと考えられる．一方，得られたルールよりも個々人の経験が優先されることが多いとも考えられる．そこで，有用なルールを活用する仕組みが必要になる．本研究では，はじめにエージェントによる可視化作業の可能性を検討する．これは，データの大規模性にともない，インタラクティブな可視化が困難となり，Ma が指摘する同時的可視化が必要になるためである．エージェントの定義は様々であるが，本研究では可視化エージェントを，

(6)

「手続き（操作や見方）の類型化から得られるルールにもとづいて，可視化作業を行い，可視化結果を蓄えていくもの」と考える．例えば，対象 X と目的 Yiに対して，計算点数以外を同じパラメータにした小規模な計算結果に対する可視化の履歴情報にもとづくプロセスの分析から直接的にルールを抽出する，あるいは手続き（操作や見方）の類型化の後にルールを抽出する．また，可 視化結果 Vkがパターン化できれば，ルールとパターンを関連付けておく．ある対象 X とある目的 Yiからの可視化結果は複数のパターンと対応付けられると予想される．その場合，パターンに対応付けられた別のルールが存在することもあるだろう．それらをエージェントに与え，エージェントを用いて大規模データに対する可視化を行い，効率的に有用な可視化結果を蓄えることを試みる．また，プロセス分析の結果は，可視化インタフェースの設計に役立つ．複数の手続きを組み合わせることで目的が達成されることが多いので，操作性が重要になるためである．次章で可視化プロセスの分析例を示す．

4.分析例と考察

いくつかの２次元物体を過ぎる非圧縮性流れの計 算データの可視化に対する履歴情報から，手続き Sk の中で，精度を調べるためのものを抽出する．この場合の目的「計算精度を検討する」は流体計算では一般的なものなので，用意した選択肢や，自由形式の記述等により明らかにできる．以下の，目 的の達成度は，可視化結果 Vkに対する，（4：十分にできている，3：どちらかといえばできている，2：どちらかといえばできていない，1：できていない）という４件法の主観的判断によるものである．また，いくつかの数値振動のパターンがわかっているので， Pm_{を形成し，関連付けることができる．} はじめに，以下のようにパラメータを簡素化する．可視化対象となるデータの種類は構造型，物理量は， q1：圧力，q2：速度，q3：渦度，q4：流線とする．簡単のため，圧力と速度などを同時表示したものはルール抽出の対象から除外する．可視化操作は，A：格子線，C：等値線，G：ベクトル表示とする．格子線のパラメータは，範囲（全体，物体面，領域指定）のみとする．それらを a1：全体，a2：物体面，a3：領域指定，と記号化する．等値線に関しては，分布と値の範囲をまとめて記号化する．分布を（等間隔，不等間隔），値の範囲を（全体の最大最小，指定領域の最大最小，0 を中心とする入力値）とし，c1：等間隔，全体の最大最小， c2：等間隔，指定領域の最大最小，c3：等間隔，0 を中心とする入力値，c4：不等間隔，全体の最大最小，c5：不等間隔，指定領域の最大最小，c6：不等間隔，0 を中心とする入力値，のように記号化する．ベクトル表示は，範囲（全体，物体近傍，領域指定）とする．それらを g1：全体，g2：物体近傍，g3：領域指定，と記号化する．なお，利用されなかった操作は a0，c0，g0 としている．表示に関しては，平行移動，拡大，縮小に限定し，v0：デフォルトのまま，v1：平行移動，v2：拡大，v3：縮小，v4：平行移動，拡大，v5：平行移動，縮小，v6：拡大，縮小，v7：平行移動，拡大，縮小と記号化する．表 1 に手続き Skの一部を示す（抽出した手続きの総数は 30）．はじめにバスケット分析の例を以下に示す．達成度を除外し，表 1 の多値のカテゴリ変数を 0,1 のダミー変数に展開し，R[18]の arules を用いて連関規則を求めた．カテゴリの数が増えると，arules のパラメータを調整しても多くのルールが導出される．ここでは，２つのルールを示す． rule1｜{操作 A=a1, 操作 C=c2} => {場=q1} rule2｜{操作 A=a2, 操作 C=c6} => {場=q4} これらを読み解くと，rule1 は，「圧力場の可視化を利用して計算精度を検討する場合，指定領域に対して等間隔で等値線を表示し，かつ格子線全体を表示する」というもので，rule2 は，「流線の場合は，0 を中心とした入力によって不等間隔で等値線を表示し，格子線は物体を表示する」というものである．繰り返しになるが，得られる連関規則は多く，意味のあるものを見つけることは難しい．結果の精査は必須であるが，文献[15]で示されている「２次元スカラー場の可視化には可視化操作の一つである等値線表示を選択する」のようなルールよりも詳細なものを見つけることはできた．表1 可視化手続きの例手続き# 場操作表示達成度 A C G 1 q1 a0 c1 g0 v0 2 2 q1 a1 c1 g0 v0 2 3 q1 a1 c2 g0 v2 3 4 q1 a3 c2 g0 v6 4 ・・・ 29 q2 a2 c0 g1 v6 2 30 q1 a2 c3 g0 v6 2

(7)

次に決定木によるプロセスの分析例を示す．決定木は CART によって生成した（R の mvpart パッケージを利用した）．図 4 は，達成度を基準変数に，場，操作 A，操作 C，操作 G，表示を予測変数としたときの決定木である．図 4(a)では，達成度が 1 と 2 を “NG”で，3 と 4 を“OK”とした分類木である．下図(b)は量的変数とした回帰木である．図 4(a)から，操作 C が達成度を分ける第一の要因であることがわかる（操作 C のうち，c2,c3,c6 の場合が達成度 OK である）．右側のブランチの第一の分岐は，次に操作 A が達成度を分ける要因になっていることを示している．上述の連関規則の rule1 を考慮し，可視化対象の場の影響は小さいことから，計算精度を確かめる場合，場に依らず領域を調べた方がよいとなる．また，ベクトル表示による分岐が存在しないことから，「計算精度を検討する」場合，ベクトル表示の優先順位は低いことがわかる（ただし，この履歴情報の範疇ではある）． (a) 分類木 (b) 回帰木図 4 決定木による分析これらの結果にもとづき，エージェントを設計する．もっとも単純な方法は，テンプレートの利用である．可視化結果のパターンへの対応付けができれば，ルールベースで，複数の可視化結果を得ることもできるだろう．講演時にその例を示す予定である．次に自己組織化マップを用いた分析例を示す．表 1 から達成度を除外し，要素から c4 と c5 を除いた（30 の手続きにおいて用いられていないため）ものを，0,1 のダミー変数に展開し，16 個の属性を入力層のユニットに与える．出力層は 10 x 10 のユニットとした．R の som パッケージを利用し求める．その結果を図 5 に示す．すべての手続きは出力層のいずれかのユニットに含まれる（図では重畳を防ぐために表示位置をずらしている）．いくつかのクラスタに分類されることがわかる．おおまかには可視化対象の物理量によって分かれ，いくつかの操作が近くに配置されている．この情報にもとづく可視化インタフェースにおける操作ボタンの配置変更などが考えられる．図 5 自己組織化マップによる分析

5.おわりに

データ・情報の大規模化，多様化にともない，情報を一個人では消化できないという状況が新しい知見の創出を妨げていることが指摘され，視覚（可視化）情報のような人間が直感的に理解しやすいものへの変換は必須になっている．一方，同時に，可視化作業自体の難しさや非効率性が指摘されている．このため，可視化作業を支援する，あるいは効率化する仕組みが必要になっている．本稿では，可視化プロセスの分析法を提案し，分析結果を利用した可視化エージェントや可視化インタフェースの設計をその仕組みの例として示した．文献[2][3]や，[4]の可視化に関するトップレベルとされる会議において，可視化，あるいは可視化システムにおいて，人間（分析者）を系に含める必要性は強調される．また，文献[9]∼[15]を発展させた研究例も見受けられるようになった．しかしながら，本稿で示したデータマイニング手法を可視化プロセスの分析に適用したものですら，ほとんど行われて

(8)

いないのが科学可視化の現状である．したがって，必要性が説かれる中で，研究の緒についた段階のものが多いことは事実である．さらに多くの研究が望まれる．

謝辞

本研究の一部は科学研究費補助金(基盤研究(B))(課題番号 21300031)の援助を受けた．記して謝意を表する．

参考文献

[1] Lyman,P. and Varian H.R.:How much information, http://www.sims.berkeley.edu/research/projects/how-muc h-info/

http://www2.sims.berkeley.edu/research/projects/how-mu ch-info-2003/

[2] Johnson, C., Moorhead, R., Munzner, T., Pfister, H., Rheingans, P. and Yoo, T. S. : NIH/NSF Visualization Research Challenges Report Summary, IEEE Computer Graphics and Applications, Vol.26, No.2, pp.20-24 (2006) [3] Hansen,C.D., Johnson,C.R. Pascucci,V. and Silva, C.T.:

Visualization for Data-Intensive Science, In The Fourth Paradigm of Scientific Discovery, Microsoft Research, pp.153-163 (2009)

[4] IEEE Symposium on Visual Analytics Science and Tech- nology: http://vis.computer.org/VisWeek2009/vast/ [5] Butler, D.: The petaflop challenge - Future super-

computers could leave scientists scrabbling for software, Nature Vol.448, No. 7149, pp.6-7 (2007)

[6] Shirayama, S.: Flow past a sphere: topological transitions of the vorticity fields, AIAA Journal, Vol.30, No.2, pp.349-358, (1992)

[7] 白山晋：知的可視化，丸善 (2006)

[8] 白山晋：非定常流れに対する定量的可視化法，日本機械学会第 22 回計算力学講演会講演論文集， CD-ROM,OS2-211, (2009)

[9] Rauschenbach, U.: Progressive Image Transmission using Levels of Detail and Regions of Interest, Proc. of IASTED CGIM 98, pp.38-41 (1998)

[10] Plaisant, C.: The Challenge of Information Visualization Evaluation, Proc. of the working conference on Advanced Visual Interfaces 2004, pp.109-116 (2004)

[11] Fekete,J-D., van Wijk, J-J., Stasko, J.T. and North, C.: The Value of Information Visualization, Lecture Notes in Computer Science, 4950, pp.1-18 (2008)

[12] Chan,M-Y., Wu, Y., Mak, W-H., Chen, W. and Qu, H.: Perception-Based Transparency Optimization for Direct

Volume Rendering, IEEE Trans. on Visualization and Computer Graphics, 15.6, pp.1283-1290 (2009)

[13] van Ham, F. and Rogowitz, B.E.: Perceptual Organization in User-Generated Graph Layouts, IEEE Trans. on Visualization and Computer Graphics, 14.6, pp.1333- 1339 (2008)

[14] Egawa, A. and Shirayama, S.: Generation of an Impor- tance Map for Visualized Images, Lecture Notes in Computer Science, 5875, pp.135-146 (2009)

[15] Keller, P. R. and Keller, M. M.: Visual Cues: Practical Data Visualization, Institute of Electrical & Electronics Enginee, (1993)

[16] Ma, K.-L. : Visualizing Ultra-Scale Data, ACM SIGGRAPH 2008 talks, (2008)

[17] McCormick,B.H., DeFanti,T.A. and Brown, M.D.: Vis- ualization in Scientific Computing, Computer Graphics, Vol. 21, No. 6, pp.1-14 (1987)

科学可視化のポスト処理