• 検索結果がありません。

知識ベースCFD

N/A
N/A
Protected

Academic year: 2021

シェア "知識ベースCFD"

Copied!
11
0
0

読み込み中.... (全文を見る)

全文

(1)

〔特集〕CFD

の新展開

知識ベース

CFD

Knowledge-based CFD

東大院・環境海洋工学

Susumu SHIRAYAMA

1 CFDの現状と新展開に向けて CFDにおいて未解決な問題は少なからずある. 構造計算等との連成問題を除いても, ・計算結果の信頼性の保証 ・計算の最適化 ・非定常流に対する高精度,かつ高効率な解法 ・複雑な計算領域となる流れ場の高精度,かつ 高効率な解法 ・適切な初期条件と境界条件の与え方 ・乱流モデル,あるいは乱流の扱い などといったものがある.これらは全くの手つか ず状態ではない.例えば,複雑な計算領域という ことだけに着目すると,市販のソフトウエアを取 り上げるまでもなく,格子点数と手間暇さえ考え なければ,どんな対象でも格子生成が可能である ことに異論を唱える研究者はいないだろう.課題 となるのは質の良い格子をいかに効率的に作るか である.では,質の良い格子とは何か? 診断量 の提案1)はあるものの熟練者の判断に任されて いるのが現状である. CFDの今後の展開にはいくつかの方向がある. 利便性や効率性を追求するもの,厳密性を考えて いくものなどである.いずれの方向にも信頼性 の保証の問題が鍵となっているが,理論的なアプ ローチだけでは解決できないと考えられる.例え ば,等間隔直交格子にもとづく方法は,CFDの黎 明期ともいえる60年代から現代に至るまで途絶 えることはなかった.初期の頃はともかく,格子〒113-8656 文京区本郷 7-3-1E-mail: sirayama@nakl.t.u-tokyo.ac.jp 生成法が発達した現在においても設計の初段階な どでの利用を目的とした研究が続けられている. この中で実験や他の計算結果と定性的に一致する のは,基本的には境界の形状効果が小さな流れ場 を扱っているとされるが2, 26,形状効果が小さい という理由以上に有益な情報を獲得しているケー スがあることを見逃してはならない.解析者が境 界形状の近似の意味を理解し,その上で計算結果 を解釈し,信頼性を与えている場合である.熟練 者の知見が介在していることを認識することが重 要である.また,ある基準解にもとづいて効率, あるいは厳密性を考え,基準解をもとに信頼性を 述べるといった方法には,ある問題でいえたこと が別の問題ではいえないという非線形性や数値 誤差に起因する問題が生まれる.適切な基準解を 系統的に増やしていく必要がある.適切な基準解 とは何か,ここでも熟練者の知見を活かす必要が ある.とはいえ,時空間の解像度と用いた手法な どの情報から精度は何%といえた方がよい.ある いは,この計算結果では,この部分の信頼性は問 題がないといえるような診断法が必要とされる. このため, ・支配方程式の性質を反映するような基礎ス キーム,あるいは数値解法の開発(移流方程 式にもとづく高精度スキームや,質量の保 存,角運動量の保存,エネルギーの保存を保 証する離散化の方法など) ・高速な計算法(数値解法のみならず計算環境 を含めた統合的な意味での高速化) ・実験との協調 ・安定性解析などの理論的な側面からのアプ

(2)

ローチ ・事後評価法 などの研究が進められている.CFDが非線形な 方程式系を扱う限りは,高度な数学的な道具が 必要とされることにかわりはない.これまでの CFDの方向性を決めてきたものは,そのような 道具を作ることであったし,今後も変わらないで あろう. 一方,先述したように熟練者の判断や知見がい たるところに見え隠れしていることも事実であ る.CFDにおいて,そうしたものの多くが知識 情報として蓄えられてきたかと問われると,いさ さか懐疑的に答えざるをえない.個々の研究者 が蓄えている知見を知識情報として集約し再利 用する仕組みが欠けているように思われる.こ の観点からは,システム工学や知識工学に属する 手法の活用を模索するという戦略があってもよ い.実際,知識ベースを利用したCFDに関連し た研究はそれほど目新しいものではない.エキス パートシステムとして知識ベースが組み込まれ た流体解析ソフトウエア3もあれば,インテリ ジェントCFDソフトウエアというものも存在し ている4).しかしながら,人工知能の研究から発 展した知識工学が,ゲーム理論,自然言語理解, パターン認識,学習理論,データマイニング,さ らに脳自体の研究といった非常に広範囲の体系 の中で再構成されていることを考えると,それら は,その一端を利用したものにすぎない.特に近 年発展している知識獲得のための方法を用いたも のはほとんどない. CFDにおける知識の活用方法は,知識工学の 研究を構成する体系とCFDにおいて用いられる 計算技術,可視化技術等を結びつけて提案される 必要がある.このような視点は,データマイニン グの解説等で散見するが5),具体性に乏しい.そ こで,本稿では,著者らが行っている‘流れ場に おける特徴量の抽出法’と‘パラメータの推薦シ ステム’を取り上げて,知識工学の中で利用され る知識抽出の方法と,知識の集約と再利用の方法 がどのように用いられればよいのかについて述べ る.また,熟練者の判断,知見に着目し,人的資 源の在り方について考察を加える. 2 知識ベース はじめに人工知能,認知科学,知識工学などの 教科書の中で,知識ベースと関連して扱われてい る事項について簡単にまとめておく. 知識とは問題解決に必要な情報であり,主と して,宣言的知識と手続き的知識に分けられる. 宣言的知識(declarative knowledge)とは,モノ, あるいは事象が何であるかを示す情報であり,手 続き的知識(procedural knowledge)とは,どの ように利用するかを示す情報である.また,知識 には暗黙知と形式知と呼ばれるものがある.暗黙 知とは,直感的なひらめきを導くものや熟練者の 勘のように情報として表現が困難なものを指す. 暗黙知を何かしらの方法で文章などの言語的,あ るいは分析的な情報の形にしたものを形式知とい う.暗黙知を形式知化する努力が様々な分野で行 われている.例えば,熟練工の作業手順の記述・ 分析などである. 知識に関する情報の表現形式と利用法を知識 表現という.知識を利用するためには,問題解 決に必要な情報を知識表現化することが必要に なる.また,獲得(acquisition)すること,検索 retrieval)できること,推論(reasoning)によっ て問題解決に至ることが必要になる. 知識ベースは,知識とデータベースからの造語 ともいわれている. 知識を獲得すること,知識 表現された情報を蓄えること,蓄えられた知識の 中から問題解決に必要な知識を見つけること(検 索),既存の知識体系から合理的な方法によって 未知の問題に対する答えを導くこと(推論)まで を含んでいる.本稿では,主として知識の獲得と 検索を扱うので,この二つに関して説明を続ける ことにする. 知識の獲得とは,学習などによってデータの 中から知識を見つけ,既存の知識と関係付けて, 知識を体系化しながら集約することである.コ ンピュータの発達にともなって,機械学習と呼

(3)

ばれるデータに潜む有用な知識を効率的に自動 発見するための技術が発展した.一方で,データ の爆発的な増加にともなって,抽出された知識 の保存法,既存の知識の中から新しい知識であ るかどうかを調べる仕組み,知識を効果的に提 示する方法など,機械学習だけでは対処できな い問題が生じた.この状況の中で生まれたのが

KDDKnowledge Discovery in Databases,ある いはKnowledge Discovery and Data mining)で ある.AdriaansZntingeは,KDDを「データ から,以前には知られていない,そして潜在的に は有用な知識を引き出す方法であって,自明では ない方法」と定義している20).また,データマ イニングをKDDの過程における発見の段階とし ている.価値ある情報の発見にデータマイニング を用い,体系化された知識の保存と検索のために データベース技術が必要になる.KDDによって 知識を獲得する際においても,獲得した知識を利 用する場合にも検索は重要な役割を担う.検索の ためには,知識を,追加,削除,修正が容易であ る知識表現で扱う必要がある.このため,知識の もとになるデータを効率的に扱う仕組みが研究の 対象となった.その結果,データの爆発的な増加 にともなってKDDが発達したように,その基盤 技術となるデータベース技術も進化した21 データベースに要求されることの一つにデータ の共有がある.データベースを利用しているから といって,データの共有が容易に実現できるとは 限らない.ネットワークが発達し,様々な種類の データベースが分散するようになると,さらに難 しくなる.既存の計算結果をデータベースに蓄え るにしても,データベースの構築者,あるいはそ の関係者以外の利用が困難であるといった状況が 生じている.このため,データの標準化が必要に なる.いくつかの分野では,データの形式に対し 約束事(プロトコル)を決めてそのような取り組 みを行っている22.この際に,データの階層構 造化がなされることも多い. 検索にはキーワード検索と内容検索がある. キーワード検索は,データの内容や性質を表すテ キスト情報の中からテキストとしての検索キーを 用いて検索を行う方法である.画像や音声などの テキスト情報以外のものを検索する場合には,そ の内容・性質を表すテキスト情報を関連づけてお く必要がある.関連したテキスト情報は属性情報 として埋め込まれ,メタタグによって構造化され ることが多い.メタタグとは,メタデータを定義 するために用いられるタグである.メタデータと は,データに対するデータ,文書・書類・記録に 関する情報,あるいは機械が理解できるWeb の情報などと定義されている.キーワード検索に 対し,内容検索は,データの内容を直接的に比較 し検索するものである.例えば,画像データであ れば,検索キーとして画像データを与え,類似画 像を探すといったものが提案されている23.検 索は,検索キーと検索対象との比較によって行わ れる.比較の際に用いられる指標が類似度であ る.画像のように対象そのものの比較が難しい場 合は,データ内容を示す特徴量を抽出して特徴量 をもとに検索が行われることが多い. 正確な検索と,その効率化に寄与するものに, シソーラスとアノテーションがある.シソーラス thesaurus)という言葉は類義語辞典や用例集を 示すが,検索においては,的確な情報を探し出す ために使用される検索用語集を意味する.例え ば,上流差分と風上差分は同じ意味で使われるこ とが多いが,検索キーを風上差分として検索した 場合,後者のみが見つけられる.シソーラスを利 用すると両者を探し出すことができるのである. アノテーション(annotation)は文字通り,注釈 付けのことである.的確な検索のためには内容 を示す多くの属性情報がある方がよい.例えば, 支配方程式という言葉が流体力学に関連して用 いられている文章を検索する場合を考える.支配 方程式は,オイラー方程式,ナビエ・ストークス 方程式などを指すので,まず,支配方程式に対し て複数個の定義文を与える.このようにすると, オイラー方程式を検索キーとして検索を行うと支 配方程式を含む文章群が検索結果となる.このと き,ある論文中の支配方程式という言葉が明らか

(4)

にオイラー方程式を指す場合,それを注釈付けし ておくと,漏れが少なく的確な検索が可能になる のである.このようにして行われる注釈付けのこ とをアノテーションと呼ぶ.コンテンツに対する コンテンツであることからメタコンテンツとも呼 ばれる. アノテーションには専門性が必要になる.こ れは,組織としての知識管理の在り方を意味する ものでもある.同じ専門分野の人間が集まれば, 知識の効率的な獲得も可能になるだろう.この考 えにもとづいて,提唱されているのが協調フィル タリング24)やドメインモデルといった組織の知 を扱う方法論である.協調フィルタリングとは, 複数のユーザーが協力しながら自身の扱った情報 に対するコメントを記録することによって,他の ユーザーが情報をフィルタリングすることを助け るものである.知識の獲得,検索におけるドメイ ンモデルとは,データが生み出された分野に関す る知識をもつユーザーを限定することによって, 分野に固有の良質な知見を獲得するためのモデル である(ノイズを除去できる).分野固有といっ ても,その方法論は他分野への適用を考慮したも のになっている. 以上,知識の獲得,検索について簡単に述べた. これらの手法を用いて,知識ベースのCFDを構 築する際に留意しなければならないのは,CFD の場合には既に数理的な背景があるという点であ る.このため,分類,ルール抽出,予測(あるい は予測モデルの構築)に関連づけて扱う必要があ る.具体的にいえば,得られた数値解の中から特 徴的な部分を見つけ出すこと,さらに支配方程式 から簡単には類推できないルールを発見すること が一つの目的となる.とはいえ,系統的なデータ 処理法の確立,知識の集約,解析結果の信頼度の 提示などにおいて,直接的に利用できる考え方も 多いだろう.しかしながら,科学技術計算分野の 知識情報化においては,データの標準化,データ の階層構造化,データベースの構築といったもの が多く,知識工学が目指しているような応用例は まだ少ない. 3 特徴量の抽出 3.1 データマネージメント 3.1.1 データの構造化とデータベース VarianLymanは,1999年に生み出された情 報を1エクサバイトと見積もっている27).実際 に生み出されたデータはこれ以上のものと予測 されるので,知識ベースを,データを中心として みれば,データとの戦いの歴史であることもわか る.図1において,データの増加を発生源ととも に模式的に表した.可視化やデータマイニングに よって,データは纏められ,無意なものが棄却さ れる.近年の情報科学において提案されている方 法は,データ量の爆発を抑えていることは事実で ある.しかしながら,副次的に派生するデータ, 陽に表現できないデータを加えると,消化できな いほどのデータが蓄積していることは想像に難く ない.また,ネットワークの発達により,データ は分散して存在するようになっている. CFDも例外ではない.80年代はスーパーコン ピュータの発展も相まって大量に吐き出された データではあったが,データの解釈やそれに基づ く低次元化(あるいはデータの再構成)は容易で あると考えられ,必要な部分だけ取り去れば,一 人の研究者でも扱えないほどのデータは残らな いだろうとの見解があった.ところが,信頼性の 問題は大きく,さらなる高解像度計算が必要とさ れ,有意な部分と無意な部分を分けることすら難 しくなっている.また,PCの性能向上によって 高解像度データの分散化が進んでいる.一方,実 験においても,PIVなどの広範囲の空間情報を扱 図1 情報の発生源と情報量の推移

(5)

う方法が発展し,大量のデータが発生している. この結果,多種多様な大規模データが分散して存 在するようになった. このようなデータ群から知識を抽出するために は,はじめにデータの構造化が必要になる.デー タの構造化とは,データ形式や属性情報を規定 し,データを階層的に扱えるようにすることであ る.新たに生じるデータに対してプロトコルを決 めることが望ましいが,必要十分なものを規定す ることは難しい.既存のデータの処理も考える と,データ形式や属性情報が決められたときに, XMLなどの変更に耐えうる方式を導入するのが よい6).あるいは,変更に対応する仕組みを考え る方がよい.データ・クレンジングは,その一つ の方法で,あるデータを必要な形式に変換すると か,データの意味解析を行い管理できる形に加工 するというところまでを含んでいる. CFDの場合は,データが生み出される過程を パラメータ空間で表現できれば再現性を確保でき る.このため,そのようなパラメータ空間をデー タベースと関連づけて利用する方法が考えられ る.例えば,3次元の計算格子点全体は,表面格 子,空間格子生成法(格子生成プログラム名)と そのパラメータによって表現できる.これは計算 にも当てはまることである.このような情報は, データ形式の変換と属性情報を再構成する場合に 役立つばかりではなく,データを解釈する場合に も重要である. データ形式や属性情報が規定できれば,データ ベース化によって,データを管理するのが適当で あろう.現在のデータベースはネットワークに対 応するものが標準であるから,通信速度の問題を 除けば,広域に分散しているデータにアクセスす ること自体は難しくない. 3.1.2 欠損情報の補完 CFDのデータであれば,それが生じた過程が 管理できている場合,共通のデータ形式,属性情 報に再構成することは難しくない(既存のデータ において,生み出された過程が管理されていると は言い難いが).しかしながら,実験や観測から 得られるものを再構成することは困難である.多 くの場合,欠損情報が生じる.このため,欠損情 報を補完することが必要になる.この補完には, アノテーションに関連する研究成果や機械学習に もとづく予測手法を用いることができるだろう. 次節にも関連するが,シソーラスの整備は,研究 グループ間の用語の違いを補う上で欠かすことの できないものである. 3.1.3 検索と比較 最近の情報科学の手法を用いれば,広域に分散 するデータに対して,信頼性の高いデータベース を構築することが可能となるだろう.一方,デー タベースが構築できたからといって,データが有 効に活用されないのでは意味がない.CFDデー タは巨大な数値の羅列がもとになっていることは 変わりないので,この中から必要な情報を取り出 す仕組みやデータを効率よく再利用するための方 法を考える必要がある.例えば,ある計算結果に 近い実験データを効率良く見つけ出すとか,同じ ような計算を繰り返さないための仕組みである. この仕組みの基本となるのが検索技術である.第 2節で述べたように検索にはメタデータをもとに したものと,内容にもとづくものがある.CFD のデータにおいて,計算対象,及びデータの生じ る過程が属性情報として記述されていれば,それ をメタデータとして検索できる.計算結果の内容 まで踏み込んだ検索は,類似度の定義と比較が多 岐にわたるために難しいものとなる.生データの 内容検索を直接的に行うことはほぼ不可能なの で,間引き,基底関数への分解などによってサブ セットを作り,データ管理の効率化を図ることに なる.例えば,ウェーブレットを利用した大規模 データ管理が模索されているが7),特徴的な成分 をもとにして比較・検索に利用することもできる だろう.一方,生データに対する可視化情報をも とにしたデータ管理の方法も考えられる.この 場合でも特徴領域にもとづく検索・比較となる. そこで,可視化を利用した特徴領域の抽出法の一

(6)

例を紹介する. 3.2 階層的可視化によるデータの管理 大規模計算に起因するデータマネージメント の問題に対して,可視化情報の活用が模索されて いる(ビジュアルデータマイニング:Visual Data Mining13 ).可視化情報からの特徴量の自動抽 出が要素技術となる.特徴領域の抽出は,別の見 方をすれば不要な情報を棄却することでもあり, 時空間の情報を集約することにつながる.留意す べき点は,特徴領域以外の情報がすべて不要であ るかどうかである.このため,全体と局所(この 場合は特徴領域)の関連性を示すような可視化が 必要となる.特に全体場を簡易的に知ることが過 不足なく特徴領域を抽出するために重要である. 全体場を可視化する方法としては,スカラー場で あれば,ボリュームレンダリングが,ベクトル場 であれば,LIC8 やピクセル露光法9, 10)が提案 されている.これらの全体可視化法はディスプ レイを基準として,表示範囲にある情報を余すこ となく提供するという指針で構築された手法で ある. 特徴領域としてはじめに思いつくものは,流れ 場の位相的な表現11, 12であろう.流体解析とい うドメインの中では,この表現は流れ場の骨格 を示すマーカーとして重要な意味をもつ.また, 一般論として,位相情報のような抽象化されたも のは,情報の圧縮や検索のためには有用である. しかしながら,図2で示すように渦度場と特異点 が対応しない場合があり,特徴量となっているか どうかには注意しなければならない場合もある. この点に留意すると,特徴領域だけを扱うのでは なく,特徴領域と全体の可視化を対応づけて扱う 必要があることがわかる.はじめに全体可視化法 を利用して,全体を示し,特徴領域に対する可視 化結果を埋め込むという階層的な可視化を行えば よい.階層化によって,情報という意味でも,全 体と局所の関係を明確にすることが可能となる. そして,この階層的な可視化情報を知識抽出の ベースとする. 3.3 渦構造を特徴領域とした場合の知識発見 プロセス 流体現象を渦構造の抽出によって解明しようと いう多くの試みがなされている142次元にお いては渦度が直接利用される.3次元では,渦度 ベクトルの解釈の難しさ15)から,速度ベクトル 場の特異点にもとづく渦中心の同定法16),渦度 ベクトルの絶対値,エンストロフィ密度,圧力断 面極小旋回法17などの様々な提案がなされてい る.これらの研究は検索情報の形成としても利用 できるだろう. ここでは,著者らが提案している渦構造の渦要 素表現について述べる.図2に示す渦度の分布 は流れの構造を知る上で重要である.しかしな がら,領域としての渦度分布から知識を得るこ とは,熟練者であっても易しいことではない.そ こで,図2の渦度分布を渦要素によって再構成す る.図3がその結果である.いくつかの渦要素 は,グループ化され,ラベルがつけられている. また,渦要素による流れ場の再構築が可能である ことが示されている18 詳細は,文献18に譲るが,渦要素化の手順は, i)全体可視化と特徴領域の表示を基本として, 渦構造に着目し,一次量として計算データ 図2 2次元翼を過ぎる流れの渦度分布と特異点分布 図3 渦要素化による2次元翼を過ぎる流れの表現

(7)

Data)から渦度(Target Data)を計算する. ii)渦度の必要な部分を選別し(Preprocessed Data),一次量を保持しながら,連続に分布 する渦度を渦要素(Transformed Data)に変 換する. iii)渦要素のまとまりをクラス化しラベリングす る.また,クラス化した渦要素のパターンを 調べる(Patterns). iv)ある部分の渦糸要素と物体との干渉を定性的 ではあるが客観的に調べられるようにする Knowledge). というように,Fayyadらの提案する知識発見の プロセス19に相当している. 渦要素の分布を特徴量として扱うメリットは, ある要素のある部位に対する影響を見積もること ができるということである.これは,(iv)の知識 抽出プロセスを考える上で重要である.図4は, 円柱を過ぎる流れから渦要素を抽出したもので ある.渦要素から誘起される速度場が計算でき るので,短い時間であれば流れ場の変化を予測す ることができる.図4 Aの渦要素分布から渦要 素の動きを予測したものが図4 Cである.図4 B は元となる流れ場から図4 Cと同時刻の渦度分布 を求めた後に渦要素化したものを示す.また,右 下図は図4 Aと図4 Cをもとに流れ場の変化を示 したもので,渦要素の抽出による流れ場のパター ン化と,渦要素間の相互作用から導かれた. 図4 2次元円柱を過ぎる流れ場の渦要素化と 時間変化の予測 このように,知識工学の中で提案されている 手法をCFDに応用した場合の効果は期待できる が,熟練者が既にもっている知識である場合も多 い.例えば,図4の右下図は熟練者であっても予 測は難しいが,類推できる場合があるかもしれな い.ただし,確固たる理由での類推ではなく,経 験と感による場合も多いのではないかと考えられ る.要するに暗黙知が介在するのである.もしこ のシステムが提示する結果と熟練者の類推過程を 比較することによって形式知化することができれ ば,人的資源を育てる,あるいは補うための知識 の集約が可能になるだろう.このためには情報を できるだけ忠実に簡素化する方法が必要になる. 本節で紹介した方法はそのようなものであると考 えられる. 4 パラメータ推薦システム CFDが発展するとともに,多くの計算プログ ラムが生み出されている.そのほとんどが制御構 造が単純であるというプログラム上の特徴をも ち,プログラム自体は構造化されているものが多 い.大枠となる数値解法が60年代にほぼ確立さ れているためである.したがって,機械的な書き 換えによって基礎研究の成果を取り入れることが できた.例えば,移流項を高精度化する場合,部 分的な書き換え,境界条件の追加と配列変数の宣 言を変更するといった所定の手続きによってプロ グラムの性能を向上させることができる.また, 有限差分法,有限体積法,有限要素法といった微 分型,積分型の離散化手法を問わず,同種の高精 度化,あるいは高効率化手法を導入できるよう になっている.一方,高精度化手法の検証の遅れ や,複数の高精度化,高効率化手法が存在するた めに同一のプログラム中でいくつかの手法を選択 できるようにしているものが多い.また,計算対 象となる問題の非線形性や,連成問題のような他 種のプログラムとの連携に起因して,問題毎に変 更が必要な部分も少なくはない.さらに並列計算 といった多様化する計算環境へ対応するための変 更やプログラミングチューニングによって効率

(8)

化も行われる.結果として,機能としては同じよ うなプログラムでさえも数多く存在するように なった. このような状況で,ユーザーが目的に適した計 算プログラムを選択し,問題解決のために最適な 計算パラメータを決定することが難しくなってい る.本節では,データマイニング技術を利用した パラメータ決定の仕組みについて説明する. 4.1 パラメータ空間の大きさ 目的にあった計算プログラムの選択,計算パラ メータの設定は未だに経験的な知見にもとづい て行われることが多い.このため,利用者の負担 は大きく,CFDの信頼性を疑う議論が計算結果 の解釈よりもCFDプログラムの使い勝手から生 じていることも多い.そこで,問題解決に適した パラメータを推薦するシステムを構築すること とする.この際,例えば,表1に示すように計算 プログラムもパラメータ化して,パラメータ空間 を構成する.このようにパラメータ空間を拡大す ると,パラメータの共通化と,系統的な絞り込み が必要になる.また,計算プログラムのパラメー タ化のためにはシソーラスがあった方がよいだ ろう. ある問題解決に適したパラメータを効率的に見 つけるためには,数値計算理論などの方法によっ て制約条件を積み重ね,パラメータ空間を縮小す ることが望ましい.例えば,乱流モデルの研究な どの流体理論からのパラメータの限定や,計算ス キームのさらなる高精度化・高速化によるスキー ムの淘汰,計算の安定性条件のような数理的考察 が必要になる.これらの方法によって,パラメー タが取りうる範囲が限定され,探索空間を縮小で きる.しかしながら,支配方程式の非線形性に起 因する困難のために,理論的な研究,考察の成果 表1 計算プログラムのパラメータ化 名称 用途 離散化手法 対流項 圧縮 非圧縮 自由表面 2次元 3次元 FDM FEM 2次中心 ABC 0 1 1 0 1 1 1 0 1 XYZ 1 1 1 0 1 1 0 1 0 が近い将来に数値計算に反映される見通しはたっ ていない. 一方,個別の問題に対しては,実験や観測など の計算以外のアプローチや,データベースの利 用,研究者自身の情報の蓄積といった人的資源の 寄与によって,ノウハウを用いてパラメータの絞 り込みが行われている.つまり,実問題に対して プログラムを実行させ結果を検討するというプロ セスを繰り返しながら,その問題に対する最適な パラメータを探すという方法である.多くのもの は個別の問題解決に対する暗黙知として蓄えられ た知識であるが,形式知化の後,一般化できる可 能性がある.また,パラメータと既存の計算結果 を結びつけることで,計算することなしに評価関 数の値を類推できるかもしれない. このように理論的な方法以外に,実問題やモデ ル化された問題に対して,実際にプログラムを実 行させて,その結果をパラメータの選択に反映さ せるという方法がある.これが知識ベースにつな がる.課題は, 1)一連の作業を系統的に行う指針 2)一連の作業の中で知識抽出を行う方法 3)(1)と(2)を効率的に行う仕組み を示すことである. 4.2 パラメータ推薦のためのフレームワーク さて,最適なパラメータを探索するためのフ レームワークとルール抽出のための方法の一例を 紹介しよう.フレームワークを,主として計算量 を制約条件とした本計算の前段階としてのパラ メータの絞り込みに対するものとし,ルール抽出 を未知の数理的制約条件の発見や暗黙知の形式 知化のための方法論として扱う.パラメータと計 算結果を対応づけたデータベースをおくことで, 計算全体の時間短縮を目標とする.

(9)

4.2.1 パラメータの階層的マイニングと遺伝的 アルゴリズムによる最適化 先述したように同一の計算対象に対して適用可 能な計算プログラムは多く存在する.はじめに計 算プログラムをいくつかの項目に従ってコード 化し,第一のパラメータ空間を形成する(表1). 次にあるプログラムが選択された場合の計算パラ メータを第二のパラメータ空間として定義する. さらに計算環境をパラメータに加え,すべての パラメータ空間の中から最適なものを探索する. この際,数学的制約条件を加味するとともに探索 空間の独立性を考慮して階層的な探索を行う. 探索空間は,計算手法などの離散的パラメー タ,時間刻み幅などの連続的なものから構成さ れ,CFL条件などの数理的拘束条件によって探 索から除外される部分を持つ.また,ユーザーが 与える目的関数は簡単なものであっても強い非 線形性をもつために探索空間は非常に複雑なも のであると予想される.このため,一般的な最適 化手法を使うことは得策ではない.そこで,遺伝 的アルゴリズム(GA)を利用した最適化を考え る.時間刻み幅,格子制御パラメータ,あるいは 行列解法における緩和係数などの連続量は量子化 によって離散パラメータ化する.パラメータ空間 をコード化された遺伝子で表現し,目的関数を決 めて最適化問題を解く. 4.2.2 スキーマ解析によるルール抽出 パラメータ空間の複雑性からGAによっても 最適解を求めることは困難である.そこで,GA による探索を一定の世代で止め,その時点で残っ ているものから準最適解を選ぶ.初期個体を変え ることによって,一連の準最適解群を保存する. この群に対して,スキーマ解析を行うことでルー ルを抽出する.抽出されたルールが一般化できる 場合は,探索空間の制約条件として加える.この ような方法によってルールが抽出できることは, 造船の組立工程の中で示されている25 4.2.3 システムの一例 実用問題に対するこのシステムの適用方法を 紹介する.はじめに,問題設定と計算に対する 要求項目(精度重視,計算時間重視など)を決め る.その後,問題を分析し,利用可能な計算プロ グラムを表1に従って決定する.計算プログラ ムが決まれば利用できるスキームなどが限定さ れるので,それらを制約条件として,要求項目 を満たすために必要な参照問題を問い合わせる. この段階で,いくつかのテスト問題,あるいは基 準問題が提示される.例えば,移流項が重要であ ると判断されると,問題設定に応じて改変され た移流方程式に関するテスト問題が提示される. その後,テスト問題や基準問題に対して最適な 計算パラメータを求めるための計算を実行する. この計算は,図5に示すシステムによって行われ る.はじめに利用可能な計算機を動的に確保する (図5 A).次に制約条件のもとで初期個体を発生 する(図5 B).既存の結果があるかどうかを問い 合わせ(図5 C),なければ初期個体に対して計算 を行う(図5 D).初期個体に対する評価値をもと に次世代の選択を行い(図5 E),一定の世代まで 図5 パラメータマイニングのためのシステム例

(10)

AからEを繰り返す.一定の世代となった時点 で計算を打ち切り,スキーマ,準最適解,あるい は振動解を保存する(図5 F,G).引き続き,新 たなる初期個体を発生させ,AからGを繰り返 す.一定量のスキーマが保存された時点でデータ マイニングを利用してスキーマ解析を行い,ルー ルが見つかれば保存する. 現時点では,初段階のテスト,あるいは基準問 題の決定プロセスは概念的な話である.後半部 は,試作システムの確認のために線形の移流方程 式の数値計算を通して,何かしらの未知のルール が抽出できるかどうかを試みている. このような状況でこの例を紹介したのは,少し でも多くの例題を示すことが知識ベースを利用 したCFDを広めることにつながると考えたから である.たとえ,CFL条件のような明確なルー ルが見つからなかったとしても,テスト問題,あ るいは基準問題に固有なルールが見つかれば,パ ラメータの絞り込みに役立つデータベースがで きるはずである.このような形でも知識ベースの CFDが実現できるものと考えている. 5 おわりに 本稿では知識工学の手法について概観し,CFD への応用例と,適用が可能と思われる問題につい て説明した.このような領域に踏み入れるより は,流体現象を探る方がよいという意見が多いの かもしれない.しかしながら,80年代の可視化 の研究において,もしCFD側からのアプローチ が遅れていれば,その発展がどのくらい滞ったか を考えると,CFDの研究者が参入することは必 要であろう. CFDを応用できる問題が拡大するとともに, CFDの専門家以外の利用がさらに増えていくは ずである.こうした状況に対応するための一つの 方法として知識工学の手法の利用が,数値解の信 頼性を向上させるための知識の獲得や,結果の解 釈に至る工程の短縮につながるはずである.こ の際,得られる知見は知識情報として蓄積され, ネットワーク上で個々の研究者のそばに人的資 源とともに分散して存在するようになるだろう. 次に必要なものは,散らばる知識を一元的に管理 し利用するための仕組みである.この仕組みは 様々な分野で提案されはじめている.その動向に 注目したい.ソフトウエアエージェントに任せる 部分が多くなるのだろうが,個々の研究者が有機 的に結びつき,知識を共有し合いながら問題解決 に向かうといった方式がCFDの新展開になれば よいと考えている.

1Shirayama, S. : Effect of grid quality on the accu-racy and convergency of computations, AIAA-97-1891-CP, Proceedings of the AIAA 13th

Compu-tational Fluid Dynamics ConferenceSnowmass,

CO, June, 1997.

2)白山 晋:円柱を過ぎる非定常流れに対する様々 な数値解,22回流体力学講演会講演集(1990 48–51.

3ICEM CFD Engineering : http://www.icemcfd .com/ SMARTFIRE : http://fseg.gre.ac.uk/smart fire/home.html 4FIELDVIEW8 :http://www.ilight.com/ 5)山西健司:データ・テキストマイニング, 計算工 学6(2001386–393. 6)城之内忠正: CFD入出力におけるXML形式の利 , 15回数値流体力学シンポジウム講演要旨 集(2001144.

7Duchaineau, M. & Shikore, D. : ASCI Terascale scientific data analysis and visualization, UCRL-TB-128635 Rev.1.

8Forssell, L. K. : Visualizing flow over curvilinear grid surfaces using line integral convolution,

Pro-ceedings of Visualization ’94IEEE, 1994240–

247.

9)白山 晋,太田高志:ピクセル露光法によるベクト ル場の可視化,日本計算工学会論文集1, 19990018 1999141–147.

(11)

Vector-field by a Homogenized Nascent-particles Tracking, Journal of Visualization 4(2001185– 196.

11Perry, A. E. & Chong, M. S. : A description of eddying motions and flow patterns using critical point concepts, Ann. Rev. Fluid Mech. 19(1987 125–155.

12Shirayama, S. : Flow past a sphere: topological transitions of the vorticity fields, AIAA Journal 30(1992349–358.

13VisDB : A Visual Data Mining and Database Ex-ploration System, http://www.dbs.informati k.uni-muenchen.de/dbs/projekt/visdb/vi sdb.html

14Jeong, J. & Hussain, F. : On the identification of a vortex, J. Fluid Mech. 285(199569–94. 15Robinson, S. K. : Coherent motions in the

turbu-lent boundary layer, Ann. Rev. Fluid Mech. 23 1991601–639.

16Sawada, K. : A convenient visualization method for identifying vortex centers, Transactions of the Japan Society for Aeronautical and Space Sciences 38(1995102–116. 17)三浦英昭,木田重雄:一様等方乱流における低圧 力旋回渦の同定と可視化,ながれマルチメディア 論文集1(1998. 18)白山 晋,大和裕幸: 渦構造の抽出による非定常 流れのデータ圧縮について, 日本造船学会論文集 188(200023–31.

19Fayyad, U., Piatetsky-Shapiro, G. & Smyth, P. : From data mining to knowledge discovery in databases, AI magazine 17(199637–54. 20Pieter Adriaans, Dolf Zntinge,山本英子,梅村

恭司 訳:データマイニング(共立出版, 1998. 21)斉藤 孝 : リレーショナルデータベース教科書 SRC, 1999. 22)豊田英司,石渡正樹,林祥介,赤堀浩司,堀之内武, 口敦,地球流体電脳倶楽部davisプロジェクト: 次元数値データの自己記述的格納形式gtool4の開 ,日本流体力学会年会2000講演論文集(2000 361–362. 23)加藤俊一,栗田多喜夫:画像の内容検索 ─電子美 術館への応用─,情報処理33(1992466–477. 24Goldberg, D., Nichols, D., Oki, B. M. & Terry, D. :

Using collaborative filtering to weave an informa-tion TAPESTRY, Communicainforma-tions of the ACM 35 199261–70. 25)大和裕幸,白山 晋,増田 宏,佐野 毅: 遺伝アル ゴリズム手法による造船組立工程のルール抽出 に関する研究, 日本造船学会論文集 188(2000 559–568. 26)白山 晋:非定常解の有効性について, 4回数 値流体力学シンポジウム講演論文集(1990471– 474.

27Lyman, P. & Varian H. R. : How much informa-tion, http://www.sims.berkeley.edu/resea rch/projects/how-much-info/

参照

関連したドキュメント

モノづくり,特に機械を設計して製作するためには時

単に,南北を指す磁石くらいはあったのではないかと思

経験からモジュール化には、ポンプの選択が鍵を握ると考えて、フレキシブルに組合せ が可能なポンプの構想を図 4.15

夜真っ暗な中、電気をつけて夜遅くまで かけて片付けた。その時思ったのが、全 体的にボランティアの数がこの震災の規

都調査において、稲わら等のバイオ燃焼については、検出された元素数が少なか

(注)

常時 測定 ※1 可能な状態において常に測定 ※1 することを意味しており,点 検時等の測定 ※1 不能な期間を除く。.