• 検索結果がありません。

博 士 ( 情 報 科 学 ) 坂 田 幸 辰

N/A
N/A
Protected

Academic year: 2021

シェア "博 士 ( 情 報 科 学 ) 坂 田 幸 辰"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 情 報 科 学 ) 坂 田 幸 辰

学 位 論 文 題 名

テスト特徴法のための逐次パタン学習に関する研究 学位論文内容の要旨

  

パタン分 類の技術はパタン解析の分 野で最も重要顔もののひとっであり,日々,より高速で,より 頑強教分類 法の開発が研究されている .パタン分類の実応用問題のひとっとして、半導体検査・評価 システムが ある.半導体製造ラインに おいては,製造ウェハに発生する微細欠陥の種別特定及び原因 対策を迅速 に行う必要がある.欠陥自 動分類では,目々の製造プロセスで検出された欠陥を,分類器 の性能を向 上させるための新しいデー タとして利用することができる,このように,常に新しい訓練 デ ータ が与 えられそれらを有効に 利用することによりできるだ け高性能教分類器を実現し たいよう を 実応 用分 野,あるいは多くの訓 練データの一括処理コストが 大きく段階的に学習をすす め十分を 性 能 を 確 保 し た い 場 合 誼 ど に お い て は , 逐 次 学 習 の ア ル ゴ リ ズ ム は 必 須 の も の で あ る .

  

我々 は以 前より,訓練データの 特性から一意に決定される分 類に有効教特徴量の組み合 わせであ るプライムテスト特徴(以下,

PTF)

を用いる分類器として,テスト特徴分類器(Test FeatIユre Classifier 或 いは

TFC)

を 提案 して きた

.TFC

は ,既 知デ ータ の誤 分 類が無 いてとが保障されている, 比較的少 額いデータ 数で分類器を構成すること が可能である,をどの特長を持ち,数々の応用問題に適用され その有効性 が確認されている,しかし,分類器の構成にかかる処理に,やや計算コストを要している.

また,デー タの一部のみが変更された 場合でも分類器を元から再構成し教ければ誼らをい,という問 題がある,

  

本論 文で は ,ノ ンパ ラメ トリ ッ クをパタン分類法として考 案されたTFCの逐次学習に関 する特性 について検 討する.逐次的に与えられ る未知パタン群を識別した後。その結果を訓練パタンとして分 類 器に 追加 し て次 のよ り高 い性 能 の分 類器 を構 成し よ うとす る場合を考える

.TFC

構成に かかる処 理 はデ ータ か らの

PTF

抽 出 がそ れに 相当する.まず,データが 逐次的に与えられる場合に 毎回最初 か ら計 算し を おす ので は教 く, 既 に判定されている

PTF

を効果 的に利用して計算コストを 抑えるこ とができる アルゴリズムを提案する. 次に,実問題の逐次パタン学習における,増加する訓練データ の 効率 的保 存問題,追加すべき訓 練データ候補が多数得られる 場合の選択問題(どの訓練 データを ついかすれ ばよいか)次どを実データ を用いた実験によって検証す る.また,

PTF

の特性に基づぃた 重 み係 数に よ る重 み付 き投 票処 理 を提案する,これにより, 各PTFの機能がより効果的に 発揮され 分 類器 の性 能 向上 が期 待で きる , さら に提 案し た重 み 付き

TFC

を逐 次学 習ア ルゴ リズム ヘ拡張す る.実データによる実験結果により本手法の有効性を確認する.

  

第1章で は, 研究 の背 景 と位 置づ けを述べる,ここでは本研 究で対象とする分類問題に ついて述 べ る と 共 に , そ こ に お け る 逐 次 パ タ ン 学 習 の 課 題 を 示 し , 本 研 究 の 目 的 を 明 確 に す る .

  

第2章で は, 組み 合わ せ 特徴 量を 定義 し ,未 知パ タン の識 別法であるTFCについて述べ る,この 章 では ,同 手 法の 定式 化を 示し , 簡単を数値例を用いて

TFC

の 学習過程,識別過程の説明 をおこ歡

    

―1138―

(2)

う.また,TFCの特徴をまとめ,TFCと同様に登録された訓練パタンと未知パタンの距離計算によっ て識別をおこをう分類法であるk近傍法との比較について述べる.

  第3章では,逐次学習型TFCについて述べる.2章で述べたTFCは,データの追加や削除によっ て訓練データの一部が変更された場合には分類器を元から再構成しをければ教らをい.この問題を 解決するために本論文ではTFCに基づく逐次学習アルゴリズムを提案する,逐次学習型TFCのア ルゴリズムを示し,処理の流れの理解を助けるために数値例を挙げて説明をおこをう.逐次学習の計 算時間比較実験により,本手法の有効性を確認する.また,多くのパタン分類器の性能評価にもちい られてきた英文字認識セットをもちいて逐次学習型TFCの性能について,追加戦略による違い,他 の分類法との比較をどを通して検討する.また,実画像分類への応用として,半導体ウェハ上の欠陥 画像からの特徴量に基づいて,逐次学習の効果を実験的に検証する,さらに,所望される分類性能を 実現するための必要教訓練データ数について,シミュレーションデータによる実験をおこ教い検討 する.

  第4章では,重み付き投票処理の導入による重み付きテスト特徴法についての定式化を示す.従来 のTFCでは,投票の際に全てのテスト特徴から均一のスコアを投票していた,しかし,実際にはテス ト特徴上でのデータの分布はそれぞれ違っており,それによって各テスト特徴の識別性能も違って くる.本研究で独代表的款アンサンブル学習法のーつであるBoostingのアイディアを基にTFCに 基づく重み付き投票処理を提案する.ただし,TFCにおいて要素分類器であるテスト特徴はそれぞれ について訓練パタンの誤分類が無いことが保障されているため,Boostingのように誤分類尺度に基 づく重み付き投票処理を適用するてとができ縁い,そこで訓練パタンの分布から各テスト特徴の期 待される識別性能を推定し,それを基に重み付き投票処理をおこ教う.TFCに重み付き投票処理を導 入することによってテスト特徴の機能をより効果的に発揮するてとができる.重み付きTFCの有効 性の確認と重み係数に関する考察を実データを用いた実験によっておてをう.さらに.我々がこれま でに提案してきた逐次学習型TFCを基に,重み付きTFCを逐次学習処理が可能をアルゴリズムヘ 拡張する,実システムを設計する上で,提案したアルゴリズムが有効であることを実験により示す,

  第.5章では,TFCのクロスバリデーションによる性能評価の高効率化について述べる.データの 分割数をnとしてクロスバリデーションによる評価をおてをうとすると,n種類の訓練データから TFCを構成する必要がある.この操作を逐次学習型TFCをもちいて高効率に計算する手順を示す.

また,シミュレーションデータを用いた実験により,分割数と効率化率の関係について検討する.

  第6章は本論文の結諭である.

1139

(3)

学位論 文審査の要旨 主査

副査 副査 副査

教授 教授 教授 准教授

金子 山下 五十嵐 田中

学 位 論 文 題 名

俊一

    裕

孝之

テスト特徴法のための逐次パタン学習に関する研究

  パタン分類技術はパタン解析分野で最も重要なもののーっであり,日々,より高速で頑強な分類法 が研究されている.パタン分類の実応用問題のーっとして半導体検査・評価システムがある.半導体 製造ラインでは製造ウェハに発生する微細欠陥の種別特定及び原因対策を迅速に行う必要がある.

欠陥自動分類では,日々の製造プロセスで検出された欠陥を,分類器の性能を向上させるための新し いデータとして利用できる.このように,常に新しい訓練データが与えられそれらを有効に利用する ことによって高性能な分類器を実現したい実応用分野,あるいは多くの訓練データの一括処理コス トが大きく段階的に学習をすすめ十分な性能を確保したい場合には,逐次学習のアルゴリズムは必 須である.

  本研究では,分類に有効な特徴量の組み合わせであるプライムテスト特徴(PTF)を用いるノンパ ラメトリックな分類法として提案されているテスト特徴分類器(TF(ニ)の逐次学習に関する特性に ついて検討している.実問題の逐次パタン学習における,増加する訓練データの効率的保存問題,追 加すべき訓練データ候補が多数得られる場合の選択問題などを実データによって実験的に検証して いる.また,TFCに重み付き投票処理を導入することによって性能を向上させている.さらに提案し た重み付きTFCを逐次学習アルゴリズムヘ拡張している.実データによる実験結果により本手法の 有効性を確認している.

第1章では,本研究で対象とする分類問題について述べると共に,そこにおける逐次パタン学習の 課題を示し,本研究の目的を明確にしている.

  第2章では,組み合わせ特徴量を定義し,TFCについて述べている.この章では,同手法の定式化 を示し,簡単な数値例を用いてTFCの学習過程,識別過程の説明を行っている.また,TFCの特徴を まとめ,k近傍法との比較についても述べている.

  第3章では,逐次学習型TFCについて述べている.逐次学習型 rFCのアルゴリズムを示し,逐次 学習の計算時間比較実験により提案手法の有効性を確認している.また,逐次学習型TFCの性能に っいて,追加戦略による違い,他の分類法との比較などを通して検討している.また,実画像分類へ の応用として,半導体ウェハ上の欠陥画像からの特徴量に基づぃて,逐次学習の効果を実験的に検証 している.さらに,所望される分類性能を実現するための必要な訓練データ数について,シミュレー

‑ 1140

(4)

ションデータによる実験をおこなぃ検討している.

  第4章では,重み付き投票処理の導入による重み付きテスト特徴法についての定式化を示してい る.訓練パタンの分布からPTFの期待性能を推定し,それを基に重み付き投票処理をおこなう.重み 付きTFCの有効性の確認と重み係数に関する考察を実データを用いた実験によって行っている.さ らに,逐次学習型 rFCを基に,重み付きTFCを逐次学習処理が可能なアルゴリズムヘ拡張してい る.実システムを設計する上で,提案したアルゴリズムが有効であることを実験により示している.

  第5章では,TFCの交差検証法による性能評価の高効率化について述べている.分割数nの交差 検証法による評価をおこなう場合,n種類の訓練データからTFCを構成する必要がある.この操作を 逐次学習型TFCを用いて高効率に計算する手順を示している,また,シミュレーションデータによ る実験で,分割数と効率化率の関係について検討している.

  第6章は結論である.

  第3章では,まず,独自のパタン分類法であるTFCに基づく逐次学習アルゴリズムについて述べ ており,その有効性を実験により示している点を評価した.次に,TFCの逐次学習に関する特性を実 験的に明らかにしており,実応用における逐次TFCの可能性を示している,また,逐次TFCを半導 体欠陥画像分類ヘ適用し,実問題として十分な結果を得ていると考える.これらのことから,提案手 法が実応用可能な技術であることが確認できる.

  第4章では,各PTF上でのデータの分布から各PTFの期待性能を推定し.それらを利用したPTF による重み付き投票処理をおこなうことによってTFCの性能を向上させることができることを実 験的に示している.また,重み係数を効率的に計算する手順を示している.さらに提案手法の逐次学 習への拡張を行っており,実験によりその有効性を検証している.ここで提案されている重み付き投 票処理は,特に分類器が未成熟な学習初期の段階で特に有効であり,実システムを設計する上で有意 な結果であることを確認した,

  以上を要するに,著者は実産業を対象としたパタン認識分野において新しい技術を提案して韜り.

検証実験により有用性を確認するものであり,情報科学に対して貢献するところ大なるものがある.

よっ て著者は ,北海道 大学博 士(情報 科学) の学位を 授与される資格あるものと認める.

1141

参照

関連したドキュメント

ツールとして,言語処理系の生成系MYLANGを開発   標準MYLANGの動作の概要を図一2

   第

が、他菌株の酵素とドメインを組換えた手法はとられていない。キメラ酵素の諸性質に

その維持 機構とし ての生物 間の相互 作用の重 要性が注目 されている。申請論文 は、河川生態系の主要な構成要素である、魚類と藻類食水生昆虫の捕食.被食関 係 の 実 態 を 様 々 な 手

   第7 章ではゼオライトナノクリスタル積層触媒膜による逐次反応制御を行った。第2 章で合成 したMFI

   次に,提案手法の有効性,計算精度を確認するため基礎形状を用いた検証を実施した.低レイノル ズ数の流れにおける精度検証として,円管内の流れ(Re=10)

第5

本論文はこれらの実験結果を解析し、それに基づぃて変態機構を考察した結果をま と め た も の で あり 、第 1 章 から 第6 章で 構成 される 。以 下に 各章を 要約 する 。