• 検索結果がありません。

学位論文内容の要旨

N/A
N/A
Protected

Academic year: 2021

シェア "学位論文内容の要旨"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

    一

博 士 ( 情 報 科 学 )   松 尾 祥 和

学 位 論 文 題 名

局 所 重 複 す る 訓 練 デ ー タ を 用 い る テ ス ト 特 徴 法 の 効 率 的 学 習

(Using Locally Overlapping Training Data for Efficient Learning in Test     Feature Classifier)

学位論文内容の要旨

  従来,官能 検査であるがゆえ に人間の目視検査 に依存していた品質管理も,近年ではセンサや画像 処理,コンピ ュータピジョンを どの技術を組み合 わせた品質検査装置により自動化される例が多い.

例え ば ,k‑NNやSVM,boosting誼ど のパタン分類器によ る分類の精度が向 上していることも この要 因のーつであ る.パタン分類ア ルゴリズムを用い た品質検査分類では,観測画像を検査員が査定して 正解ラベル( 教師信号)を付与 し,訓練データと して登録する必要があり,これにより教師あり学習 が可能と顔る .さらに学習型パ タン分類器は現在 数多く利用されているが,高い学習コストが実用に おける問題の ーっとをっている.この問題を低減するためには,訓練データ数の肖IJ滅,学習計算アル ゴリ ズムの効率化 をどのアプローチ がある.また上記の ようを実産業分野 における品質検査 分類を どにおいては ,教師(専門家) が生産ラインから 日々得られる検査データをラベル付する際。特に画 像計 測する特徴量 においては,しき い値顔どの最適極パ ラメタ設定におい て試行演算回数が 多いた め高いコスト を必要とすること が問題とをる.

  本 論文では、従 来よルノンパラメ トリックをパタン識 別手法として提案 されてきたテスト 特徴法 (Test Feature Classifier以下TFC)においてこれら学習 コストや教師ラベ ル付コストをどの 問題を 解決するため に学習高速化手法 ,能動学習を適応 させた投票に基づくデータ選択手法|そして特徴量 が追加された 場合に効率的に学 習させる手法の提 案を行う.

  第1章で は ,研 究背 景 と目的を示 し,本研究で対象と する分類問題につ いて述べるととも に分類 問題における 課題を示し,本研 究の目的を明確に する.

  第2章で は ,本 研究 の 開発 の基 本 とを る分 類 器で ある テ スト 特徴 法(TFC)とそ の拡 張 手法 であ る逐次テスト 特徴法(successive Test Feature Classifier以下sTF,C)の基本アルゴリズムについて述 べる.

  第3章で は ,第2章で 述べ た テス ト特 徴 法に おける学 習過程でそれぞれ の部分特徴空間上 で存在 する データを独立 したものとしてと らえていたのに対し て,部分特徴空間 ごとの関連性を見 出し,

デー タにおいても 別空間での重複状 況により任意の部分 特徴空間において 重複を判断し,計 算コス トを削減する アルゴリズムを提 案する.簡単顔数 値例を用いてアルゴリズムを示し,さらに理解を深 める ために空間上 でのデータの推移 を追いをがらアルゴ リズムの説明を行 う.高速化アルゴ リズム の学習計算時 間の比較実験によ り,本手法の有効 性を確認する.また英字文字認識用データセット,

貝雄 雌 判別 用デ ー タセ ット を 用い て他 の デー タに よ る効 果の 違 いに つい て 実験 的に 検 証す る.

  第4章 で は ,sTFCの 拡 張 と し て 次 元 追 加 型TFCに つい て 述べ る. 第2章 で 述べ たTFCは, 特 徴 量の 一 部を 追加 変 更し た場 合にTFCを再構成する必要が ある.この問題を 解決するために本 論文で は,特徴量追 加に伴う部分特徴 空間の変化を解析 し,再探索すぺき特 徴空間を示す.次元追加型TFC の比較実験に より本手法の有効 性を確認する,

  第5章で は ,sTFCに お いて教師あ りから教師をし学習 へと切り替える自 律的学習について 検討す     ―686―

(2)

る. パタ ン認識 におけ る学習 型分類 器に おいて 教師データを作成するためのラベル付作業はコスト が高 く問 題視さ れてい る.第4章 でーつ の解決 策と して能 動学習 を取り 入れることを提案.本章で は, もう ーつアプローチとして教師をし学習に注目する.教師をし学習では,分類クラスを識別器に よっ て自 動で作 成する ため機 械的な 分類 クラス が生成される,そこで教師あり学習において識別ク ラス を設 定し,十分を学習を経て教師なし学習へと切り替える.本章では,分類器の成長度合いを表 す指 標と して成熟度を定義し,また切り替えにより自律的学習の可能性を示す自律度を定義する.教 師あ り学 習から 教師を し学習 へ切り 替え るタイ ミングの検討を行うため成熟度を推測するための手 法と してPTF特 徴空間 の学習 による 変化 量を示 し,変 化量と 成熟度 の関 連性について実データを用 いた 実験 にて検 証する .

  第6章 で は ,sTFCに お いて 能 動 学 習 の枠 組 み を 組 み込 み , デ ー タ選択 する手 法に ついて 述べ る.sTFCで は,デ ータ選 択型追 加戦 略とし て正識 別追加 ,誤 識別修 正追加 が提案されているが.教 師ラ ベル 付きの デ―タ 選択手 法とを り, ラベル 付コストの削減を実現でき教い.本研究では,逐次 学習 の追 加戦略 として 能動学 習を取 り入 れるこ とによ り学習 に必 要をデ ータを 選択す る手法 を提 案す る. 一般的 に学習 に必要 をデー タは ,識別 問題の決定境界付近に存在するデータといわれてお り,TFCに おい ては識 別決定 境界を 線型 的に決 定することはでき赤い.そこで,TFCの識別過程にお ける 投票 を用い て識別 決定境 界付近 にあ るデー タを推定する手法を提案する. ROC曲線を識別器に おい て描 くこと により 選択デ ータの 妥当 性を示 す,デ ータ選 択手 法のsTFCの 性能 比較実 験により 本手 法の 有効性 を示す .

  第7章は 本論 文の結 諭を述 べる.

−687―

(3)

学位論文審査の要旨 主査 副査

副査 副査

教授 教授 教授 准教授

金子 小野里 工藤 田中

学 位 論 文 題 名

俊一 雅彦 峰一 孝之

局所重複する訓練データを用いるテスト特徴法の効率的学習

(Using Locally Overlapping Training Data for Efficient Learning in Test        Feature Classifier)

  従来,官能検査 であるがゆえに人 間の目視検査に依存 していた品質管理も,近年ではセンサや画像 処理,コンピュー タピジョン極どの 技術を組み合わせた 品質検査装置により自動化される例が多い.

例え ぱ,k‑NNやSVM,boostingをどのパタン分 類器による分類の 精度が向上してい ることもこの要 因のーつ である.パタン分 類アルゴリズムを用 いた品質検査分類 では,観測画像を 検査員が査定し て正解ラベル(教 師信号)を付与し ,訓練データとして 登録する必要があり,これにより教師あり学 習が可能 とをる.さらに学 習型パタン分類器は 現在数多く利用さ れているが,高い 学習コストが実 用における問題の ーっと橡っている .この問題を低減す るためには,訓練データ数の削減,学習計算 アルゴリ ズムの効率化をど のアプローチがある .また上記のよう を実産業分野にお ける品質検査分 類称どにおいては ,教師(専門家) が生産ラインから日 々得られる検査データをラベル付する際,特 に画像計 測する特微量にお いては.しきい値を どの最適をパラメ タ設定において試 行演算回数が多 いため高いコスト を必要とすること が問題と楹る.

  本論文 では,従来より丿 ンパラメトリックを パタン識別手法と して提案されてき たテスト特徴法 (Test Feature Classifier以下TFC)におぃてこ れら学習コストや 教師ラベル付コス トをどの問題を 解決するために学 習高速化手法,能 動学習を適応させた 投票に基づくデータ選択手法,そして特微量 が追加された場合 に効率的に学習さ せる手法の提案を行 う.

  第1章で は, 研 究背 景と 目的を示し,本研究 で対象とする分類 問題について述べ るとともに分類 問題における課題 を示し,本研究の 目的を明確にする,

  第2章で は, 本 研究 の開 発の基本とをる分類 器であるテスト特 徴法(TF(ニ)とそ の拡張手法であ る逐次テスト特徴 法(successive Test Feature Classifier以下sTFC)の基本アルゴリズムについて述 べる.

  第3章で は, 第2章 で 述べ たテ ス ト特 徴法 に おける学習過程で それぞれの部分特 徴空間上で存在 するデー タを独立したもの としてとらえていた のに対して,部分 特徴空間ごとの関 連性を見出し,

データに おいても別空間で の重複状況により任 意の部分特徴空間 において重複を判 断し,計算コス トを削減 するアルゴリズム を提案する,簡単を 数値例を用いてア ルゴリズムを示し ,さらに理解を 深めるた めに空間上でのデ ータの推移を追いを がらアルゴリズム の説明を行う.高 速化アルゴリズ ムの学習 計算時間の比較実 験により,本手法の 有効性を確認する .また英字文字認 識用データセッ ト,貝雄 雌判別用データセ ットを用いて他のデ ータによる効果の 違いについて実験 的に検証する.

―688―

(4)

  第4章 では ,sTFCの 拡 張 と し て次 元 追 加 型TFCに つ い て述 べ る . 第2章 で 述 べ たTFCは,特 徴 量の一 部を追 加変更 した 場合にTFCを 再構成 する必 要が ある. この問 題を解決するために本論文で は,特 徴量追 加に伴 う部 分特徴空間の変化を解析し,再探索すべき特徴空間を示す.次元追加型TFC の比較 実験に より本 手法 の有効 性を確 認する .

  第5章 では ,sTFCに お い て 能 動学 習 の 枠 組 みを 組 み 込 み ,デ ータ 選択 する手 法につ いて述 べ る.sTFCでは, デー タ選択 型追加 戦略と して正 識別 追加, 誤識sI修 正追加が提案されているが,教 師ラベ ル付き のデー タ選 択手法 とをり ,ラベ ル付コストの削減を実現できをい.本研究では,逐次 学習の 追加戦 略とし て能 動学習 を取り 入れる ことに より 学習に 必要を データ を選 択する 手法を提 案する .一般 的に学 習に 必要な データ は,識 別問題の決定境界付近に存在するデータといわれてお り,TFCにお いては 識別決 定境 界を線 型的に 決定することはできをい.そこで,TFCの識別過程にお ける投 票を用 いて識 別決 定境界 付近に あるデ ータを推定する手法を提案する. ROC曲線を識別器に おいて 描くこ とによ り選 択デー タの妥 当性を 示す. デー タ選択 手法のsTFCの性 能比較 実験により 本手法 の有効 性を示 す.

  第6章は本 論文の 結論を 述べ る.

  これを 要する に、 申請者 はこの 学位請 求論 文にお いて, 分類問 題にお ける 汎用手 法であ るsTFC の独自 の改良版について提案し,その高速計算性能を明らかにしており,その実応用分野への貢献度 は大き ぃと判断できる.また学術的・技術論的価値も少をくをく,よって著者は北海道大学博士(情 報科学 )の学 位を授 与さ れる資 格ある ものと 認める .

−689−

参照

関連したドキュメント

文字を読むことに慣れていない小学校低学年 の学習者にとって,文字情報のみから物語世界

 戦後考古学は反省的に考えることがなく、ある枠組みを重視している。旧石 器・縄紋・弥生・古墳という枠組みが確立するのは

マーカーによる遺伝子型の矛盾については、プライマーによる特定遺伝子型の選択によって説明す

実際, クラス C の多様体については, ここでは 詳細には述べないが, 代数 reduction をはじめ類似のいくつかの方法を 組み合わせてその構造を組織的に研究することができる

(1) テンプレート編集画面で、 Radius サーバ及び group server に関する設定をコマンドで追加して「保存」を選択..

Using the special C- mount ring adapter, the lens can be directly attached to a CCD camera, enabling it to be used as a low cost image ob- servation lens and variable focus lens

太宰治は誰でも楽しめることを保証すると同時に、自分の文学の追求を放棄していませ