機械学習を用いた自動車用タイヤ内面部の欠陥識別

全文

(1)機械学習を用いた自動車用タイヤ内面部の欠陥識別著者発行年出版者 URL. 多田拡太郎 2018‑12 静岡大学 http://doi.org/10.14945/00026681.

(2) 静岡大学博士論文. 機械学習を用いた自動車用タイヤ内面部の欠陥識別. 2018 年 12 月大学院自然科学系教育部情報科学専攻. 多田拡太郎.

(3) 目次. 第１章序論. 4. 1.1 本研究の背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 1.2 本研究の目的. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 1.3 本論文の構成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 第２章原理. 8. . . . . . . . . . . . . . . . . . . . . . . . . .. 2.1. タイヤの製造工程. 2.2. 製品タイヤを対象とした検査の種類と設備による自動化の状況. . . . . . . .. 10. 2.3. タイヤ外観検査の現状（人の触感，目視による全数検査）. . . . . . . . . . .. 11. 2.4. タイヤ外観検査の自動化に関する研究. . . . . . . . . . . . . . . . . . .. 13. 2.4.1. タイヤ内面部を対象とした研究 . . . . . . . . . . . . . . . . . .. 13. 2.4.2. タイヤ外面部を対象とした研究 . . . . . . . . . . . . . . . . . .. 13. . . . . . . . . . .. 15. 2.5. タイヤ内面部の外観検査を自動化するためのアプローチ. 2.6. 三次元計測手法 2.6.1. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 17. . . . . . . . . . . . . . . . . . . . . . . . . . . 17. 光切断法. 2.7 機械学習による欠陥識別. . . . . . . . . . . . . . . . . . . . . . . . 19. 2.7.1. 畳み込みニューラルネットワーク（Convolutional Neural Network） . . 19. 2.7.2. サポートベクターマシン（Support Vector Machine）. 2.7.3. アンサンブル技術（Emsemble Technique）. 2.8 実験システムの構成. . . . . . . . . 24. . . . . . . . . . . . . . 30. . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 . . . . . . . . . . . . . . . . . . . . . . . . . . 35. 2.8.1. 撮像機構. 2.8.2. タイヤ内面部の表面凹凸画像作成 . . . . . . . . . . . . . . . . . . 36. 2.8.3. 識別対象の定義. . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 1.

(4) 2.8.4. 識別精度の評価指標. . . . . . . . . . . . . . . . . . . . . . . . . 40. 第３章多段階識別器を用いた欠陥識別. 4 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41. 3.1. はじめに. 3.2. CNN を 2 段階に組み合わせた識別器 . . . . . . . . . . . . . . . . . . . . . 42. 3.3. 3.4. 3.5. 3.6. 3.7. 3.2.1. 実験で用いた識別器 . . . . . . . . . . . . . . . . . . . . . . .. 45. 3.2.2. 実験で用いた識別対象 . . . . . . . . . . . . . . . . . . . . . .. 46. 3.2.3. テスト画像とトレーニング画像の作成条件. . . . . . . . . . . . . .. 47. 実験で用いるデータセットの選定 . . . . . . . . . . . . . . . . . . . . . . 49 3.3.1. 各識別器の作成 . . . . . . . . . . . . . . . . . . . . . . . . .. 49. 3.3.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49. 画像の切り出し条件の妥当性検証 . . . . . . . . . . . . . . . . . . .. 52. 3.4.1. 識別器の作成. . . . . . . . . . . . . . . . . . . . . . . . . .. 53. 3.4.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 53. 多段階型による識別精度 . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.5.1. 各識別器の作成 . . . . . . . . . . . . . . . . . . . . . . . . .. 55. 3.5.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 55. トレーニング画像数のバランスによる識別精度 . . . . . . . . . . . . . . . . 58 3.6.1. 各識別器の作成 . . . . . . . . . . . . . . . . . . . . . . . . .. 58. 3.6.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 59. トレーニングパラメータ複数条件による識別精度 . . . . . . . . . . . . . . . 61 3.7.1. 各識別器の作成 . . . . . . . . . . . . . . . . . . . . . . . . .. 61. 3.7.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 63. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66. 3.8. 考察. 3.9. まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68. 第４章機能別識別器を用いた欠陥識別. 6 9. 4.1. はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69. 4.2. CNN と SVM を機能別に組み合わせた識別器 . . . . . . . . . . . . . . . . . . 70. 2.

(5) 4.3. 4.4. 4.5. 4.2.1. 実験で用いた識別器 . . . . . . . . . . . . . . . . . . . . . . .. 70. 4.2.2. 実験で用いた識別対象 . . . . . . . . . . . . . . . . . . . . . .. 72. 4.2.3. テスト画像とトレーニング画像の作成条件 . . . . . . . . . . . . .. 72. 多段階型による識別精度. . . . . . . . . . . . . . . . . . . . . . . . . . 74. 4.3.1. 各識別器の作成. . . . . . . . . . . . . . . . . . . . . . . . . .. 74. 4.3.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 75. 1 段目識別器における各手法の識別精度 . . . . . . . . . . . . . . . . . . 76 4.4.1. 各識別器の作成. . . . . . . . . . . . . . . . . . . . . . . . . .. 76. 4.4.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 77. 2 段目識別器における各手法の識別精度 . . . . .. . . . . . . . . . . . . . 78 4.5.1. 各識別器の作成. . . . . . . . . . . . . . . . . . . . . . . . . .. 78. 4.5.2. 実験結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 79. 4.6. 考察 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82. 4.7. まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83. 第５章総括. 8 4. 5.1. 結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84. 5.2. 今後の課題と展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86. 謝辞. 8 7. 参考文献. 8 8. 3.

(6) 第１章序論. 1.1. 本研究の背景. 近年，産業のグローバル化，技術の高度化，社会の成熟に伴い，品質に対する顧客の要求レベルが高まっている[1]．製造業において，製品の品質は，市場シェアや顧客の信頼性に深く関係しており，顧客へ出荷する製品の品質を保証するための検査は重要な機能となっている．製品に対する検査は，機能検査と官能検査に大別される[2]．機能検査は，半導体などを対象とした機能不良を検査するものであり，欠陥の発見よりも欠陥の種類を分類し，より深い情報を得ることを目的としている[3]～[6]．一方，官能検査は，製品の外観を対象とした傷や汚れ，表面の凹凸，塗装のムラなどの状態を検査するものであり，欠陥の検知を目的としている．しかし，官能検査は人が行う検査であるため，集中力の低下による欠陥の見逃しや，長時間の連続作業をする作業者が疲労のために生産効率を低下させる可能性があり，それらが経済的損失につながる恐れがある．製造業における官能検査に対する自動化のニーズは高く，いくつかの検討や報告がされている．しかし，検査対象の形状が複雑なものや，欠陥の状態を定量化することが困難である[7]といった理由や，自動化を検討したとしても，製品や欠陥の種類ごとに開発が必要な場合が多く，費用対効果が低く採算がとれない，といった課題が挙げられている[8]．これらの課題は，製造業全体に関わるものであり，様々な検査対象に対応可能な検査技術を構築することが急務となっている．. 4.

(7) 1.2. 本研究の目的. 自動車用タイヤ（以降，タイヤと呼ぶ）の外観は，タイヤの外側（以降，外面と呼ぶ）と内側（以降，内面と呼ぶ）を対象に，検査員の手の触感と目視による官能検査を行っている．特に，タイヤの内面は，検査員が目視で観察することが難しいため，手の触感で検査を行うことが多い．しかし，タイヤ内面の全ての範囲を触ったことを保証することは困難である．また，人による検査では，検査検査精度が個人差に影響されるため，欠陥品の流出，判定のばらつきなどのリスクが存在する．そこで，本研究では上記の問題意識のもとで，検出すべき欠陥に合わせて，タイヤ内面部の全範囲を対象とした三次元計測手法と，精度の高い検査を実現するための機械学習による欠陥識別手法を提案する．本研究における目標値は次のように設定した．過検出領域数（良品タイヤを欠陥と誤検知する領域の数）が，良品タイヤ 1 本につき 1 箇所であれば検査員の負担にならないと考え，過検出領域 1 箇所をタイヤ内面の表面積に対する比率に換算した過検出面積率 0.075%以下を目標値と設定した．また，欠陥検出率は検査の自動化という観点から 100%を目標値と設定した．これらの最終目標を達成するために，第 3 章では，多段階識別器による欠陥検出率の向上と過検出低減に対する効果を確認する．そして，第 4 章では，機能別識別器による欠陥検出精度の向上効果を確認する．. 5.

(8) 1.3. 本論文の構成. これらの背景，目的のもと，本論文では，タイヤ内面部の欠陥識別について述べる．本論文は全 5 章で構成されている．本章“序論”では，本研究の背景と必要性，及び目的について述べた．第 2 章“原理”では，まずタイヤ外観検査の現状について述べる．そしてタイヤ外観検査の自動化に関する関連研究を紹介し，タイヤ内面部の外観検査を自動化するために必要な撮像手法，欠陥識別手法を整理する．また，第 3 章，第 4 章の実験を行うためのシステムの構成を示す．第 3 章“多段階識別器を用いた欠陥識別”では，畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）の手法を用いたトレーニング画像数の割合をバランスさせた多段階型の識別器により，欠陥検出率の向上と過検出低減を両立することが可能であることを実験により示す．第 4 章“機能別識別器を用いた欠陥識別”では，1 段目の識別器に CNN，2 段目の識別器にサポートベクターマシン（Support Vector Machine, SVM）の手法を用いた多段階型の識別器により，欠陥検出精度の更なる向上が可能であることを実験により示す．第 5 章“総括”では，本研究の結論と今後の課題について述べる．. 6.

(9) Chapter 1. Introduction. Chapter 2. Outline of tire appearance inspection Related work Image creation method Defect classification method. Chapter 3. Multistep classifier Evaluation. Chapter 4. Functional classifier Evaluation. Chapter 5. Conclusion. 図1.1: 提案手法の構成. 7.

(10) 第２章原理. 2.1. タイヤの製造工程. タイヤの製造工程は，種々の原材料を練り合わせる「混合工程」，カーカス，ベルト，ビード，トレッドといったタイヤの部材を作る「材料工程」，各種の部材を貼り合わせて未加硫タイヤを作る「成形工程」，成形された未加硫タイヤを加熱・加圧することでゴムを加硫反応させる「加硫工程」，そして加硫を終えた製品タイヤの性能や品質を保証する「検査工程」という五つの工程で構成されている[9]．「混合工程」では，天然ゴム，合成ゴム，カーボンブラック，硫黄，亜鉛華といった各種の原材料，配合剤を混合機（ミキサー）に投入して練り合わせる．混合機で練られたゴムはシーティングロールに通すことでシート状に加工して「材料工程」へ供給する．「材料工程」では，タイヤの骨格となるカーカス，タイヤを補強するベルト，タイヤとホイールの接合部となるビード，タイヤが路面に接するトレッドといったタイヤを構成する各種部材を準備する．カーカス，ベルト，ビードは繊維コードやスチールコードに薄いゴム層をコーティングした材料で構成されており，トレッドはゴム層のみで構成されている．「成形工程」では，準備されたカーカス，ベルト，ビード，トレッドなどの各部材を成形機で貼り合わせて未加硫タイヤを作る．「加硫工程」では，未加硫タイヤを金型（トレッドパターンやサイドの模様，刻印文字，商標などが型つけされたモールド）に入れ，タイヤ加硫用ブラダーで内側から金型に向け，高温・高圧の蒸気で押しつける．この時，熱と圧力によってタイヤ全体に加硫反応が進行して，未加硫タイヤが弾力性と耐久性をもつ安定した加硫ゴム構造体に変化する．製品タイヤの形状やトレッドパターンも金型によって作られる．「検査工程」では，加硫を終えた製品タイヤに対して，外観などの検査員による官能検査を受ける．これに合格した製品タイヤは，バランス測定，ユニフォミティ測定，X 線検査などの非破壊検査による品質，性能確認を経て，顧客に出荷される．. 8.

(11) Mixing Mixing. Material Material. Buildig Buildig. Curing Curing. Inspection Inspection. 図2.1: タイヤ製造工程全体の流れ. 9. Customers Customers.

(12) 2.2. 製品タイヤを対象とした検査の種類と設備による自動化の状況. 「検査工程」では，表 2.1 に示す検査が一般的に行われている．均一性検査は，タイヤの剛性や重量のアンバランスの検査を行っており，計測と判定は設備により自動化されている．非破壊検査は，タイヤ内部を対象とした金属部材の構造やゴム部材の状態（気泡の有無や部材間のセパレーション）の検査[10],[11]を行っており，計測は設備により自動化されており，一部の判定も自動化が進んでいる．外観検査は，タイヤ表面を対象とした傷や凹凸等の検査を行っており，検査範囲や欠陥種類を限定しない限り，計測と判定のどちらも設備による自動化が困難であり，触感や目視といった人の五感に頼った官能検査が行われることが多い．. 表 2.1: 検査の種類と設備による自動化状況検査項目. 検査装置. 検査内容. 計測. 判定. 均一性検査. ユニフォミティ. タイヤの剛性，重量のア自動ンバランス等. 自動. X線. タイヤ内部構造の状態等. 自動. 人または自動. シェアログラフィ. タイヤ内部の気泡や剥離自動等. 人または自動. －. タイヤ表面の傷，凹凸等. 人. 非破壊検査 [10],[11] 外観検査. 触感，目視. ※タイヤメーカー各社で検査項目，検査内容は異なるため一般的な状況を示す. 10.

(13) 2.3. タイヤ外観検査の現状（人の触感，目視による全数検査）. タイヤの外観検査では，図 2.2 に示すように，タイヤの外面と内面を検査員が手で触れたときの手の触感と検査員の目視により全数検査を実施している．検査対象となる欠陥は，発生部位や現象，要因によって約 100 項目が検査規格に定められている．タイヤの外面は目視で全ての範囲を観察できるが，タイヤの内面は図 2.3 に示すように，目視で直接観察することが困難な範囲が存在する．そのため，その範囲は手の感触に頼った触感検査を行っている．検査対象となる欠陥は加硫工程で発生するものが多い．加硫工程とは，未加硫ゴムと複合材で構成された未加硫タイヤを，温度と圧力を加える加硫機に挿入して製品タイヤの形状を与える工程である．加硫機の中では，未加硫タイヤの内側からタイヤ加硫用ブラダー（以降，ブラダーと呼ぶ）を膨らませて外側の金型に押し当て，タイヤの形状が形成される．この加硫工程で発生頻度の高い欠陥は，図 2.4 に示すように，・未加硫タイヤの中に入り込んだ空気が，加硫時にタイヤの外側へ排出できず，タイヤ内部に残留することでゴム表面が膨らむもの・金型と未加硫タイヤが，適切に密着しないことで，タイヤ表面に凹凸が発生するもの・未加硫タイヤに異物が付着した状態で型付けすることで，異物が固着するものがある．加硫工程で用いるブラダーは，表面に多種多様な凹凸形状の模様が存在する．図 2.5 に示すように，その模様はタイヤ内面に転写される．ゴムで作られたブラダーが拡張するときの伸長量は繰. Outer surface Inner surface. Blind spot range is inspected only by the tactile feel of the inspector’s hand.. 図 2.2: タイヤ外観検査の様子. 図 2.3: タイヤ内面検査の特徴. 11.

(14) り返し一定量にはならず，タイヤ内面へ転写される模様（以降，背景模様と呼ぶ）は同種類のタイヤにおいても変動する．検査員は，背景模様上の欠陥候補を触感と目視で検知し，検査規格と照合することで欠陥か否かを判断する．しかし，人が行う検査では，検査精度が各検査員の経験値やスキルに影響されるため，見逃し，誤認が起こることや，検査処理能力が変動するリスクが存在するため，検査の自動化が期待されている．. Green tire. Residual air. Bulge of tire surface. Bladder. Mold. Defective adhesion between mold and bladder. Foreign material. Uneven shape of tire surface Adhesion of foreign material. 図 2.4: 代表的な欠陥発生メカニズム. Surface pattern is transferred.. Background pattern of tire inner surface. Bladder. 図 2.5: タイヤ内面へ転写される模様. 12.

(15) 2.4. タイヤ外観検査の自動化に関する研究. 本節では，タイヤ外観検査の自動化に関する関連研究について述べる．タイヤ外観検査は人の触感や視覚による官能検査の一つであり，検査員によって検査精度や検査効率に差が生じやすい．これらの問題を解決するために，計測や判定の自動化ニーズに対して，いくつかの研究が報告されている．表 2.2 に関連研究をまとめる．. 2.4.1. タイヤ内面部を対象とした研究. 輿水ら[12]は，撮像手法に LED 照明とエリアカメラを適用し，照明環境と画像処理システムをそれぞれ工夫することによって，タイヤ内面部の模様を周期的パターンと定義して除外することで，欠陥を検出する手法を報告している．しかし，タイヤ内面の模様は，斜め縞だけではなく格子状のパターンも存在する．また，タイヤ内面部は平坦ではなく，曲面をもっているため，撮像画像上の模様は等間隔のパターンにはなりにくい．そのため，より多くのタイヤ種類に対応するための拡張性に課題が残る．. 2.4.2. タイヤ外面部を対象とした研究. 高橋らは，トラック・バス用タイヤのサイドウォール（タイヤ接地面に垂直な側面）を対象に，光切断法[13]によるタイヤ三次元形状計測装置[14]を開発している．乗用車用タイヤ向けでは，タイヤ 1 回転あたり毎秒 1,000～2,000 画像の撮像を行うが，トラック・バス用タイヤでは，2 倍以上の高速撮像が必要となり，毎秒 4,096 画像の高速撮像を可能としている．また，この計測装置を用いた，サイドウォール表面上に発生する比較的大きい凹凸形状を有する欠陥を検知する技術[15]を開発している．タイヤ金型情報を用いることで，サイドウォールに存在するデザイン（文字，数字，ロゴ等）の凹凸形状と欠陥の凹凸形状を，画像処理による形状認識技術を用いて分離する．この画像処理をベースとして，タイヤの製造上の形状ばらつきに対応させるために，人間による目視確認と画像処理の修正を行っている．舟橋ら[16]は，タイヤ外面のトレッド（タイヤ接地面）表面上に発生する厚さ 0.4mm，面積 100mm2 程度を有する凸型楕円形状の薄広面状欠陥の有無判定を報告している．タイヤ溝部（トレッドパターン）を画像処理によって除去することで検査範囲を限定し，欠陥有無を定量的に判定している．. 13.

(16) 表 2.2: タイヤ外観検査の自動化に関する研究報告例. 輿水[12]. 高橋[14]. 高橋[15]. 舟橋[16]. 目的. 欠陥有無の判定. 撮像の高速化. 欠陥有無の判定. 欠陥有無の判定. 対象. 乗用車用タイヤ. トラック・バス用乗用車用タイヤタイヤ. 乗用車用タイヤ. 部位. 内面. 外面サイドウォー外面サイドウォー外面トレッドルル. 撮像手法. LED 照明とエリア光切断法（形状測光切断法（形状測光切断法（形状測カメラ（反射光測定）定）定）定）. 識別手法. 画像処理. －. 画像処理. 画像処理. 対象欠陥. 詳細不明. －. 凹凸形状. 凸型楕円形状の薄広面状欠陥. 高橋ら[15]，舟橋ら[16]の研究は，画像処理によるルールベースのアルゴリズムであるため，タイヤのデザインや欠陥に応じて一品一様に対応させた欠陥識別アルゴリズムとなりやすい．そのため，タイヤ種類や欠陥の数が増えるほどアルゴリズムの設計の難易度が上がりやすく，より多くのタイヤ種類や欠陥種類に対応するための拡張性に課題が残る．. 14.

(17) 2.5. タイヤ内面部の外観検査を自動化するためのアプローチ. 本論文では，タイヤ内面部の外観検査を自動化するために，タイヤ内面部の全範囲を撮像してタイヤ内面部の表面形状を画像データとして取得する手法と，タイヤ内面部の背景模様に影響しない欠陥識別の手法を提案する．提案手法の実用化は，検査員による従来検査との併用が考えられる．提案手法により，欠陥を高い精度で検出できれば，タイヤ内面部の良品部を欠陥として誤検出する領域があったとしても，タイヤ内面部の表面形状の画像を，コンピュータが欠陥として検出した領域と重ねてディスプレイ上に表示することで，検査員は表示された領域に集中して目視確認すればよく，検査員の目視確認範囲を減らすことができる．ゆえに，検査員の経験の差による検査結果の違いを少なくする効果，検査精度のさらなる向上，検査工数の低減が期待できる．次に，撮像手法と識別手法についての考え方を述べる．タイヤの外観上に発生する欠陥の代表例として，残留空気によってタイヤ表面が膨らむものがある．この欠陥は緩やかな丸みを帯びた形状を有することが多く，撮像手法として一定の角度で光を照射する照明と，その反射光量を計測する手法を適用した場合，欠陥を検知するために必要となる反射光量の変化が得られないことがある[17]．そのため，形状変化を有する欠陥には三次元形状特徴量を用いることで，欠陥識別に必要な特徴を含んだデータの取得が期待できる．また，タイヤは良品においてもタイヤ内面表面上に背景模様が存在し，ゴム特有の微小な形状変化を有するため，画像処理ベースでは背景模様や欠陥に応じて一品一様に対応させた欠陥識別アルゴリズムを作りやすく，汎用性が低くなる可能性がある．そのため，背景模様や欠陥データを多数収集して学習させることで識別ルールを求める機械学習がタイヤといったゴム製品の外観検査に適していると考える．以上のように，本論文では，三次元計測手法により形状特徴量を取得し，機械学習によりタイヤ内面部の背景模様に影響しない欠陥識別の手法確立を目指す．. 15.

(18) 表 2.3: 本論文のアプローチ目的. 欠陥有無の判定. 対象. 乗用車用タイヤ. 部位. 内面. 撮像手法. 光切断法（形状測定）. 識別手法. 機械学習. 対象欠陥. 様々な種類の欠陥. アプローチ. ・欠陥を識別するための有効な特徴を確実に獲得・多様な形状変化をもった背景模様や欠陥データから識別ルールを求める機械学習を適用. 16.

(19) 2.6. 三次元計測手法. 三次元計測手法は，受動法と能動法の二つに分けられる．受動法は対象物にエネルギーを射出せずに計測する方法である．その計測方法の代表例としてステレオ視法が挙げられる．この手法は，対象物を複数の視点からカメラで撮像し，各カメラの視線方向を定め，三角測量の原理に基づいて計測点の三次元座標を求める方法である．しかし，対象物の表面に模様がないものに対しては，対応点を決めることができないため，三次元計測を行うことが困難である．そのため，ステレオ視法を含めた受動的な計測法では，対象物の表面に模様やエッジといった特徴点を有するものに対しての計測は得意であるが，対象物の表面が緩やかな丸みを帯びたものに対する計測は苦手である[18],[19]．一方，能動法は対象物にエネルギーを射出して計測する方法である．その計測方法の代表例としてスリット光投影法（光切断法）が挙げられる．この手法は，スリット光を対象物に投影して，光で対象物を切断するように断面形状を得るとともに，その断面を積層することで対象物全体に対する三次元形状を取得する方法である．受動的な計測法とは異なり，光で特徴点を形成することができるため対象物の全体計測を目的とした場合，スリット光投影法（光切断法）は実用化しやすい方法である [20],[21]．タイヤ内面部の外観検査は，欠陥が発生する部位を絞り込むことは困難であり，タイヤ内面全体を検査対象とする必要があるため，全体計測に適した能動法の中でスリット光投影法（光切断法）を採用した．. 2.6.1. 光切断法. 光切断法とは，ライン状のレーザ光（スリット光）を対象物に投影し，三角測量法に基づいて距離を計測する手法である．図 2.6 に光切断法の測定原理を示す．このとき，距離 Z は式 2.1 により求められる．ただし，θ1 はスリット光の投影角度，θ2 はカメラの撮像角度，L はスリット光とカメラとの距離を示している．スリット光は，レーザスポット光をシリンドリカルレンズ（円柱レンズ）で特定の方向に引き伸ばしてライン光を形成したものである（図 2.7）．. 17.

(20) Measurement object P. Z. θ1. θ2. L. Projection unit. Imaging unit 図 2.6: 光切断法の測定原理. Slit light. Cylindrical lens. Measurement object. Camera. 図 2.7: スリット光の形成. Z. tan 1 tan  2 L tan 1  tan  2. 18. (2.1).

(21) 2.7. 機械学習による欠陥識別. 本節では，本論文で用いた機械学習の手法について説明する．具体的には，画像分類で広く利用されている畳み込みニューラルネットワーク（Convolutional Neural Network, CNN），サポートベクターマシン（Support Vector Machine, SVM），及びアンサンブル技術（Emsemble Technique）について，先行研究を概説し，本論文で採用した理由について述べる．. 2.7.1. 畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）. 画像認識の分野では，2010 年から大規模なデータセットを有する ImageNet[22]を利用した画像認識コンペティション ILSVRC[23]が開始された．当時，深い構造をもつ畳み込みニューラルネットワーク（Convolutional Neural Network, CNN）[24]によって認識精度が大幅に改善されたこともあり，深層学習（Deep Learning）のブームのきっかけとなった．以降，画像認識だけではなく，物体検出 [25]といった様々なタスクに深層学習が適用されるようになった． CNN は，Fukushima のネオコグニトロン[26]がルーツといわれている．ネオコグニトロンは，Hubel と Wiesel が提案した生物の脳の視覚野に関する神経科学の知見[27]をヒントにしている．視覚野では，神経細胞の受容野（Receptive Field）に局所性があり，単純型細胞（Simple Cell）と複雑型細胞（Complex Cell）が階層的に結合している構造をもつ．この構造を画像のパターン認識に最初に応用したのがネオコグニトロンである．LeCun らが 1989 年に発表した CNN は，ネオコグニトロンと同じ構造のネットワークを誤差逆伝播法（Error Backpropagation）で演算した勾配を用いて勾配降下法でパラメータの最適化を行うもので，文字認識にて高い性能を挙げることが示された[28]．このネットワーク構造は LeNet と呼ばれている．LeNet は，畳み込み層（Convolution Layer）とプーリング層（Pooling Layer）がペアで複数回積み重ねられ，最後に全結合層が二つ積み重ねられている．畳み込み層では，入力画像とフィルタ間で式(2.2)として定義された積和計算が行われる[29]． M 1 N 1. am,n   w p ,q xm p ,nq  b. (2.2). p  0 q 0. ここで，入力画像のサイズを M  N ピクセル，入力画像のピクセル位置を. (m, n)(m  0,  , M  1, n  0,  , N  1) ，入力画像のピクセル位置 (m, n) におけるピクセル値を. xm,n ，フィルタのサイズを P  Q ピクセル，フィルタのピクセル位置を ( p, q )( p  0,  , P  1, q  0,  , Q  1) ，フィルタのピクセル ( p, q ) におけるピクセル値を w p ,q とす. 19.

(22) る． b はバイアスとする．式(2.2)で積和計算された値は，非線形の活性化関数を通じて次の層へ伝播される．プーリング層では，入力画像に対して式(2.3)，式(2.4)として定義された計算が行われる[29]．. xi , j  max xm,n. (2.3). ( m ,n )Ri , j. xi , j . 1 R2. x. m,n ( m ,n )Ri , j. (2.4). ここで，画像サイズを M  N ピクセルとした入力画像上で，画像のピクセル位置 (m, n) を中心とした R  R 正方領域を選択して，この領域内に含まれるピクセルの集合を Rm ,n とする．プーリングでは，この Rm ,n 内のピクセル値を一つの値にまとめる処理を行う．プーリングの種類はいくつかあり，式(2.3)で求められる最大プーリング（Max Pooling），式(2.4)で求められる平均プーリング（Average Pooling）がよく用いられる． CNN は畳み込み層のフィルタの重みを共有するため，パラメータの数は全結合の多層ネットワークのように入力次元数に対して比例して増加することはない．そのため，CNN は実サイズの画像にうまく対応し，Ciresan ら[30]～[32]は，数字認識（MNIST），3D 物体認識（NORB），自然画像 (CIFAR10)，ドイツの交通標識認識（43 クラス）のデータセットを用いて，4～7 層の隠れ層をもった CNN の比較実験において，浅い構造よりも深い構造（多層化構造）が識別精度の向上に寄与し，多くの物体認識において高い性能を挙げることを報告している．こういった CNN を欠陥検出や欠陥識別に応用した研究がいくつか報告されている． Cha ら[33]は，コンクリートや鋼鉄の表面のひび割れなどの欠陥を抽出するために CNN を適用している．これまでは，人が実施していた目視検査を部分的に代替するために画像処理技術が検討されていたが，実環境での様々な状況変化（例えば，照明や影の変化）に対応することが困難であり課題になっていた．研究目的は，照明，影，ぼやけといったノイズの影響を受けにくい頑強な識別器を構築し，広い適用性を確保することと述べられている．CNN を用いる利点として，画像特徴を自動的に学習することができるので，画像処理技術による特徴抽出を必要としないことが挙げられている．実験では，縦横 256 ピクセル解像度の約 4 万枚の画像をトレーニングして，トレーニング画像とは異なる状況（例えば，局所的な強い光り，影，非常に細い亀裂）のテスト画像を対象に検証したところ，実環境の状況下でコンクリートのひび割れを見つけられることが報告されている． Roohi ら[34]は，レール表面欠陥の検出のための画像データの解析に対して CNN を適用している．画像は何時間もの自動で撮影されたビデオ画像から得られたものであり，膨大な量のデータを人が検. 20.

(23) 査をしてレール表面の欠陥を検出することは不可能である．そのため，鉄道のレールの欠陥を自動検出することで，時間とコストを節約し，鉄道の輸送の安全性を確保できると述べられている．しかしながら，レール表面の欠陥を検出するのに適した特徴を抽出することは困難な作業であり，特徴学習を実行可能な技術として CNN を適用することを提案している．CNN を用いる利点として，手作業で作成していた特徴設計から，直接データから本質的な特徴の自動学習へ移行することに役立つことが挙げられている．実験では，中間層の数とカーネルの数を 3 条件で設定したときの CNN の識別精度とトレーニング時間を比較している．3 条件の構造の性能比較結果から，中間層とカーネルを共に増やした大規模構造は，中小規模の構造よりも分類タスクに対して優れたパフォーマンス（レールの欠陥クラスを約 92%の精度で分類）を示すが，トレーニングには時間がかかることが報告されている．前田ら[35]は，道路の損傷の有無検出だけでなく，損傷の種類を高精度に分類することに CNN を適用している．実社会のシナリオでは，道路管理者が損傷を修復する必要がある場合，効果的な行動をとるためには損傷の種類を明確に理解することが必要と述べている．また，路面検査は，主に人による目視観察と高価な機械を用いた定量分析に基づいており，これらのうち目視検査アプローチは，ベテランのフィールドエンジニアの専門知識を必要とするだけでなく，時間がかかり，かつ高価でもある．更に目視検査は矛盾し，持続不可能である傾向があり，それは老朽化した道路インフラに関するリスクを増大させると述べられている． Masci ら[36]は，鉄鋼の欠陥検出に CNN を適用している．鉄鋼欠陥の検出に関するタスクは，テクスチャ素材の欠陥検出とみなされており，古典的なアプローチの多くは，事前知識により設計される一組の二次元フィルタによって対象画像が畳み込まれ，畳み込みを実行後は標準的な分類器が用いられる．二次元フィルタは Gabor Wavelets が一般的に選択され，テクスチャ材料の欠陥検出，織物欠陥検出，顔認識に用いられている．しかし，こういった二次元フィルタは単層構造であるため，CNN の多層構造と比べて表現力が低いという欠点をもっている．二次元フィルタは，Local Binary Patterns (LBP), Local Binary Pattern Histogram Fourier (LBP-HF), Monogenic-LBP，Rotation Invariant Measure of Local Variance (VAR), Histogram of Oriented Gradients (HOG), Pyramid Histograms of Orientation Gradients (PHOG)といったものがあり，適用可能な特徴は非常に多く，様々な製品に対して最適化することは容易ではないと述べられている．実験では，前述の二次元フィルタにより抽出した特徴を Multi-layer Perceptron (MLP)と SVM でトレーニングした識別器と CNN の識別精度を比較し，PHOG 特徴を用いた識別器に対して，CNN では誤り率が 8%低減することが報告されている．. 21.

(24) Makantasis ら[37]は，単眼カメラで撮像した RGB 画像を使用したトンネル内のコンクリート欠陥の検出に対して CNN の適合性を報告している．従来の手法は，入力画像に対して複雑な手作りの特徴抽出を行い，得られた特徴を用いて識別器をトレーニングする．しかし，様々な欠陥タイプがある場合，特徴の構築や選択作業が難しくなる．手作りの特徴の構築に依存する従来のパターン認識とは対照的に，CNN のアプローチは複雑で高レベル特徴の階層的構築を可能にする．このようにして，タスクに最も適した特徴が自動的に構築され，特徴構築の労力が最小限に抑えられる利点が挙げられている．実験では，Artificial Neural Network (ANN), Support Vector Machine (SVM), k-Nearest Neighbor (k-NN), Classification Tree (Ctree)といった手法と比べて，CNN は他のどの手法よりも欠陥検出精度が優れており，正確なトンネル検査の可能性を示している．また，CNN を用いることで，より大規模なデータセットへ対応できることの利点も述べられている． Tao ら[38]は，金属表面の欠陥検出と欠陥種類の分類タスクの両方を正確に実行するために，CNN ベースの構造を提案している．報告によると，入力画像は最初に，Cascaded Autoencoder (CASAE)と呼ばれる検出モジュールにより欠陥領域をピクセルレベルで予測する．次に，閾値モジュールでは，検出モジュールの予測結果を二値化して正確な欠陥領域を抽出し，その範囲のみ画像を切り出しする．分類モジュールでは，欠陥領域をコンパクトな CNN を介して特定のクラスに分類する．CASAE により欠陥領域を確実に抽出することと，コンパクトな CNN により欠陥検査の全プロセスをスピードアップさせる効果が述べられている．その他に，産業用途における他の材料の欠陥検出にも適用することの利点と，手作業でラベル付けされたデータを必要とし，それは多くの時間と費用を要する欠点が述べられている． Cui ら[39]は，トラック・バス用タイヤ内部の金属構造の欠陥検出に対して，CNN の適用を提案している．報告によると，五つの個々の CNN を結合したマルチコントラスト CNN (MC-CNN)を設計している．これは 2.7.3 項のアンサンブル技術を参考にしており，複数の出力を平均することで単体の出力と比べて精度が向上する利点が述べられている．神経科学の分野では，CNN の多層の畳み込み構造が，脳の高次視覚野と似た振る舞いを示すということが電気生理学的な実験を通じて報告されている[40],[41]．一方，機械学習のアプローチではないが，人の視覚的な機能を深く解析することや，目視検査を自動化するための研究として，傷などの局所的欠陥と，うす汚れなどの大局的欠陥の両方を検出する画像処理技術[42]や，人の視覚的生理機構（周辺視と固視微動）を模擬した「傷の気付き」アルゴリズム[43],[44]も報告されている．. 22.

(25) 以上のように，CNN の欠陥検出への応用，CNN の構造と人の視覚野との関係性，人の視覚的機能の解析に関する様々な研究が行われている．一般的な機械学習に基づく手法は，特徴抽出とパターン分類の 2 段階の処理を行っている．入力画像の特徴を分析することによって，欠陥情報を記述する特徴ベクトルが設計され，次に特徴ベクトルは入力画像が欠陥を有するか否かを決定するために予め訓練された分類器モデルに入れられる．これらの特徴は，LBP 特徴量，HOG 特徴量といったものが一般的に用いられ，様々な表面欠陥検出においてよい検出結果を達成しているが，直接適用できないタスクもある．また，画像処理を用いた手法は，アルゴリズムが様々な欠陥を対象とした複数の閾値を必要とすることが多く，それらは照明条件や背景色に非常に敏感であり，新たな問題が発生した場合，それらの閾値を調整する必要があるか，あるいはアルゴリズムを再設計する必要があるかもしれない．したがって，一般的な機械学習や画像処理を用いた手法に共通する手作りで設計された局所的特徴や大域的特徴は，より複雑な条件を十分に識別できない可能性がある．一方，CNN では局所的特徴や大域的特徴といった複雑で高レベル特徴を階層的に構築することができる．また，人の脳の高次視覚野と似た振る舞いを示すことが確認されており，複雑かつバリエーションが豊富な検査対象を検査するアプローチとして適していると考える．タイヤ内面部の外観検査は，欠陥か否かの最終判断を人の目視で行っており，人の視覚野を模したネットワーク構造をもつ CNN の適用可能性は高く，タイヤ内面部の欠陥や背景模様といった不変特徴を抽出することに有効であると考え，「良品部」と「準良品部＋欠陥部」の画像を分類するための識別器として CNN の適用を試みた．. 23.

(26) 2.7.2. サポートベクターマシン（Support Vector Machine, SVM）. サポートベクターマシン（Support Vector Machine, SVM）は，画像の特徴ベクトルからクラス分類する識別手法として用いられることが多く，様々な機械学習手法の中でも最も識別性能の優れた手法の一つである．SVM は，Cortes ら[45]によって考案され，2 クラス分類のための識別器として開発された．SVM は，非線形な入力ベクトルを高次元の特徴空間に写像し，超平面と呼ばれる線形な識別平面を構築する．特徴空間における識別平面と入力ベクトルとの距離（マージン）を演算し，マージンが最大となるように識別平面を決定する．識別平面の決定にはサポートベクトルと呼ばれる識別平面の近傍のデータのみが必要であり，比較的少ないトレーニングデータにおいても高い汎化性能を示す[46]．図 2.8 は，線形分離可能な 2 クラスのトレーニングデータ分布を示している．ここで，トレーニングデータ. x ，クラス y をそれぞれ x  ( x , x ,  , x ) , i  1, , l y  ( y , y ,  , y ) , i  1,  , l , y  1,1 1. 1. 2. T. (2.5）. T. （2.6）. i. 2. i. としたときの識別関数を. Separating Hyperplane Support Vector Class -1. w. Support Vector Class +1. Margin. 図2.8: SVMによる2クラス分類. 24.

(27) f ( x)  wT x  b. x. （2.7）. x. と定義する． f ( )  0 であれば Positive クラスに分類し， f ( )  0 であれば Negative クラスに分類する．このとき，図 2.8 の特徴空間を二つに分離する超平面は，. f ( x)  wT x  b  0 となる．ただし，. （2.8）. w は超平面に直行する方向の重みベクトル， b はバイアスとする．SVM では，ト. レーニングデータと識別境界との最短距離であるマージンを最大化することで，汎化誤差を小さくすることを可能にしている．マージンは，式(2.9)で定義される．. 1.  . w マージンの最大化は，. w. （2.9）. 2. 2. の最小化を求めることと等しくなる．したがって，SVM は以下の二次計. 画問題を解くことによって，最大マージン化が実現できる．. minimize subject to. w. 2. (2.10). y i ( wT x i  b)  1, i  1,  , l. 一般的には，全ての特徴空間で線形分離ができることは少なく，一部のデータに対しての誤分類を許容することが必要である．ソフトマージン SVM では，スラック変数  i  0 (i  1,  , l ) を導入することで，誤分類を許容する条件を付加することができる．ここで， C は誤分類を許容する条件を調整するためのパラメータであり， C  0 とする． minimize. subject to. 1 2. w. 2. l.  C i i 1. (2.11). y i ( wT x i  b)  1   i , i  1,  , l. この他に，SVM には多項式カーネルや RBF カーネルといった非線形カーネルを関数とした非線形 SVM がよく用いられる．こういった SVM を欠陥検出や欠陥識別に応用した研究がいくつか報告されている．伊波ら[47]は，Windows 系の OS をターゲットとした不正なプログラムへの対策として，SVM を用いた異常検知手法を報告している．報告によると，従来の研究における不正なプログラムの検出は，プログラムの振舞いに基づくビヘイビア型の異常検知システムが多く用いられ，高い検知率を獲得するためには正常なプログラムを誤検知する False Positive が増加するといった課題が残っていた．提. 25.

(28) 案手法では，最初にルールベースによってクリティカルなシステムコールと判断されたシステムコールを抽出する．次にシステムコールが発行されるまでの履歴の時系列データを特徴ベクトルとした SVM によって抽出されたシステムコールを正常と異常に分類する．実験結果から，評価用データセットに対する提案手法による異常検知率は 98.3%であった．また，評価データセットに対する提案手法による False Positive の検知率は，ルールベースで抽出したものが 96.7%であったものを，更に SVM によって分類すると 15.0%に低減させる効果が確認されている．以上により，SVM は，True Positive を増加させ，False Positive を低減させる手法として有効であるといえる． Munder ら[48]は，画像内の歩行者検知に対して，SVM の有効性，分類精度とトレーニングサンプルのサイズとの関係について報告している．実験では，特徴量を大域的特徴とした PCA，局所的特徴とした Haar Wavelet，Local Receptive Fields を用い，識別器には，SVM，Feed Forward Neural Network，k-Nearest Neighbor (k-NN)の各識別器を用いて分類精度を比較している．SVM は多項式と RBF カーネルを用いている．SVM を用いる利点は，ニューラルネットワークでは平均二乗誤差などを最小化する全体最適化を行うが，SVM ではサポートベクトルと識別境界のマージンを最大化することによる最適化ができると述べられている．分類性能は，検出率（正しく分類された Positive クラスの割合），誤検出率（誤って分類された Negative クラスの割合）との間のトレードオフを定量化する ROC 曲線で評価された．実験結果から，各識別器の中で SVM が最もよく機能した．また，分類精度の向上に最も効果があったものはトレーニングサンプルサイズを増やした条件であり，具体的にはトレーニングサンプルサイズを 2 倍に増やした条件で識別エラーが約 2 分の 1 になることが確認されている．以上により，SVM を用いた場合においても，より多くのトレーニングデータを収集し続けることが重要であるといえる．山田ら[49]は，人名や組織名といった単語列を抜き出す固有表現抽出に，SVM を用いた手法を提案している．固定表現の規則の抽出に機械学習を適用する場合，様々な素性を用いることになるため，高次元の素性空間における学習が必要になる．一般的に機械学習を用いる場合，次元数が増加するに伴い過学習の可能性が高まる．そのため，高次元のデータを対象にしても過学習を起こしにくい機械学習の手法を選定する必要がある．SVM は，汎化誤差が次元数に影響されないことが理論的に証明されており[46]，固有表現抽出規則の学習においても汎化能力の高い学習が実現できると述べられている．実験結果から，最大エントロピー法と比較して，テストデータに対して同等以上の精度が期待できること，高次元素性空間で過学習することなく高い精度が得られたことが確認されている．以上により，SVM は，高次元データを対象とした場合においても，過学習になりにくい手法として有用であ. 26.

(29) るといえる．吉谷ら[50]は，固有表現抽出と情報統合の間をつなぐ技術として，テキスト情報を表形式にまとめる機能とした局所的統合の処理に SVM を用いた手法を提案している．固有表現抽出は，山田ら[49]の手法を適用して固有表現を抽出している．情報統合は，人物のプロフィール情報を例にすると，抽出された固有表現がどの人物に対する情報であるか同定する局所的統合（Local Integration）という処理を提案手法としている．これは，抽出された固有表現を品詞，文字種，項目タグといった素性にしたものを SVM で学習し，対象文章からプロフィールの境界を推定するものである．実験結果によると F 値が 0.56 となり，研究の第一歩として，プロフィール情報を表形式にまとめる処理として SVM の有効性が確認されている．山崎ら[51]は，Web 上のテキスト文書の読みやすさを判定するために SVM を用いた手法を提案している．報告によると，読みやすさに基づいてクラス分けした Web 文章を用いて，単語の出現頻度，テキストに関する特徴（表層的特徴，構造的特徴，論理の流れ），HTML 構造に関する特徴（構造的特徴，リンク構造による特徴）の各特徴ベクトルを作成し，ナイーブベイズ分類器，線形 SVM，多項式 SVM によって読みやすさの評価実験を行っている．実験結果により，各識別器の中で SVM が最も良い精度であったことが確認されているが，カーネルやパラメータのチューニングを行うことによる分類精度比較が今後の課題と述べられている，村上ら[52]は，顔画像の白飛び強度の予測に SVM を用いた手法を提案している．室内でストロボ撮影した顔画像において，顔の領域が白く塗りつぶされたようになる「白飛び」が発生することがある．報告によると，白飛びが発生しやすい鼻・頬・額といった領域ごとに定量的な指標として求められた白飛び率と，主観評価に基づく白飛びの準定量評価指標を用いた白飛び強度をデータとし，それぞれの関係性を SVM を用いて評価している．実験では，SVM は RBF カーネルを適用し，ソフトマージンパラメータ C，カーネルパラメータγを計 525 条件で設定し，各パラメータごとに Leave-One-Out 法を用いて正解率を最大化するパラメータ選択を行っている．実験結果から，90.0%の精度で白飛び強度を予測可能であることが確認されている．以上のように，定性的にクラス分けされた画像分類においても，SVM のクラス分類に有効な特徴量を選択することが，精度向上につながるといえる．梶原ら[53]は，IoT 技術によって収集された生体情報，気象情報といったデータからユーザの気分を予測する手法を提案している．生体情報とは，体重・体脂肪・基礎代謝量といった情報で，気象情報とは，最高気温・最低気温・降水量といった情報であり，これらを説明変数としている．気分は，被験者によって 5 段階に分けた情報であり，これを目的変数としている．実験では，ナイーブベイズ. 27.

(30) 分類器，ランダムフォレスト，線形 SVM，RBF カーネル SVM を識別器として用い，生体情報のみ，気象情報のみ，生体情報と気象情報の両方，の 3 パターンのデータセットで気分の予測精度を比較している．実験結果から，生体情報と気象情報の両方を用いて，識別器をランダムフォレスト，線形 SVM を適用した条件で F 値が 0.6 以上となることが確認されている．各識別器の予測精度を総合すると，生体情報のみ，気象情報のみを用いた条件では，予測精度が低下することが確認されている．吉川ら[54]は，筋電位の情報を用いた手の動作識別に SVM を適用した手法を報告している．SVM を適用する利点として，・大局的最適解が保証される・未知のパターンに対する識別精度が高い・ハイパーパラメータの探索が容易である・予測時の計算コストが低い・トレーニングを効率的に実施するアルゴリズムがあるといったことが挙げられている．実験では，前腕から筋電位信号を計測し，時間領域と周波数領域に着目した二つの特徴抽出を行い，前腕の動作を 7 クラスに分けたものをデータとしている．SVM は， RBF カーネルを用いており，ハイパーパラメータγと C を計 48 条件で設定し，総識別率を最大化するハイパーパラメータを選択している．実験結果から，総識別率の最も低い条件と最も高い条件の差は最大で 6%と比較的低く，ハイパーパラメータの変化に対する識別精度の変動は少ないと報告されている．また，SVM の有効性を確認するために，線形判別器（LDA），k-最近傍法（k-NN），バックプロパゲーションニューラルネットワーク（BPNN）との比較も行っており，各識別器の中で SVM の識別率が最も良好であることが確認されている．SVM は高い識別精度を有する優れた識別器であり， SVM の学習の容易さから，識別率が低下した時の再学習についても有利であると述べられている．三浦ら[55]は，ロボットの位置推定に SVM を適用する手法を提案している．全体の処理は 2 段階になっている．第 1 段階は，パノラマ画像を小領域に分割して色やエッジ情報といった特徴ベクトルを作成して SVM によって物体認識を行う．第 2 段階は，第 1 段階の結果に対して SVM によって位置推定を行う．このように機能を分割した SVM を用いることで，天候等の変化に対応でき，パラメータ調整を不要とする効果が報告されている．千田ら[56]は，RFID タグを用いた位置推定に SVM を適用する手法を提案している．複数の RFID タグが配置された上をロボットが通過したときに，タグの読み取り順序や読み取り回数とロボットの位置との関係を SVM で予測する．平面に配置されたタグに複数の SVM を対応させることで，どの SVM が. 28.

(31) 反応するかによって位置を求める PS（Parallel SVM）法と，SVM を木構造で並べることで二分探索する TS（Tree SVM）法がある．PS 法は全ての SVM を動作させる必要があるため計算負荷が大きく，TS 法は PS 法と比べて SVM の数が約 2 倍必要になるが計算負荷が小さくなる．実験により，TS 法を用いることで低コストに位置推定できることが確認されている．小中[57]は，離散値入力制御系に対して SVM を用いた制御器の設計手法を提案している．制御器は，ある入力に対する出力変化を機械学習によって学習可能であれば，制御器が設計可能である．機械学習の手法として，ニューラルネットワークがあるが，学習開始時の重みや学習データの順番が学習ごとに変化するため，制御対象を動作させる機会が少ない場合には適さないと述べられている．一方， SVM を利用することで，同一のデータに対して繰り返しの予測精度が保証できるので，その点において利点がある．また，ニューラルネットワークに比べてパラメータの数が少ないことも利点である．実験によると，SVM を用いることで，パラメータが少なく追従性が高い設計が可能であることが報告されている． Burges[58]は，SVM を用いる利点として，トレーニングによって常にグローバルな最適解を求めること，最適なカーネルを選択することで様々なタスクに適応できることを報告している． Bellili ら[59]は，手書き数字文字認識のために Multi-layer Perceptron (MLP)と SVM のハイブリッド構造を提案している．具体的には，MLP のエラーが高いクラスのペアに対して SVM を適用している．この提案手法によって，MLP のクラス間では最適ではない識別境界に対して，SVM が弱点を補うことが可能になっている．このように，人が見ても難易度が高い数字の識別に対しても，SVM は有効に機能するといえる．以上のように，SVM は比較的少ないトレーニングデータにおいても高い汎化性能を示し，高次元データを対象とした場合においても過学習になりにくい手法である．タイヤ内面部の外観検査は，2.8.3 項にて定義する三つの識別対象を扱っている．その中で，「準良品部」と「欠陥部」と定義した識別対象は，「良品部」と比べて画像が集まりにくく，「準良品部」と「欠陥部」は画像特徴に類似性が高い．そのため，「準良品部」と「欠陥部」を CNN で識別するにはトレーニング画像数が少なく，グローバルな最適解が得られにくいと考える．そこで本論文では，識別対象の数が比較的少なく，特徴が類似した「準良品部」と「欠陥部」の画像を分類するための識別器として SVM の適用を試みた．. 29.

(32) 2.7.3. アンサンブル技術（Emsemble Technique）. 近年，不均衡なクラス分布を有するクラス・インバランス問題が，データマイニング研究における課題の一つとして挙げられている[60]～[65]．分類タスクにおいて，あるクラスに属するサンプルの数が他のクラスのサンプルの数よりも少ない場合，そのデータセットは不均衡であるといわれる．これは実世界の様々な分類問題に存在し，例えば，故障診断[66],[67]，油流出の検出[68]など，様々な分野に関わる問題である． Galar ら[60]は，不均衡なデータセットの問題を次のように報告している．データセット内の各クラスに属するデータの割合は，分類タスクにおいて重要な意味をもっている．不均衡なデータセットの問題は，検出すべきクラス（Positive クラス）がデータセットで過小評価されている場合に発生する．これは，Negative クラスのデータの数が Positive クラスのデータの数を上回っている状態である．特に，なんらかの異常を検出するタスクにおいては，異常の発生頻度が極端に低い場合が多く，正常データと異常データの不均衡が発生しやすい．こういった不均衡なデータセットを対象に，標準的な機械学習のアルゴリズムで分類した場合，データセット全体に対する予測誤差を最小化することが優先されるため，データ数が少ないクラスはデータ数が多いクラスと比べて誤って分類されることが多くなる．また，データセット内の各クラスの分離性も重要な意味をもっている．各クラスにおける特徴量の分布が Positive クラスと Negative クラスで重複している場合においても，データセット全体に対する予測誤差を最小化することが優先されるため，少数のクラスのデータが誤分類されることが多くなる．こういったクラス・インバランス問題に対処するための研究がいくつか報告されている．機械学習では，複数の識別器を組み合わせて一つの識別器の精度を高める手法としてアンサンブル技術[69],[70]が知られている．アンサンブル技術の考え方としては，いくつかの個々の識別器を作成し，それらの全てを上回る性能を示す識別器を得るためにそれらを組み合わせることである．これは，人間が重要な決断をするときに個々の意見を比較検討して，それらを組み合わせて最終決定を下すプロセスと本質的に同じである．アンサンブル技術の代表的な手法として最も広く使われているものは，Bagging[71]と Boosting[72]である． Bagging は，Breiman によって開発された，最も初期のアンサンブルベースのアルゴリズムの一つである．Bagging の多様性は，ブーストラップと呼ばれる手法によってトレーニングデータ全体から異なるトレーニングデータのサブセットをランダムに復元抽出し，各トレーニングデータのサブセッ. 30.

(33) トを同じタイプの異なる識別器をトレーニングすることで得られる．最後に，個々の識別器の出力について，重み付け投票もしくは重み付け和によって総合的な予測をする． Boosting は，Schapire によって開発され，ランダムな推論よりもわずかに優れている弱識別器を作成するアルゴリズムは，データセットの一部を正しく分類できる強識別器に変えられることを証明している．AdaBoost[73]は，Boosting の中で最も広く使われている手法の一つである．最初の識別器はデータセット全体に対してトレーニングし，次の識別器は一つ前の識別器で誤分類されたデータに対して重みを増加させ，正分類されたデータに対して重みを減少させた条件でトレーニングをする．つまり，後段の識別器は前段の識別器が苦手なデータを積極的に分類できるようにトレーニングをする．このように逐次的に識別器をトレーニングし，最終的に各識別器の出力について重み付け投票もしくは重み付け和によって総合的な予測をする．こういったアンサンブル技術を用いることで，複雑な識別境界の設定が可能となり，組み合わせる識別器は単純で比較的高速計算が可能なため，リアルタイム性が求められるシステムによく利用されている．また，アンサンブル技術には，クラス分布のバランスを取るために次に示すデータ前処理技術と組み合わせて使われることが多い． Undersampling[74]は，多数クラスのデータ数を少数クラスのデータ数と同等とするためにランダムに除外する手法である．クラス分布をバランスさせる利点があるが，潜在的に有用なデータを除外する可能性があることが欠点である． Oversampling[75]は，Undersampling と同様にクラス分布をバランスさせるが，少数クラスのデータ数を多数クラスのデータ数と同等とするためにランダムに複製する手法である．同じデータを複製する場合，過学習の発生を高める可能性があることが欠点である． Synthetic Minority Oversampling Technique (SMOTE)[76]は，少数クラスのデータを補間して新しい少数クラスのデータを作成する手法である．少数クラスのデータに対して，k-Nearest Neighbor (k-NN)を用いて一つのデータをランダムに選択し，両方のデータのランダム補間から新しいデータを作成する．これにより同じデータを複製することが無くなり，過学習の発生が回避される利点がある． Modified Synthetic Minority Oversampling Technique (MSMOTE)[77]は，SMOTE の改良版である．少数クラスのデータの分布を考慮するだけでなく，全てのデータの距離を計算することによって，データを Security, Border, Latent Noise の三つのグループに分類する．新しいデータを生成するときには，Security については k 個の近傍からランダムにデータを選択し，Border については最近傍. 31.

(34) のデータを選択し，Latent Noise については選択しない，という処理する． Selective Preprocessing of Imbalanced Data (SPIDER)[78]は，少数クラスの局所的な Oversampling と，多数クラスの難しい例のフィルタリングを組み合わせた手法である．第 1 段階は， k-Nearest Neighbor (k-NN)を用いて正しく分類されたものを Safe，誤って分類されたものを Noisy ととする．第 2 段階は，多数クラスの分布を考慮して，少数クラスに対する弱い増幅，多数クラスのクラスラベルの変更，少数クラスに対する強い増幅を行う．最後に，多数クラスから Noisy とされたデータを削除する． Maloof[79]の研究では，データセットの一つを Oversampling，及び Undersampling することで作成された識別器は，閾値やコストマトリックスの変化と同等の出力をもつことを実証している． Wu ら[80]の研究では，アンサンブル技術とデータ前処理技術を組み合わせて，トレーニングデータの再バランスといったデータレベルでの対応方法や，非対称性を有するデータに対してトレーニング画像数をバランスさせる機能をカスケード構造で実現している． Vuurpijl ら[81]の研究では，手書き文字認識のために 2 段階分類法を利用している．これは，第 1 段階の識別器が結果について確信がもてない場合，第 2 段階の識別器に適用した SVM によって文字認識を行う．この構造によって，A と H，U と V の混同など，類似性が高い文字を第 2 段階の SVM が認識することを示している．石原ら[82]の研究では，コンピュータ支援診断（CAD）システムを構築することを目的とした全自動胃癌リスク分類法に 2 段階分類法を利用している．第 1 段階ではピロリ菌の感染レベルを 2 段階に分類し，第 2 段階で胃癌のリスクレベルを分類する． Yang ら[83]の研究では，アンバランスなクラス分布をもつデータから最適な特徴選択をするためにアンサンブル技術を適用している．不均衡なデータセットから複数の均衡データセットを作成し，その後，それぞれが均衡データセットについてトレーニングした各識別器の集合を使用して選択した特徴を評価する．実験により，データセットが高次元性と不均衡なクラス分布の両方である場合には，最適に特徴選択されることを示している． Cao ら[84]の研究では，肺結節コンピュータ支援検出（CAD）の画像分類において偽陽性減少（FPR）を目的としてアンサンブル技術を適用している．FPR の難しさは結節の外観変化，結節と非結節のクラス間の不均衡分布にある．クラス内の不均衡や高次元性についても分類精度を低下させる要因となっている．これらの課題を解決するために，多様なランダム部分空間集合と組み合わせたハイブリッド確率サンプリングを提案している．ハイブリッド確率サンプリングの手法は，. 32.

(35) Oversampling と Undersampling の組み合わせを採用し，そのデータ分布のリサンプリングに確率関数を組み込んでいる．実験により，一般的な手法と比較して，ROC 曲線下面積を指標として提案手法の有効性を実証している． CNN を用いた分類では，各クラスの画像数が非対称性をもつ場合，多数クラスではうまく機能するが，少数クラスでは誤分類されることも報告されている[85],[86]． Wu ら[87]の研究では，多数クラスの数が少数クラスの数をはるかに上回っている不均衡なデータセットと対象とした場合，SVM の性能が大幅に低下することを報告している． Weiss ら[88]の研究では，決定木を用いた分類結果とトレーニングデータの各クラスの画像数の比率との関係を調査し，データセット内のクラス間の比較的バランスのとれた分布が一般的により良い結果を示すことを報告している． Viola らは，画像を対象とした物体検出について，複数の識別器をカスケード構造とすることで，画像の背景領域を迅速に除外しつつ，高い物体検出能力を保証できることを報告している[89]．画像から顔画像を抽出するタスクにおいて，画像内のほとんどが背景領域であり，検出したい顔画像領域の割合は非常に低い．より低い誤検出率（背景領域を顔と誤って識別する比率）を達成するために，より複雑な識別器を設計せずに，より単純な識別器を複数用いて画像の大部分を含める背景領域の画像を確実に除去するカスケードの構造を用いている．提案手法により，画像内の大半を占める背景領域に該当する画像を，できるだけ早い段階で除去することが可能になる．各段階の識別器は AdaBoost を用いており，顔の検出率，誤検出率の目標精度が満たされるまで特徴の追加，段階の追加が行われる．Viola らは，提案手法を人物検知[90]にも応用しており，より単純な識別器はカスケード構造の前段に配置され，より複雑な識別器は後段に配置されており，各段階で機能を分けることも可能としている．以上のように，検知したい対象画像の比率が少なく，除去すべき画像が多いタスクにおいて，単純な識別器をカスケード構造で対応することは利点が多いといえる．新美ら[91]は，クレジットカードのデータを用いた不正利用の検知にパラレルブースティングの手法を提案している．一般的な Boosting の手法は逐次的に処理を実行するため，弱識別器の数に比例して計算負荷が増加する．しかし，提案手法では処理が並列化できるため，並列演算能力を向上させることでトータルの計算負荷が削減できると述べられている．パラレルブースティングは，全体のデータセットを復元抽出を許す条件で複数のサブセットの分割を行い，サブセット毎に弱識別器を作成する．各弱識別器は，出力の重み付き平均をとり，重みは評価関数を最適化するように決められる．識別器には，ガウスカーネル SVM を用いている．実験では，学習器の数を増やしたときに識別器が学. 33.

(36) 習するデータセットを小さくする条件で，弱識別器の数と識別精度の関係を調べている．実験結果から，パラレルブースティングの手法で弱識別器の数を 10 個以上とすることで，学習時間，及び検証時間を短縮し，識別精度が向上することを確認している．以上のように，アンサンブル技術とデータ前処理技術の組み合わせが非対称性をもったデータに対して有効であり，・単一の識別器をトレーニングするために異なるトレーニングデータを使用する・識別器をトレーニングするために異なる特徴を使用する・異なるタイプの識別器を組み合わせるということが重要である．タイヤ内面部の外観検査において，一つの識別器を用いて「良品部＋準良品部」と「欠陥部」を高い精度で分類することは，非対称性の問題により困難である．具体的には，タイヤ内面部における欠陥の発生率は 1%に満たないほど低くなっており，各クラスのトレーニング画像数の割合は非対称になりやすい．また，「欠陥部」と「準良品部」の特徴は類似しており，各クラスのトレーニング画像には特徴が類似した画像が混在し，特徴の対称性が失われる．本論文では，この非対称性の問題に対してアンサンブル技術の適用を検討した．具体的には，各クラス間の画像数の非対称性に対しては，各クラス間でトレーニング画像数の割合を調整しバランスさせる[92]．更に二つの識別器を組み合わせることで，各クラス内のトレーニング画像に特徴が類似した画像が混在しないよう工夫する[93]．これらの効果を確認するために，第 3 章では CNN を 2 段階の構成とした多段階識別器を適用し，第 4 章で 2 段目の識別器に SVM を用いた機能別識別器の適用を試みた．. 34.

機械学習を用いた 自動車用タイヤ内面部の欠陥識別

機械学習を用いた自動車用タイヤ内面部の欠陥識別