株式会社ニコン
集中講義
情報認知特論(第0部)
講師:中島伸一
(株)ニコン光技術研究所
[email protected]
http://sites.google.com/site/shinnkj23/
1
✤ 成績評価:出席点+試験。
✤ 7 月26日の最後のコマで試験を行う。
✤
課題は授業中に出しますが、最後にもう一度説明します。✤
配布資料とノートの持ち込み可。NIKON CORPORATION Core Technology Center
July 25-26, 2012
自己紹介
中島 伸一
[email protected](株)ニコン光技術研究所主幹研究員
神戸大学理学物理学科 (1989 - 1993) 神戸大学理学研究科物理学専攻(修士課程) (1993 - 1995)
(株)ニコン 半導体露光装置開発部 (1995 - 2006) 東京工業大学総合理工学研究科(博士課程) (2003 - 2006)
(株)ニコン 光技術研究所 (2006 - 現在) ベルリン工科大学訪問研究員 (2008 - 2009)
3
(株)ニコン光技術研究所主幹研究員
DUTY:
製品および生産設備に必要な信号(画像)処理、最適化、データマイニング等 に関するアルゴリズム開発
ALLOWED:
機械学習の理論研究(主に変分ベイズ法の解析) Computer visionにおける応用研究
NIKON CORPORATION Core Technology Center
July 25-26, 2012
スパース推定とは?
その前に、スパースって何?
sparse/sp ːrs/
形容詞(sparser, sparsest)〈人口などが〉まばらな, 希薄な;〈頭髪などが〉薄い;〈動植 物が〉散在する.
機械学習や信号処理では、「疎」と訳されます。 多くの場合、「0が多い」という意味です。
スパースなベクトル 密(dense)なベクトル
[プログレッシグ英和辞典]
5
モデル: 収入 = a1 × 知能指数 + a2 × 社交性 + a3 × 集中力 +ノイズ
多くの人(サンプル)のデータを集めて(例えば)最小二乗フィッティ ングすれば「パラメータ」は求まる。
パラメータ
最小二乗法では、デンス(dense:密)な解が求まる。
なんで疎な解が欲しいの?
NIKON CORPORATION Core Technology Center
July 25-26, 2012
スパース推定とは?
モデル: 収入 = a1 × 知能指数 + a2 × 社交性 + a3 × 集中力
「パラメータ」を推定したとき、その多くが0になる学習法
+ a4 × 身長 + a5 × 体重 + a6 × 誕生日 + ・・・+ノイズ さっきの解: 今回の最小二乗解:
特徴選択: 収入が高い理由となる上位2因子を知りたい。 予測:データにない人の収入を予測したい。
1 2
1 2
実は身長と体重に相関があり、 殆どキャンセルされているの かもしれない。
解析の目的
! a =
2.3 5.4 3.2
7
! a =
2.1 5.7 2.4 9.2
−8.9 0.3
モデル: 収入 = a1 × 知能指数 + a2 × 社交性 + a3 × 集中力
+ a4 × 身長 + a5 × 体重 + a6 × 誕生日 + ・・・+ノイズ さっきの解: 今回の最小二乗解:
! a =
2.3 5.4 3.2
1 2
1 2
身長、体重、誕生日が収入と 殆ど関係がないなら
こうなって欲しい! スパース推定解:
1 2
NIKON CORPORATION Core Technology Center
July 25-26, 2012
スパース推定とは?
例えば(フィクションです)、
の採用により、重ね合わせ精度2 nmを達成。
高い精度と高生産性を実現するArF液浸スキャナー
ArF液浸スキャナーNSR-S621D
●このカタログは2012年2月現在のものです。仕様と製品は、製造者側がなんら債務を被ることなく予告なしに変更されます。
●このカタログに掲載の会社名、製品名は、各社の登録商標または商標です。
本製品および製品の技術(ソフトウェアを含む)は「外国為替および外国貿易法」に定める規制貨物等(特定技術を含む) に該当します。輸出する場合には政府許可取得等適正な手続きをお取り下さい。
ご 注 意
安全に関するご注意 ■ご使用の前に「使用説明書」をよくお読みの上、正しくお使いください。
は、NSR-S620Dで既に定評のある を採用し、ハード及びソフト両面からさらなる 改良を加えることにより、重ね合わせ精度2 nm、スループット毎時200枚の高い精度と高生産性を実現しました。 お客様の生産ラインにおいて最適かつ効率的なソリューションを提供します。
●Bird’s Eye Control
重ね合わせ精度の大幅な向上
・高精度エンコーダー及び従来の干渉計のハイブリッドシステムにより、最適な ステージパフォーマンスを実現。
・フォーカス制御の改善に加え、その他の精度や、安定性を改善。
・重ね合わせ精度 2 nmを目標とした機能性能を実現。
●Stream Alignment
スループットと重ね合わせ精度の両立を実現
・大幅に拡大されたビームスパンを持つ“ストレートラインオートフォーカス”。 これにより、ウェハ表面上を一気にマッピングし、Focus制御精度を改善。
・FIAの5眼化により、生産性を確保しつつアライメント計測点数を増やすことが 可能。
・ウェハオーバーヘッド時間の大幅な改善。
・スループット毎時200枚を目標とした機能性能を実現。
●Modular2 Structure
量産展開への迅速な対応を実現
・モジュール設計によるメンテナンス性の簡易化。
・モジュール設計に加え、より細かい部品の交換も可能な為、大幅にメンテナン ス性が向上し、稼働率も向上。
・拡張性の高いプラットフォーム設計により、世代間に渡った装置利用を可能に。
Straight Line Auto-Focus
Five-Eye FIA Wafer Stage
Encoder
Interferometer
精機カンパニー
企画部 東京都千代田区有楽町 新有楽町ビル 電話( )
㈱ニコンテック 東京都品川区勝島 (東神ビル)電話( )
クラス1レーザ製品
この製品はISO9001 の認証を受けた事業所で、開発・製造されました。 Reticle Stage
Metrology Frame
Wafer Stage Projection Lens
Illumination Unit
Resolution(解像度) ≦ 38 nm
NA 1.35
Exposure light source(露光光源) ArF excimer laser (193 nm wavelength)
Reduction ratio(縮小倍率) 1:4
Maximum exposure field(最大露光範囲) 26 mm × 33 mm
Overlay(重ね合わせ精度) ≦ 2 nm
Throughput(スループット) ≧ 200 wafers/hour (300 mm wafer, 125 shots)
の主な特長
「 の現象により、光学収差が発生。 どうやら温度とか気圧のせいらしい。 でも詳細は不明」
「とにかくあちこちに温度計をつけて 実験したから、補正制御に
必要な箇所(<5)を見つけてくれ」
半導体露光装置
9
理想モデル: 実は3箇所が重要だとする
(神のみぞ知る)。
最小二乗解:
基底組み合わせ探索:16万通り
スパース推定:
12番目
47番目
90番目 よくやった!
ボーナスをやる!
NIKON CORPORATION Core Technology Center
July 25-26, 2012
「自然」画像の情報量は少ない(圧縮可能)
通り 自然画像の数 <<<<<<
11
[Wikipedia :核磁気共鳴画像法]
NIKON CORPORATION Core Technology Center
July 25-26, 2012
圧縮センシング
JPEGで圧縮可能 = ウェーブレット変換するとスパース
画像(知りたい!) 観測信号(既知)
装置の性質で決まる定数(既知)
y の次元 << x’の次元 等式の数 << 未知数の数
普通には求まらない!
計測数
画像ピクセル数
=
13
が求まったら、 で元の画像が求まる。 :ウェーブレット変換
は自然画像のウェーブレット変換 → スパースなはず
・・・(*)
(*)をできるだけ満たすスパースな を求めれば良い → スパース推定
短い計測時間(計測数)で高画質なMRI画像が得られる!
NIKON CORPORATION Core Technology Center
July 25-26, 2012
クラスタリング
[Frey&Dueck2005]
似ている色のピクセルをひとまとめに。
15
混合分布モデル:
混合係数
ガウス分布 普通、クラスタ数 H は事前にはわからない。
Hをいろいろ変えてみて、一番データに会うものを選べば(最尤法)?
NIKON CORPORATION Core Technology Center
July 25-26, 2012
クラスタリング
H=サンプル数が一番よくデータに「当てはまる」。 混合分布モデル:
混合係数
ガウス分布
普通、クラスタ数 H は事前にはわからない。
Hをいろいろ変えてみて、一番データに会うものを選べば(最尤法)?
17
混合分布モデル:
混合係数
ガウス分布
普通、クラスタ数 H は事前にはわからない。
Hをいろいろ変えてみて、一番データに会うものを選べば(最尤法)?
H を大きくとっても妥当な値(H = 3)になる手法 → スパース推定 H=サンプル数が一番よくデータに「当てはまる」。
と に異なるスパース性を誘起。
NIKON CORPORATION Core Technology Center
July 25-26, 2012
ビデオの前景/背景分離
明らかに特定(分離)不可能!
スパース推定 (Robust PCA)
Movie! 時刻
ピクセル
19
注: 正則化法も、広い意味でベイズ法に含まれる(Laplace prior + MAP)。
✤
凸解析で解ける(大域解が求まる)。✤
何らかのパラメータ調整が必要。✤ 変分ベイズ法(ベイズ学習の近似法)
✤
非凸最適化になることが多い(局所解でがまん)。✤
すべてのパラメータを自動的に決めることができる。本講義ではベイズ法の話をします。
!1
NIKON CORPORATION Core Technology Center
July 25-26, 2012
講義の概要
✤ 基本的な学習法(最尤法、MAP法等を近似とみなせる)。
✤ 予測の確信度を提供(予測分布)。
✤ (モデルと事前分布が適切なら)最強。
✤ モデル選択(次元削減、特徴選択)の枠組みを提供
→ スパース推定に関連。
ベイズ学習
✤ 計算が面倒(しばしば不可能)→ 近似が必要。
✤ 「適切」な事前分布選択が必要。
✤ 不思議な(直感とは異なる)振る舞い。
21
✤ 簡単なモデルでベイズ学習の計算ができる。
✤ 実用的なモデルで近似法(変分ベイズ法)の導出ができる。
✤ ベイズ学習の特徴を知る。
将来、「自分で」ベイズ学習を使うため。
NIKON CORPORATION Core Technology Center
July 25-26, 2012
講義の構成
✤ 7月25日(水)
✤
第0部:講義の概要✤
第1部:ベイズ学習の枠組み✤
第2部:ベイズ学習の計算✤ 7月26日(木)
✤
第3部:変分ベイズ学習✤
第4部:ベイズ学習の解の性質✤
レポート23