はじめに(pdf)
6
0
0
全文
(2) とよばれるものである.. 機械学習を実現するためには,学習の本質を普遍的な形で抽象化し,理論化 しなければならない.その際,. 学習基準の定義:学習とは何か? どう形式的に定義できるのか? 学習が 成功するとはどういうことか? 何を評価基準にするのか?. 学習アルゴリズムの設計と解析:学習を成功させるアルゴリズムはどのよ うに設計すればよいのか? そして実際にアルゴリズムを設計した場合, それらはどのような限界があるのか? を考えることが重要になってくる.そういった問題を議論する理論的枠組みの ことを学習理論
(3) と呼んでいる. 学習理論には様々なアプローチがある.統計的アプローチ,計算理論的 アプローチ,統計物理的アプローチ,情報理論的アプローチ,. .
(4).
(5)
(6) からのアプローチ,生物学的アプローチ等などである.それらは 学習のどういった側面に主に焦点をあてるかによって異なる.例えば,.
(7) . はじめに. 知識表現の側面: どこまで豊かな知識の表現を獲得できるか? 情報論的側面: どこまでデータから情報量を獲得できるか? 計算論的側面: どこまで効率的に知識を獲得できるか? といった側面が考えられる.例えば, アプローチでは,知識表現の側面に 重きをおきつつ,情報論的側面と計算論的側面を考慮しながら「学習」にアプ ローチしている. 本書では, 「情報論的側面」を中心に据えながら他の側面を考慮するといっ た視点で「学習」へアプローチする.このような立場をとる学習の理論を情報 論的学習理論とここでは呼ぶことにする. 特に,本書では,情報論的学習理論の中でも,情報理論におけるデータ圧縮の 立場から, 「学習とはできるだけデータを圧縮できるような構造を見つけ出すこ とである」という指針の下で統一的に学習アルゴリズムを設計し,解析するこ とを試みる.このような考え方は,古くはオッカムの剃刀
(8) , この 年来は記述長最小原理
(9). と呼ばれている. データ及び,それを映し出す知識構造をもひっくるめてデータ圧縮して得ら れる符号列の長さを確率的コンプレキシティ
(10) と呼 ぶ.本書は, 「確率的コンプレキシティ」こそが学習によって獲得すべき本質 を捉えた量であり,学習過程は確率的コンプレキシティを最小化するプロセス として実現できることを主張する.つまり,確率的コンプレキシティは記述長 最小原理の目的関数である.それは学習の状況や場面によって,異なる形式で 定義できる. 例えば,以下のような場面の学習問題を考える. 一括学習: データが一括与えられたもとで知識表現を つ 学習する. 逐次的学習(予測) :. つずつデータを取り込みながら逐次的に学習していく.. 一般の歪み測度に関する学習: データ圧縮の歪み測度として,いろいろな損 失関数を用いて,目的に応じて自由に測りたい状況で学習する. 分散協調学習: 分散した複数のデータ源からの情報を統合して学習する..
(11) 情報論的学習理論とは. . 動的非定常な学習: データの発生源の性質が非定常な場合に学習する. いずれも確率的コンプレキシティを中心に置くことにより,最適な学習戦略が 統一的に得られるのだ,ということを本書は主張する.つまり,個々の問題に 応じた形で確率的コンプレキシティを最小化する過程として,情報論的に最適 な学習アルゴリズムを導出することができる.ただし,「記述長最小原理」は あくまで原理であって,その原理がもたらした戦略の良し悪しは,メタな学習 基準によって評価されなければならない.本書でも各学習の場面ごとに客観的 な基準を採用しながら,その理論的妥当性を立証することを試みた. 確率的コンプレキシティを中心に据えた学習理論は,狭義の情報論的学習 理論といってよいだろう.しかし,その適用範囲は広く,そして深い.本書で は, 「情報論的学習理論」という言葉を,この狭義の意味で用いることにする. この狭義に限らず,学習の情報論的側面を通じて,統計学,統計物理学,情 報理論,生物学といった基礎分野から,データマイニング,画像処理,言語 処理,バイオ,などの応用分野が,共通性の高い問題を扱っている.日本で は「情報論的学習理論.
(12)
(13)
(14) ワークショッ. プ」 (略して )と呼ばれる,学習を通じた異文化交流のための学際的研究. 会が 年に生まれ,年々発展してきている.また, 年度からは電子情 報通信学会第一種研究会として「情報論的学習理論と機械学習研究会」 (略し. て 研究会)が発足し,日本最大の機械学習コミュニティとして発展し. ている.本書はそういった情報論的学習理論に対する つの見方を提供するも のとして読んでもらいたい.. 機械学習並びに学習理論は 年代後半から世界的に発展してきている. 今や様々な方法論が存在し,混沌としている.研究者はそれらをばらばらに吸 収しているのが実情であろう.本書が説く情報論的学習理論は,機械学習を確 率的コンプレキシティの概念を軸にして統一的に体系づける枠組みである.そ のようなメタな視点から,機械学習の様々な手法を整理し,俯瞰することは機 械学習及びその応用研究にとって強い基盤となるであろう.本書の目的は,機 械学習を貫く つの視点を読者に提示することにある..
(15) . はじめに. はじめに. 第1章 符号化と学習. 第2章. 基本 問題. 一括学習と モデル選択. 第4章 拡張型確率的コン プレキシティと学習. 様々な 学習問題. 第6章 アンサンブル学習. 第3章 逐次符号化と 逐次的予測. 第5章 学習と最適化 アルゴリズム 第7章 動的モデル選択. 第8章 完全なるMDL原理に向けて 第9章 おわりにー情報論的学習理論の今後. 図½. 本書の構成. 本書の構成について 本書の構成は以下の通りである(図 ).. まず, 「はじめに」で本書で扱う情報論的学習理論の範囲を示した後,第 . 章では,情報理論の基本的な考え方である「符号化」と「学習」がどのように 関連しているかを示す.ここで,本書の中心的概念である確率的コンプレキシ ティを導入する. 第 章と第 章では,それぞれ,機械学習の基本問題の つである一括学習. と逐次予測の問題を符号化を通じて捉える.特に,第 章では一括学習を記述.
(16) 謝辞. 長最小原理(. . 原理)に基づくモデル選択の問題として扱う考え方を示す.. 第 章では逐次的予測を逐次符号化の設計問題として扱う考え方を示す.. 第 ! 章から第 " 章までは,様々な学習問題に対して第 ,, 章の考え方を. 発展させた立場から,学習アルゴリズムの設計と解析の理論を示す.特に,第. ! 章では一般の損失関数や仮説空間を対象にした統計的決定理論の枠組みの中 で第 , 章の理論をいかに拡張できるかを示す.第 # 章では,学習の局面で登 場する基本的な最適化問題を取り上げ,標準的手法を概括する.第 $ 章では, いくつかの仮説を組み合わせてより良い学習結果を生み出すためのアンサンブ ル学習の手法を紹介する.第 " 章では,非定常情報源に対して,モデルが時間 とともに変化する場合の動的なモデル選択の手法を紹介する. 第 章では確率的コンプレキシティや . 原理に関する理論の最終版とも. いえる最新の発展形と確率的コンプレキシティの効率的計算方法についてダイ ジェスト的に紹介する.第 章では,本書に登場してきた概念を模式的にまと め,情報論的学習理論が今後発展する方向性について述べる.. 謝辞 理化学研究所の甘利俊一先生には,筆者が学習理論の研究を始める時から 直接ご指導賜り,情報論的学習理論の構築に大きな影響を与えて頂いた.ま た,本書を執筆するにあたり,% &
(17) ' (
(18) ) 兼 *+
(19)
(20) % &
(21) ' . *
(22) , ' の -. / 0
(23) の存在は大きい.0
(24) 氏は 原 理の創始者であり,筆者は,この 年来,氏との幾度もコミュニケーションを 重ねた中から 原理の哲学を学び,多大な影響を受けてきた. 原理 の根本的な思想から技術的な詳細まで 0
(25) 氏と交わした議論の つ つ が本書の執筆の動機になっている.また,% &
(26) ' (
(27) ) の -. -
(28) '. '1),*
(29)
(30) 0 氏,-
(31) 2 )
(32) 氏及び 3
(33) & 4)
(34)
(35) の -
(36)
(37) 51 6 氏とは 原理を巡る最新の情報を交換 し合い,多くの議論をして頂いた.彼らとの対話が本書を執筆する上で貴重な 情報源となっている.九州大学大学院システム情報科学研究院の竹内純一教授.
(38) . はじめに. には,筆者が本稿に含めた研究成果を生み出す中で多くの議論をして頂いた. 東京大学大学院情報理工学研究科数理情報学専攻の早矢仕裕氏,平井聡氏,櫻 井瑛一氏,冨岡亮太氏からは本書のドラフトに関して貴重なコメントを頂い た.日本電気株式会社中央研究所では本書の草稿をもとに連続講義をさせて頂 き,聴講された皆様からは多数のコメントを頂いた.以上の方々に深謝いたし ます..
(39)
関連したドキュメント
以上のことから,心情の発現の機能を「創造的感性」による宗獅勺感情の表現であると
従来より論じられることが少なかった財務状況の
仏像に対する知識は、これまでの学校教育では必
現実感のもてる問題場面からスタートし,問題 場面を自らの考えや表現を用いて表し,教師の
そればかりか,チューリング機械の能力を超える現実的な計算の仕組は,今日に至るま
目的 これから重機を導入して自伐型林業 を始めていく方を対象に、基本的な 重機操作から作業道を開設して行け
今回、子ども劇場千葉県センターさんにも組織診断を 受けていただきました。県内の子ども NPO
本計画では、子どもの頃から食に関する正確な知識を提供することで、健全な食生活