機械学習実験演習 (2)
山梨学院大学
経営学部 伊藤栄一郎
2021.10.27
目次
1. はじめに
2. 機械学習とは
3. 教師あり学習とは
4. ニューラルネットワーク 5. 手書き数字データについて
6. Colab ノートブックによる実験演習
1. はじめに
この機械学習実験演習は、データサイエンスを学ぶ上で不可欠な技術である機械 学習について、パソコンによる演習を通じて学ぶためのものです。
インターネットに接続されたパソコンを使って、手軽に機械学習の技術を学ぶこ とができます。
今回の演習では「教師あり学習」について、手書き数字の認識という例題を使っ て学びます。
この演習では Google Colab というサービスを使うため、事前に Google のアカウ ント取得が必要です。先に「機械学習実験演習1」を済ませてから、この演習を 行ってください。
2. 機械学習とは?
● 人工知能(AI)の研究分野の一つで、コンピューターに知能的な動作をさせ る技術のこと。
● 最近、よく話題になるディープラーニングは機械学習の一種である。
● 機械学習は、「教師あり学習」「教師なし学習」「強化学習」の3つに分類 される。
AI関連技術
機械学習
教師あり学習 教師なし学習 強化学習
3. 教師あり学習とは
● 「教師あり学習」とは機械学習の分類のひとつ。
● 事前に問題と答えをコンピューターに与えて学習させておき、未知のデータ について答えを求める。
● 学習のためには、問題データと正答データの2種類が必要となる。
答え:三角形 識別器
答え:四角形
識別器
未知のデータ
答え:三角形
学習 判定
教師あり学習の流れ
スタート
データの準備
学習
検証・評価
応用
解きたい問題と、そこから得たい答えの形式を決める
訓練用データを使って学習し、学習済みのモデルを作る 学習に用いる訓練用データを集め、形式を整える
学習済みのモデルが適切かどうかテスト用データで確認する
現実のデータを使って分類や予測を行う
教師あり学習では以下のような流れでコンピューターを学習させる。
学習には「訓練用データ」だけでなく、確認のための「テスト用データ」が必要。
4. ニューラルネットワーク
● AI研究で用いられる知能モデルの一種で、脳神経細胞のニューロンを参考に 考えられた「形式ニューロン」によって作られている。
● 形式ニューロンは入力の積和演算と、閾値処理によって出力を求める。
● 形式ニューロンをいくつかの層にわけ、互いに接続したものをニューラルネ ットワークという。
● 機械学習においてニューラルネットワークが使われることが多い。
入力層 中間層 出力層
入力 データ
出力 データ 形式ニューロン
5. 手書き文字データについて
● 手書き数字を大量に集めた画像データ集(MNIST:エムニスト)がある。
● 機械学習の実験で使われる最も有名なデータ集の一つ
● 0から9までの手書き数字の画像データが、訓練用として6万個、テスト用 として1万個用意されている。
● 1つの画像データは 28x28 ピクセルのグレースケール画像(256階調)で出 来ている。
● 教師付き学習のために、どのデータが何の数字を表しているかを示すラベル データも含まれている。
6.Colab ノートブックによる実験演習
この後は、Google Colab のノートブックの記載を読みながら実験演習を行います。
以下のリンクをクリックして Colab ノートブックを開き、説明を読みながらセル を順に実行してください。
https://colab.research.google.com/drive/1V7VU4JgGuM_6IJyDUOANFBvw1V8w8 q1y?usp=sharing
Colab ノートブックを開くための準備については、「機械学習実験演習1」を見
てください。