• 検索結果がありません。

テーマ:強化学習の調査と考察062:毛利真之

N/A
N/A
Protected

Academic year: 2021

シェア "テーマ:強化学習の調査と考察062:毛利真之"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

情報システム工学科 平成18年度 自主課題研究

テーマ: 強化学習の調査と考察

062:毛利真之

1

目的

人工知能の研究分野について調査し 、その中で興味を持った機械学習、特に強化学習と言う手法についてさらに調査 をし 、問題点を考察する。

2

調査結果

機械学習とは人間が自然に行っている学習能力と同様の機能をコンピュータで実現させるための技術・手法のことで、

検索エンジン 、医療診断、スパムメールの摘出、金融市場の予測、DNA配列の分類、音声認識や文字認識などのパター ン認識、ゲーム戦略、ロボットなど 幅広い分野で応用されている。強化学習とは,試行錯誤を通じて環境に適応する学 習制御の枠組のことで,現在の状況( 入出力)がどれだけ良いか( 悪いか )を表す「報酬( 罰)」を手がかりに目的を達 成するための方策を発見的に獲得する学習スキーム強化学習は,人間が日々の生活で直面する意思決定問題,特に,各 段階における意思決定が,後の状態の良し悪しに影響を与え,なおかつ長期的な目標が存在するような意思決定を解決 する手段である。具体的な適応例としてはセルラー通信システムの周波数帯の動的割りあて、在庫管理・生産ライン最 適化、2自由度ロボットなどがある。

3

強化学習の問題点

1:強化学習では,状態表現などを生成しプログラムに組み込む必要があり,場合に よっては非常に困難を伴うこともある。

2:強化学習では「試行錯誤」という学習段階が必要であり,実際にはそれが許 されない場合が多い。

4

問題点の解決案

こういった問題点の解決策としては、その他の教師有り学習などと組み合わせることや、初期値を与えることによって、

ある程度解決されると思われる。また、環境をある程度分割し 、それらにそれぞれ強化学習のシステムを組み込み、最 後に全体として機能するようなシステムを考えることも有効なのではないかと思う。

1

参照

関連したドキュメント

社会,国家の秩序もそれに較べれば二錠的な問題となって来る。その破綻は

がん化学療法に十分な知識・経験を持つ医師のもとで、本剤の投与が適切と判断さ

「特定温室効果ガス年度排出量等(特定ガス・基準量)」 省エネ診断、ISO14001 審査、CDM CDM有効化審査などの業務を 有効化審査などの業務を

在宅医療 注射 画像診断 その他の行為 検査

在宅医療の充実②(24年診療報酬改定)

具体音出現パターン パターン パターンからみた パターン からみた からみた音声置換 からみた 音声置換 音声置換の 音声置換 の の考察

岩沼市の救急医療対策委員長として采配を振るい、ご自宅での診療をい

安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 他社の運転.