Top PDF Q関数を用いた強化学習

強化学習を用いた自律多脚車輪型ロボットの脱出行動の環境適応

... Keywords: Reinforcement Learning, Wheel-Legged Robot, Escaping Actions, Adaptation to Environment, Autonomous System 概要: 探査ロボットやレスキューロボットなどの，未知環境で作業を行うロボットの研究が多数行われている．それらのロボットは環境に応じて適切な行動を選択する必要がある．そこで本研 ...

38

1F3-1 エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造

... (RBMs)[6] をベースにした手法が主に用いられてきた．RBMs を関数近似器に用いる強化学習手法には価値関数をエネルギベースドモデルにおける自由エネルギで近似する価値関数ベースの手法 [9][8][3] と，方策のみエネルギベースドモデルで表現し価値関数は異な ...

4

1L5-1 強化学習を用いた繰り返しゲームにおける戦略の学習の高速化

... 2.2 強化学習強化学習 [4] は，現在の自己の状態を観測し，受け取った報酬から自分が取るべき行動を決定する問題を扱う学習手法である．意思決定主体をエージェントと呼び，エージェントの外部全てから構成される制御対象を環境と呼ぶ．強化学習は一般 ...

4

1F2-2 人狼における強化学習を用いたエージェントの設計

... 1. はじめに近年，完全情報ゲームにおける人工知能の技術の進歩は目覚ましく，オセロやチェスに続き，将棋においても人工知能が人間のプロを相手に勝利するようになった．一方で，不完全情報ゲームの人工知能についての研究は少なく発展の余地があり，人工知能が目指すべき新たな目標の一つであると考えられる．鳥海らは，[鳥海 14]にて不完全情報ゲームである“人狼”[稲葉 12],[大澤 ...

3

強化学習と小脳モデルを利用した適応型制御システムの設計法

... Auto-Fusion Cerebellar Perceptron Robust Control System AFCPRCS... TD Temporal Difference Fig.3.1 Actor.[r] ...

133

IPSJ SIG Technicl Repor に相当し探索木の前向きの枝刈り処理に用いることも可能である. 本論文ではこのシミュレーション方策中のパラメータと局面評価関数中の特徴量パラメータの両方を同時に学習できる強化学習則を導出する. さらに強化学習ではなくその局面での正解手を与える教師

... 通常，局面評価関数に教師付き学習を適用する際は，プロ棋士の棋譜データベース等から，局面とそこで指された指し手を唯一の正解手として局面・指し手ペアの訓練データを作成する．しかし，ここではより一般的な場合を扱う．すなわち，正解手を１つに限定せずに，正解と思われる複 ...

8

強化学習を用いた共同注視点に基づく合意形成: University of the Ryukyus Repository

... イヤ(エージェント)が以下のタスクを達成することを目的とする。 LPasserはReceiverへパスを成功させる。 2.ReceiverはPasserからのパスを受けとり敵ゴールへのシュートを成功させる。 5.2.2基本行動アルゴリズムＩ敦鹸側エージェントC学習主体）攻撃側エージェントにはPasserとReceiverの２種類エージェントが不誼：する。これら[r] ...

8

RIETI - 機械学習手法を用いた不正会計の検知と予測

... ６は、こうした機械学習ベースのモデル構築によって可能となる高次元の変数利用を行ったものであり、既存研究の変数と追加的な財務変数の両方を用いている。当該モデル６の検知精度をモデル２と比較することで、追加的な変数の利用がもたらす効果を把握することができる。最後に、モデル 12 は、既述の追加的な財務変数に加えてガバナンス変数及び銀 ...

35

2D5-4 アンサンブル学習を用いた粒子フィルタの提案

... 埼玉県川越市鯨井 2100, [email protected] 用した粒子フィルタ手法を提案する．アンサンブル学習は，アンサンブルごとに異なる初期状態から推定を始め，各アンサンブルの平均を取ることでシステムの状態を推定する．その際，各アンサンブルのばらつきの程度を示すスプレッドから推定結 ...

4

LMSを用いたプログラミング授業における機械学習による得点率予測

... タ ,3 割検証データに分割するのが精度を検証する方法として一般的である [9] . しかし , 本研究では , データ数が少ないため ,8 割学習データ ,2 割検証データとした .scikit-learn の train test split 関数を使いランダ ...

6

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

... 1) 局面の各要素をglobal memoryからregisterにコピーする 2) 各要素の価値を計算してshared memoryに格納する 3) shared memoryの和をreduction操作(注2)で計算し、結果をglobal memoryに格納する。以上で、時間のかかる global memoryへのアクセスは最初と最後の計2回ですむ。 ...

24

推論テスト得点を用いた雇用主学習モデルの検証

... 10 いと考えられ、本データを用いて日本の労働市場における「雇用者の学習モデル」の分析を行った。分析の結果明らかになったことは大きく以下の 2 点である。第 1 には、同一企業内の勤続年を時間変数に用いた内部労働市場の分析については、限 ...

13

視覚入力刺激を用いた運動学習の脳内機構

... における可塑的変化もあきらかになってきている。これらは運動を学習する際の変化であるが，脳卒中などにより障害された脳機能にも可塑的変化が起こっている。一般に脳卒中発症後には脳組織自体が再組織化を開始するが，慢性期へと経過するに伴い自発的な神経可塑的変化の発現の可能性は低くなることは周知の事実である。しかしヒト脳において，高強度高頻度の運 ...

4

現象を関数とみなす活動を通して数学を活用する力を育てる学習指導の研究

... （$1）% % 比例定数を平均して翼の面積を求める。 % % % % （$2）相関図からおよその直線を書き、式を求めて翼の面積をだす。ｄ．上記の（$１）と（$２）について（$１）の方法と（$２）の方法について単純に並列と考えるのはどうか。比例定数を平均して求める場合、特異データが１つ混じっていると平均は全体の傾向からは離れてしまう。よっ ...

28

学習支援システムを用いたプログラム教育における自習支援の実践と評価

... 図 1 小テスト受験結果と検定試験点数との相関 5.2 考察図 1 から，小テストは多数の受講生が，継続して小テストを受験しているため，学習意欲を維持させる教材としては有用であったと言える．しかしながら，5.1 節から小テストを受験しても検定試験の点数が高い受講生とそうでない受講生がいた．これにより，各受講生の小テストの利用について，受験結果 ...

2

4J1-1 機械学習を用いた楽曲に対する感性推定の手法

... いことがわかる . しかし，クラスタ数が増加するにつれ階層型クラスタリングは順当に精度を上げているのに対し，混合密度ネットワークではほとんど変化が無い . クラスタ数が少ない場合に差が出ている原因は外れ値を除いた場合にクラスタ数に差が出ていること，階層型クラスタリングでは混合密度ネットワークと違い局所的にクラスタを作っていることが考えら ...

4

3N3-1 キットビルド概念マップを用いた類比的学習の支援

... 2.3 マップ診断・フィードバック過程教授者は KBmap アナライザにより学習者の理解状況を確認できる．教授者によって作られたゴールマップと学習者マップの構成部品が同一であるため，2 つの概念マップの差分はリンクによる概念の関連付けの違いとして取り出すことが出来る（比較マップ）．この差分により教授内容と学習者の理解の差分を明 ...

4

2D4-5 自己組織化マップを用いた物体概念の学習

... book を作成した．提案手法では，マスク画像から抽出できる特徴点数が，テクスチャから抽出できる特徴点数に比べて少ないことから，物体の輪郭特徴を 50 次元，テクスチャの特徴を 500 次元と定めた．そして，一組のカメラ画像と，深度画像から抽出した特徴を，550 次元のヒストグラムとして表現する．輪郭特徴とテクスチャ特徴の ...

2

タブレットPCを用いた情報学習教材の試作-香川大学学術情報リポジトリ

... 語を用いて，これらの機能を実装した。加速度センサの ...５）を， Bluetoothの制御には「ketai.net.bluetooth」用いたため，簡単なプログラムで実現可能となった。タブレットPCに実装された加速度センサは重力加速度をキーとし，タブレッ ...

8

アトムプローブを用いたフェライト鋼中のTiＣ析出挙動と強化能の研究

... 第五章では、古典のピンニングモデルを適用し、第四章で作製したモデル鋼の析出物サイズと個数密度、析出強化量の関係から TiC 析出粒子 1 個あたりの抵抗力のサイズ依存性を実験的に求めている。 TiC 粒子は球換算直径 2–4 nm において、同じくフェライト中の Cu 粒子に比べて大きな抵抗力を示し、粒子直径 2–3 nm ...

4

Q関数を用いた強化学習

関連した話題