• 検索結果がありません。

Q関数を用いた強化学習

強化学習を用いた自律多脚車輪型ロボットの脱出行動の環境適応

強化学習を用いた自律多脚車輪型ロボットの脱出行動の環境適応

... Keywords: Reinforcement Learning, Wheel-Legged Robot, Escaping Actions, Adaptation to Environment, Autonomous System 概 要: 探査ロボットやレスキューロボットなどの,未知環境で作業行うロボットの研究が多 数行われている.それらのロボットは環境に応じて適切な行動選択する必要がある.そこで本研 ...

38

1F3-1 エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造

1F3-1 エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造

... (RBMs)[6] ベース にし手法が主に用いられてき.RBMs 関数近似器に用 いる強化学習手法には価値関数エネルギベースドモデルに おける自由エネルギで近似する価値関数ベースの手法 [9][8][3] と,方策のみエネルギベースドモデルで表現し価値関数は異な ...

4

1L5-1 強化学習を用いた繰り返しゲームにおける戦略の学習の高速化

1L5-1 強化学習を用いた繰り返しゲームにおける戦略の学習の高速化

... 2.2 強化学習 強化学習 [4] は,現在の自己の状態観測し,受け取っ報 酬から自分が取るべき行動決定する問題扱う学習手法で ある.意思決定主体エージェントと呼び,エージェントの外 部全てから構成される制御対象環境と呼ぶ.強化学習は一般 ...

4

1F2-2 人狼における強化学習を用いたエージェントの設計

1F2-2 人狼における強化学習を用いたエージェントの設計

... 1. はじめに 近年,完全情報ゲームにおける人工知能の技術の進歩は目 覚ましく,オセロやチェスに続き,将棋においても人工知能が人 間のプロ相手に勝利するようになっ.一方で,不完全情報 ゲームの人工知能についての研究は少なく発展の余地があり, 人工知能が目指すべき新たな目標の一つであると考えられる. 鳥海らは,[鳥海 14]にて不完全情報ゲームである“人狼”[稲 葉 12],[大澤 ...

3

強化学習と小脳モデルを利用した適応型制御システムの設計法

強化学習と小脳モデルを利用した適応型制御システムの設計法

... Auto-Fusion Cerebellar Perceptron Robust Control System AFCPRCS... TD Temporal Difference Fig.3.1 Actor.[r] ...

133

IPSJ SIG Technicl Repor に相当し 探索木の前向きの枝刈り処理に用いることも可能である. 本論文では このシミュレーション方策中のパラメータと局面評価関数中の特徴量パラメータの両方を同時に学習できる強化学習則を導出する. さらに 強化学習ではなく その局面での正解手を与える教師

IPSJ SIG Technicl Repor に相当し 探索木の前向きの枝刈り処理に用いることも可能である. 本論文では このシミュレーション方策中のパラメータと局面評価関数中の特徴量パラメータの両方を同時に学習できる強化学習則を導出する. さらに 強化学習ではなく その局面での正解手を与える教師

... 通常,局面評価関数に教師付き学習適用する際は,プ ロ棋士の棋譜データベース等から,局面とそこで指され 指し手唯一の正解手として局面・指し手ペアの訓練デー タ作成する.しかし,ここではより一般的な場合扱う. すなわち,正解手1つに限定せずに,正解と思われる複 ...

8

強化学習を用いた共同注視点に基づく合意形成: University of the Ryukyus Repository

強化学習を用いた共同注視点に基づく合意形成: University of the Ryukyus Repository

... イヤ(エージェント)が以下のタスクを達成することを目 的とする。 LPasserはReceiverへパスを成功させる。 2.ReceiverはPasserからのパスを受けとり敵ゴールへ のシュートを成功させる。 5.2.2基本行動アルゴリズム I敦鹸側エージェントC学習主体) 攻撃側エージェントにはPasserとReceiverの2種類エ ージェントが不誼:する。これら[r] ...

8

RIETI - 機械学習手法を用いた不正会計の検知と予測

RIETI - 機械学習手法を用いた不正会計の検知と予測

... 6は、こうした機械学習ベースのモデル構築によって可能となる高次元の変数利用行っ ものであり、既存研究の変数と追加的な財務変数の両方用いている。当該モデル6の検 知精度モデル2と比較することで、追加的な変数の利用がもたらす効果把握すること ができる。最後に、モデル 12 は、既述の追加的な財務変数に加えてガバナンス変数及び銀 ...

35

2D5-4 アンサンブル学習を用いた粒子フィルタの提案

2D5-4 アンサンブル学習を用いた粒子フィルタの提案

... 埼玉県川越市鯨井 2100, [email protected] 用し粒子フィルタ手法提案する.アンサンブル学習は,ア ンサンブルごとに異なる初期状態から推定始め,各アンサン ブルの平均取ることでシステムの状態推定する.その際, 各アンサンブルのばらつきの程度示すスプレッドから推定結 ...

4

LMSを用いたプログラミング授業における機械学習による得点率予測

LMSを用いたプログラミング授業における機械学習による得点率予測

... タ ,3 割検証データに分割するのが精度検証する方 法として一般的である [9] . しかし , 本研究では , データ 数が少ないため ,8 割学習データ ,2 割検証データとし .scikit-learn の train test split 関数使いランダ ...

6

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

... 1) 局面の各要素global memoryからregisterにコピーする 2) 各要素の価値計算してshared memoryに格納する 3) shared memoryの和reduction操作(注2)で計算し、結果global memoryに格納する。 以上で、時間のかかる global memoryへのアクセスは最初と最後の計2回ですむ。 ...

24

推論テスト得点を用いた雇用主学習モデルの検証

推論テスト得点を用いた雇用主学習モデルの検証

... 10 いと考えられ、本データ用いて日本の労働市場における「雇用者の学習モデル」の分析 行っ。分析の結果明らかになっことは大きく以下の 2 点である。 第 1 には、同一企業内の勤続年時間変数に用い内部労働市場の分析については、限 ...

13

視覚入力刺激を用いた運動学習の脳内機構

視覚入力刺激を用いた運動学習の脳内機構

... における可塑的変化もあきらかになってきている。これらは運 動学習する際の変化であるが,脳卒中などにより障害され 脳機能にも可塑的変化が起こっている。一般に脳卒中発症後に は脳組織自体が再組織化開始するが,慢性期へと経過するに 伴い自発的な神経可塑的変化の発現の可能性は低くなることは 周知の事実である。しかしヒト脳において,高強度高頻度の運 ...

4

現象を関数とみなす活動を通して数学を活用する力を育てる学習指導の研究

現象を関数とみなす活動を通して数学を活用する力を育てる学習指導の研究

... ($1)% % 比例定数平均して翼の面積求める。 % % % % ($2) 相関図からおよその直線書き、式求めて翼の面積だす。 d.上記の($1)と($2)について ($1)の方法と($2)の方法について単純に並列と考えるのはどうか。比例定数平均し て求める場合、特異データが1つ混じっていると平均は全体の傾向からは離れてしまう。よっ ...

28

学習支援システムを用いたプログラム教育における自習支援の実践と評価

学習支援システムを用いたプログラム教育における自習支援の実践と評価

... 図 1 小テスト受験結果と検定試験点数との相関 5.2 考察 図 1 から,小テストは多数の受講生が,継続して 小テスト受験しているため,学習意欲維持させ る教材としては有用であっと言える.しかしなが ら,5.1 節から小テスト受験しても検定試験の点数 が高い受講生とそうでない受講生がい.これによ り,各受講生の小テストの利用について,受験結果 ...

2

4J1-1 機械学習を用いた楽曲に対する感性推定の手法

4J1-1 機械学習を用いた楽曲に対する感性推定の手法

... いことがわかる . しかし,クラスタ数が増加するにつれ階層型 クラスタリングは順当に精度上げているのに対し,混合密 度ネットワークではほとんど変化が無い . クラスタ数が少ない 場合に差が出ている原因は外れ値除い場合にクラスタ数 に差が出ていること,階層型クラスタリングでは混合密度ネッ トワークと違い局所的にクラスタ作っていることが考えら ...

4

3N3-1 キットビルド概念マップを用いた類比的学習の支援

3N3-1 キットビルド概念マップを用いた類比的学習の支援

... 2.3 マップ診断・フィードバック過程 教授者は KBmap アナライザにより学習者の理解状況確認 できる.教授者によって作られゴールマップと学習者マップの 構成部品が同一であるため,2 つの概念マップの差分はリンク による概念の関連付けの違いとして取り出すことが出来る(比較 マップ).この差分により教授内容と学習者の理解の差分明 ...

4

2D4-5 自己組織化マップを用いた物体概念の学習

2D4-5 自己組織化マップを用いた物体概念の学習

... book 作成し. 提案手法では,マスク画像から抽出できる特徴点数が,テクス チャから抽出できる特徴点数に比べて少ないことから,物体の 輪郭特徴 50 次元,テクスチャの特徴 500 次元と定め.そ して,一組のカメラ画像と,深度画像から抽出し特徴,550 次元のヒストグラムとして表現する.輪郭特徴とテクスチャ特徴の ...

2

タブレットPCを用いた情報学習教材の試作-香川大学学術情報リポジトリ

タブレットPCを用いた情報学習教材の試作-香川大学学術情報リポジトリ

... 語 用 い て, こ れ ら の 機 能 実 装 し 。 加 速 度 セ ン サ の ...5) , Bluetoothの 制 御 に は「ketai.net.bluetooth」 用 いため,簡単なプログラムで実現可能と なっ。タブレットPCに実装され加速度 センサは重力加速度キーとし,タブレッ ...

8

アトムプローブを用いたフェライト鋼中のTiC析出挙動と強化能の研究

アトムプローブを用いたフェライト鋼中のTiC析出挙動と強化能の研究

... 第五章では、古典のピンニングモデル適用し、第四章で作製しモデル鋼の析出物サイズと個数密 度、析出強化量の関係から TiC 析出粒子 1 個あたりの抵抗力のサイズ依存性実験的に求めている。 TiC 粒子は球換算直径 2–4 nm において、同じくフェライト中の Cu 粒子に比べて大きな抵抗力示し、粒 子直径 2–3 nm ...

4

Show all 10000 documents...

関連した話題