• 検索結果がありません。

2020 年度 独創的研究助成費 実績報告書

N/A
N/A
Protected

Academic year: 2024

シェア "2020 年度 独創的研究助成費 実績報告書"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

別記様式第4号

2020

年度 独創的研究助成費 実績報告書

2021年 3月16日 報 告 者 学科名 情報通信工学科 職 名 教授 氏 名 榊原勝己

研 究 課 題 Q学習を用いたランダム・アクセス方式の設計とその性能評価

研 究 組 織

氏 名 所 属 ・ 職 専門分野 役 割 分 担 代 表 榊原 勝己 情報通信工学科・教授 通信工学 総括,理論解析,検証

分 担 者

高林 健人 情報通信工学科・助教 通信工学 シミュレータ構築,実装実験

香山 和寛 大学院学生 プログラミング,データ整理,

成果発表

研究実績 の概要

人工知能の進展により,無線通信システムにお いても,機械学習,強化学習の適用が研究されて いる.不特定多数端末からのデータを入れるため のランダム・アクセス方式に対しても,強化学習の 一手法である,Q 学習を Framed ALOHA に適用し た ALOHA-Q が提案されている(Park, et al., IEEE Access, pp.165531–165542, Nov. 2019).Park らの文 献は,全ての端末が常にパケットを所持している条 件(飽和状態) の下,その性能が評価されている.

本研究では,Park らの文献の条件を緩和し,各 端末が確率的にパケットを発生する場合(非飽和状 態)における ALOHA-Q の性能を,計算機シミュレ ーションにより評価する.

M 個の端末が,固定長パケットを共通の受信局に送信するランダム・アクセス方式を考え る.時間軸はパケットを送信するために十分なタイムスロットに分割され,パケットは1つのタ イムスロット中で送信される.以下では,複数のタイムスロットでフレームを構成する方式を考 える.

ALOHA-Q の各端末は,1フレーム内のスロット数(フレーム長)N と等しい長さの実数ベクト ル(Q テーブル) を持つ.第 t フレーム開始時において端末 i が持つ Q テーブルの第 k 要素 を Q 値 Qt(i, k)とする(i=1, 2, ...,, M, k=1, 2, ..., N).ただし,初期値 Q1(i, k)=0とする.第 t フレ ーム開始時にパケットを有している端末は,フレーム内で最大の Q 値 Qt(i, k)を持つタイムス ロット k でパケットを送信する.最大の Q 値を持つタイムスロットが複数ある場合は,その中か らランダムで送信スロットを選択する.その後,フレーム終了時に自身の Q テーブルを

Qt+1(i, k)=Qt(i, k)+a{r-Qt(i, k)}

により更新する.ここで,a は学習率(0<a≦1),r は報酬であり,パケット送信成功時に+

1,衝突時に-1をとる.なお,パケットを送信した以外のタイムスロットでは Q 値 Qt(j, k)は更新 されない.

図1.ネットワーク構成

※ 次ページに続く

(2)

研究実績 の概要

各端末は,バッファが空 であればスロット時間当た り確率pでパケットを発生す るものとする.p=1.0 の際 は飽和状態,p<1.0 の際は 非飽和状態である.また,

端末と受信局間での伝搬遅 延時間及び,通信路誤りは 無視できるものとする.端 末数 M=100,フレーム長 N

=70 に対し,ALOHA-Q の 学習率 a とスループットの 関係を測定した.15000 フレ ームのシミュレーション結 果として図2 に示す.図2 よ

り,学習率 a=0,1 の場合にグラフの形が大きく変わる.これは,学習率 a=0 では Q 値が更 新されないため,学習率 a=1 では Q 値が-1,0,1 のどれかをとり,ランダムで送信スロット を決定する端末が多くなるためであると考えられる.また,飽和状態において,学習率 0<a<

1 では,学習率を低くするほどスループットが高くなる.しかし,非飽和状態においては,パケ ット発生確率が低い際に,学習率 a=0,1 の場合,学習率 a が高い場合のスループットが高く なっている.これは,送信スロットを学習により決定する ALOHA-Q では,パケットの発生が減 少することで,冗長なスロットが増加するためであると考えられる.

図 2.ALOHA-Q のスループット特性

成果資料目録

参照

関連したドキュメント

研究実績 の概要 て仮説モデルを検証した.倫理的配慮:岡山県立大学倫理審査委員会の承認(受付番号21- 65)を得た. 【結果と考察】307部回収,305部を分析対象とした.構造方程式モデリングの適合度は, RMSEA = 0.070,CFI = 0.917,TLI = 0.894であった.社会的スキルとSRLは実習適応感

Okubo et al.," An experimental verification of variable phase shifting characteristics of nonreciprocal CRLH-WG using folded rectangular waveguide," 2nd Thailand-Japan Microwave Student

パーソナライズされた不具合を含む変更の予測手法に対する Cross-Project Defect Prediction手法の有効性の検証 ソースコードを解析して得られる特徴量(メトリクス)と過去の不具合発生履歴を組み 合わせて、不具合を含む可能性が高いモジュールを予測する手法 Software Defect

研究実績 の概要 2.「Web基本英語学習支援システム」との連携に向けた改良 英語でのプレゼンに向けた原稿作成や発表練習において、その基礎となる英語力の習得 は必須である。特に、原稿を準備することのできない質疑応答は英語力を問われる。 自分に合った習熟度で学習できるWeb英語学習を活用することで、学生の英語力向上に

過去のリリースに基づいたパラメータ設定がソフトウェア不具合箇所を自動特定する 技術の性能に及ぼす影響の実証的評価 現在提案されているBug Localization手法はいずれも何らかの調整可能なパラメータを持 っている。パラメータの調整が性能に及ぼす影響は大きいと考えられるが、影響の度合い について検証した研究は一部に限られる。 Bug Localization