国際排出権取引市場におけるエージェントベース シミュレーションの時系列データの分析法
仲田 知弘
電気通信大学大学院 電気通信学研究科 博士 ( 工学 ) の学位申請論文
2010 年 3 月
国際排出権取引市場におけるエージェントベース シミュレーションの時系列データの分析法
博士論文審査委員会
主査 渡邉 成良 教授
委員 西野 哲朗 教授
委員 吉浦 裕 教授
委員 高玉 圭樹 准教授
委員 高橋 裕樹 准教授
著作権所有者 仲田 知弘
2010
Analytical method of time series data via Agent-based simulations in
international Emissions trading market
Tomohiro Nakada
ABSTRACT
A traditional methodology of a computational modeling and simulation corresponds to an effective object and an output of it. It is important to show the legitimation and validity of computational modeling and simulation. However, this methodology of a computational simulation covers the thought experiment to build a computational mod- eling based on hypothesis in the future phenomena and the unknown world. One of the computational simulation is Agent-based Simulation (ABS). The “agent” in ABS is a computational model as individuals. We can observe a phenomena of whole system by interaction between individual agents. The relationship between modeling and output of modeling is not clear.
First, to clarify the feature of computational output using scenario analysis, this paper proposes the model of participating nation and compliance mechanism according to Kyoto Protocol in international emission trading market via ABS. Second, this paper proposes the classification method using Bayesian analytical method (BAM) to classify the time series data in the international emissions trading market depend on ABS and compares the case with Discrete Fourier transform analytical method (DAM).
These analytical methods have revealed the following results: (1) the computational
worst case by the scenario analysis; (2) the analytical methods of BAM and DAM show similarity and dissimilarity to classify multiple time series data in ABS; (3) One possibility is to infer the boundary conditions from the results of BAM; (4) By using two dimensions of BAM, we are easy to understand from multiple time series data.
In conclusion, our proposed model shows the feature of participating nation and com- pliance mechanism by scenario analysis. And, our proposed analytical methods classify time series data in the international emissions trading market via ABS. We can contribute to the development of design and analytical methods of social system in ABS.
国際排出権取引市場におけるエージェントベース シミュレーションの時系列データの分析法
仲田 知弘
概要
近年, シミュレーションの研究は, 計算機能力の発達により, 数多くの計算機モデルの 出力を取得できるようになった. また, センサと計算機の組合わせによって, 対象の出力 の様々なデータを取得できるようになり, 対象の出力と計算機モデルの出力の一致が可能 になりつつある. そして,従来の計算機モデルは,対象の出力に一致することで正当性·信 頼性を確保してきたため, 対象世界の出力との比較が重要であった. その中で, 計算機モ デルは,未知な世界や将来予測などの対象の出力が無い状況において, 仮説に基づくモデ ル構築をおこない, 思考実験としての役割を担いはじめた. その計算機モデルの一つが, Agent-based Simulation (ABS)であり,エージェントを人間に見立てて, その相互作用か らシステム全体として現象を造りだすことで,社会や経済システムの分析方法として着目 されている. しかし, この ABS の構築方法と出力の関係が明らかでない. そのため,擬似 的な意思決定モデルを構築して,その相互作用の現象を分析することが必要である. そこ で, 本研究は, この ABS を用いて未知なる国際排出権取引市場の参加国モデルと遵守制 度を構築し,取引市場の価格変動を分析する. なぜなら,遵守制度の導入が,排出権取引市 場の価格にどうのように働くかは試行しなければわからないからである. また, そのよう な計算機モデルの出力は,相互作用の影響を受けることから複雑な現象となり, 計算機モ デルの複数の出力から一致によって判定することが難しい. そこで, 距離に基づく分析方 法が,計算機モデルの出力を類似や相違によって分類できるかどうか検討する.
そこで, 本研究は,未知な国際排出権取引市場の価格変動や規則による現象を造りだす ため, ABS に基づく参加国モデルと遵守制度を提案する. そして, その提案した計算機モ
デルが造り出す現象をシナリオ分析することにより,計算機モデルにおける遵守制度の特 徴を抽出できると考える. また, 取引市場の価格変動のような時系列データを分類するた め, 距離に基づく分析方法としてBayesian analysis method (BAM) を提案する. 複数の 複雑な時系列データを距離によって類似と相違に分けることにより,分析者の負担軽減や 主観的な判断の軽減に繋がると考える. そして,何を基準に計算機モデルの出力を分類す るのかによって, その類似や相違などの距離は変わってくる. そこで, 計算機モデルの設 計方法と分析手法の提案し, その有効性を次の手順によって確認する. (1) ABSにおける 参加国の意思決定モデルと遵守制度を構築し,遵守制度の有無と削減目標の割合を変更し てシミュレーションを実施する. (2)そのシミュレーション結果をシナリオ分析をおこな い, 遵守制度の有無や削減目標の割合の境界条件, ベストケース, ワーストケースなどか ら特徴を抽出する. (3) 距離に基づいた分析方法 BAM が, 複数のシミュレーション結果 を用いて類似と相違に分類できるかどうか試みる. また, 先行研究である離散フーリエ変 換を用いた定量化手法(DAM)と比較し, 距離に基づく分析方法であるBAMとDAM の 特徴を理解する.
その結果, 本研究によって以下の知見が得られた. (1) 仮説に基づいて構築した計算機 モデルは, シナリオ分析によって境界条件, ベストケース, ワーストケースがなどが明ら かになった. 特に, 削減目標と遵守制度の有無による違いが,計算機モデルの出力(排出権 の市場価格, 参加国のガス排出量)に影響を示した. また, 提案した計算機モデルは,削減 目標の1%の違いを現すことから,地球温暖化防止の一つの取り組みである国際排出権取 引市場の分析に役立てられる. (2) BAM と DAM による分析手法は, 時系列データを単 純に図示する方法に比べ, ABS の差異を提示した. (3) BAM による提案手法は, 変動す る時系列データを類似と相違に分かれる場合,類似のグループと相違のグループを比較す ることで, シナリオ分析による境界条件の候補を提示する可能性がある. (4) BAM の視 覚化は,上下左右による二次元の表示が,複数の時系列データの類似と相違を距離で示し, 理解しやすい. なぜなら, 1次元は長さを示すだけで類似と相違の判断を分析者らがおこ なう必要がある. 3次元は,比較するデータによって座標の位置がわかりにくく,類似と相 違の判断がしにくい.
そして, 提案した国際排出権取引市場の参加国モデルと遵守制度は, 排出権の市場価格 と参加国のガス排出量の変動特性分析できることを示した. また, 提案したBAMによる 分析方法は, 時系列データの変動を距離で表す分析法として有効性を示した. このことか ら, ABS における社会システムの設計と分析の方法論の展開に貢献できた.
目 次
1 序論 1
1.1 背景 . . . . 1
1.2 目的と方法 . . . . 4
1.3 論文の構成 . . . . 6
2 国際排出権取引市場における時系列データの分析法 8 2.1 国際排出権取引市場 . . . . 8
2.1.1 国際排出権取引市場におけるABS . . . . 9
2.1.2 エージェントベースシミュレーション . . . . 10
2.2 国際排出権取引市場の遵守制度 . . . . 13
2.2.1 ガス排出量の割り増し削減 . . . . 16
2.2.2 排出権の販売禁止 . . . . 18
2.3 関連研究 . . . . 18
2.4 時系列分析 . . . . 20
2.4.1 経済時系列データの分析方法 . . . . 20
2.4.2 ABSにおける経済時系列データの分析方法 . . . . 20
3 国際排出権取引市場の参加国モデルとシナリオ分析 22 3.1 国際排出権取引の参加国モデル . . . . 22
3.1.1 概要 . . . . 22
3.1.2 状態 . . . . 25
3.1.3 ルールセットによる行動選択 . . . . 25
3.1.4 行動 . . . . 26
3.1.5 行動選択の優先順位の変更 . . . . 27
3.2 シミュレーション . . . . 28
3.2.1 シナリオ分析 . . . . 28
3.2.2 設定条件 . . . . 28
3.3 シミュレーション結果 . . . . 29
3.3.1 遵守制度の導入と非導入 (Cases-A1とA2) . . . . 29
3.3.2 ガス排出量の削減目標が同じ場合 (Cases-B1とB2) . . . . 32
3.3.3 ガス排出量の削減目標が異る場合 (Cases-C1 と C2) . . . . 34
3.4 考察 . . . . 38
3.4.1 遵守制度の導入と非導入 (Cases-A1とA2) . . . . 38
3.4.2 ガス排出量の削減目標が同じ場合 (Cases-B1とB2) . . . . 38
3.4.3 ガス排出量の削減目標が異る場合 (Cases-C1 と C2) . . . . 39
3.5 まとめ . . . . 40
4 距離に基づく時系列データの分類法 42 4.1 価格変動のある時系列データの分析 . . . . 42
4.2 分析手法 . . . . 43
4.2.1 対象とする経済時系列データ . . . . 43
4.2.2 従来手法 . . . . 44
4.3 提案手法 . . . . 44
4.3.1 概要 . . . . 44
4.3.2 BAMによる分布の導出 . . . . 45
4.3.3 分布を用いた分類法 . . . . 45
4.4 実験 . . . . 48
4.4.1 国際排出権取引市場 . . . . 48
4.4.2 設定条件 . . . . 48
4.5 実験結果 . . . . 50
4.5.1 遵守制度の導入と非導入 (Cases-A1’と A2’) . . . . 50
4.5.2 ガス排出量の削減目標が同じ場合 (Cases-B1’と B2’) . . . . 50
4.5.3 ガス排出量の削減目標が異なる場合 (Cases-C1’ と C2’) . . . . 55
4.6 考察 . . . . 60
4.6.1 遵守制度の導入と非導入 (Cases-A1’と A2’) . . . . 60
4.6.2 ガス排出量の削減目標が同じ場合 (Cases-B1’と B2’) . . . . 62
4.6.3 ガス排出量の削減目標が異なる場合 (Cases-C1’ と C2’) . . . . 63
4.7 まとめ . . . . 64
5 考察 65 5.1 Cases-A1と A2, Cases-A1’ と A2’の比較 . . . . 65
5.2 Cases-B1 と B2, Cases-B1’ と B2’の比較 . . . . 66
5.3 Cases-C1 と C2, Cases-C1’ と C2’の比較 . . . . 66
5.4 シナリオ分析と距離に基づく分析 . . . . 67
6 結論 69
図 目 次
1.1 Simulation process . . . . 3
1.2 Traditional methodology and proposal methodology . . . . 3
1.3 The positioning of this study. . . . 5
2.1 Agent-based Simulation . . . . 10
2.2 Decision-making of Agent . . . . 11
2.3 Reinforcement Learning . . . . 12
2.4 Amount of emission and emission right in five years . . . . 14
2.5 Emission reduction targets . . . . 14
2.6 Amount of emission and emission right in five years . . . . 16
2.7 Reduction of emission right . . . . 17
2.8 Three approaches to the validity of simulation results . . . . 19
3.1 Participant nation and emissions trading . . . . 23
3.2 Decision-making of participant nation (agent) . . . . 24
3.3 Time series data under the compliance and non-compliance mechanisms . 31 3.4 Reduction target on Kyoto Protocol vs. −8% reduction target under the compliance and non-compliance mechanisms . . . . 32
3.5 Time series data by changing the emission reduction targets of all partici- pant nations . . . . 33
3.6 Changing the emission reduction targets under the compliance and non- compliance mechanisms. . . . 34
3.7 Time series data by changing the number of the nations with +8% emission
reduction target . . . . 36
3.8 Different combinations of the emission reduction targets under the com- pliance and non-compliance mechanisms . . . . 37
4.1 cases-A1’ and A2’ (the second dimension) . . . . 51
4.2 cases-A1’ and A2’ (the first dimension) . . . . 51
4.3 Market price with the non-compliance. . . . 52
4.4 Market price with the compliance . . . . 52
4.5 Comparison of DAM, BAM and Time series data . . . . 53
4.6 Comparison of Time series data and BAM . . . . 54
4.7 cases-C1’ and C2’ (the first dimension) . . . . 60
4.8 cases-C1’ and C2’ (the second dimension). . . . 61
4.9 cases-C1’ and C2’ (the third dimension) . . . . 61
5.1 Exponential function (f(x) = ex+e2−x) . . . . 68
5.2 BAM using exponential function. . . . 68
表 目 次
3.1 Q-table of participant nation . . . . 27
3.2 Scenario of compliance mechanism and emission reduction targets . . . . 29
3.3 Parameters of participant nation, compliance mechanism, Q-Learning . . 30
3.4 Number of nations with the carbon emission reduction targets +8% or−8% 35 3.5 Total amount of emission and emission right of 39 nations in theory . . . 39
4.1 Experiment condition of compliance mechanism and emission reduction targets . . . . 49
4.2 Parameters of participant nation, Q-Learning . . . . 49
4.3 Results of MDS using DAM . . . . 56
4.4 Results of MDS using BAM . . . . 57
4.5 Distance depending on DAM. . . . 58
4.6 Distance depending on BAM. . . . 59
第 1 章 序論
1.1 背景
近年, 地球温暖化対策の一つとして, 温室効果ガスの削減を目指した排出権取引1(ET:
Emissions Trading)市場が各国で検討されている[1]. 排出権取引は,温室効果ガスを削減
するために予め目標としたガス排出の量を排出権と定め, 温室効果ガスの排出量が排出権 を上回る側と下回る側によって排出権の売買をおこなう方法である. 現実の排出権取引 市場は,企業または国の参加する市場に分けることができる. 企業が参加する排出権取引 市場は, イギリスやノルウェーなどの国家主導で運用される市場とシカゴ気候取引所など の民間主導で運用されている. そして, 日本の場合は, 環境省によって自主参加型国内排 出枠取引市場を立上げ, 企業の自主的·積極的な温室効果ガスの削減の一環として取り組 むように促しているが, 参加企業が少なく, 社会的な実験を試みている段階である [2]. ま た, 国が参加する排出権取引市場は, 欧州連合(EU: European Union)の排出権取引市場 (EU ETS: EU Emissions Trading Scheme)と国際排出権取引市場がある. 欧州連合の排 出権取引市場は, 2005年からEUの参加国による排出権取引が実施されている. 国際排出 権取引市場は,世界中の京都議定書に賛同した参加国が排出権を取引する市場で, 2008年 から実施されている. これらの様々な排出権取引市場は, 企業間や国家間の排出権取引に おける制度を検討しながら実施しているため, 各取引市場において異る規則が存在する.
1排出枠取引,排出量取引と呼ぶ場合もあるが,本稿では排出権取引を用いる
そして, 国際排出権取引市場は, 遵守制度と言う規則が実施されている. その規則の導入 が排出権取引市場の価格にどうのように働くかは試行しなければわからない. その中で 計算機モデルを用いたシミュレーション研究は, 参加国モデルや規則を仮想的に構築する ことができる.
シミュレーション(simulation)の語源は“Simulate”であり, 「試してみる」, 「試行」
に翻訳されており, 様々な案を試行錯誤することの意味である[3]. シミュレーションは, 様々な試行錯誤を計算機上でおこなう思考実験である. そして, 従来の計算機モデルによ るシミュレーションの手順は, 次の図1.1のように5段階の手順でおこなわれている [4].
まず, 始めに対象を観察し, 対象の振舞いや分析する範囲を定め, 対象世界の特徴を抽出 して計算機モデルを作成する. その後, 計算機モデルを完成させ, シミュレーションを実 行する. そして, シミュレーション結果と評価基準を照らし合わせ, 特徴抽出やモデルの 修正,シミュレーションの再実行を繰り返し, その対象世界の分析やシステムの最適値な どを発見した. 一般的に従来のシミュレーションは, その結果の正当性や信頼性を確保す るため,図1.2の左側のように対象の出力と計算機モデルの一致を確認している. しかし, 図1.2の右側のように対象を想定した仮定で作られた計算機モデルは,対象の出力が無く, モデルの出力と比較ができないため, 従来の計算機モデルのように正当性·信頼性を確保 できない. また, 対象の出力が無いため,対象の特徴を抽出ができず,計算機モデルの作成 ができない.
そこで, 対象を仮定し, 計算機モデルを構築する方法としてエージェントベースシミュ レーション (ABS) がある. ABSは,エージェントの相互作用を人間同士の相互作用に見 立て, その相互作用によって引き起こされる現象を模擬する手法である [5] [6]. そこで, ABS は, 人工生命や人工市場に応用され, 人工市場の中では, 図1.3のように株式取引市 場や外国為替取引市場,電力取引市場について研究されてきた[7] [8] [9] [10] [11] [12]. そ の中で, ABS に基づく国際排出権取引市場の構築方法がこれまでに提案され,擬似的な取 引の結果,取引市場の価格変動が観測できることから市場形成の一例を示したと報告して
いる [13] [14] [15] [16]. しかし, 国際排出権取引市場は開始から間もないため, 実世界に
対象の観察
特徴の抽出
モデルの作成
シミュレーション
結果の評価
(対象とモデルとの比較)
修正または繰り返し実施
図 1.1: Simulation process
(対象とモデルとの比較:有) (対象とモデルとの比較:無)
モデル 対象
特徴抽出
入力
出力 出力
一致の確認
モデル1 対象
出力
入力 入力
モデル2
出力
試行
対象 入力
出力 仮定
比較 本研究の範囲
入力
図 1.2: Traditional methodology and proposal methodology
ミュレーション結果は,被験者を用いた実験経済学によるデータとの近似[14] [15] [17]や EUの排出権取引市場のデータとの近似[16]によって妥当性を示してきた. しかし,シミュ レーションの用いられ方は,シミュレーション結果と実世界のデータを近似させる立場と, 仮説による振舞いを検証するための思考実験の立場がある [18] [19]. 本研究は, 後者の立 場を支持し, 人的あるいは社会的リスクを伴うことなく, 思考実験としてシミュレーショ ンを造り出すことである. そこで, 本研究は, 未知なる国際排出権取引市場の参加国モデ ルと遵守制度の影響から取引市場の価格変動を造りだして分析する. 本研究は, 図1.3に 示すように, 対象の出力が無いシミュレーションであり,経験的アプローチや理論的アプ ローチとの一致を目指すのではなく,シミュレーション結果の分類や特徴の抽出を計算的 アプローチの中で試みる.
1.2 目的と方法
本研究の目的は,対象の出力と計算機モデルの出力が比較ができない計算機モデルの構 築と計算機モデルの出力の評価手法を検討することである. そして, 本研究で扱うシミュ レーションは, 複数のエージェントの相互作用によって現象を造り出すため, 計算機モデ ルと計算機モデルの出力の関係が明らかではない. そこで,実施されて間もない国際排出 権取引市場の参加国モデルを構築し,シミュレーション結果から計算機モデルの性質を分 析する. また, 距離に基づいた分析法を提案し, 複数の時系列データを直接見るのではな く, 距離によって類似や差異を判断できる方法論を検討する. そこで, 本研究は, 以下の 手順によって, 計算機モデルを構築し,それぞれの分析法によって確認した. (1)参加国の 意思決定モデルと遵守制度を構築し,遵守制度の有無や削減目標を変化させてシミュレー ションを実施する. (2) シナリオ分析によって, 計算機モデルの出力から境界条件やベス トケース、ワーストケースなどの特徴を抽出し, 計算機モデルの差異を理解する. (2) 距 離に基づいた分析方法を提案し, 複数の計算機モデルの出力を分類し, その類似と相違を 距離で判断する.
(対象とモデルとの比較:有) (対象とモデルとの比較:無)
理論的アプローチ
経験的アプローチ
計算論的アプローチ 智(電力取引市場)2007
西條(排出権取引市場)2006 OKANO(排出権取引市場)2003
水田(排出権取引市場)2001, 2004
織田(排出権取引市場)2003
MATSUMOTO(排出権取引市場)2008
和泉(外国為替取引市場)2001 田中(電力取引市場)2004 Arthur(株式取引市場)1996
高階(株式取引市場)2000
本研究
シナリオ分析による結果の評価 BAMによる結果の評価
Path(株式取引市場)1994
山形(温室効果ガスの国際合意形成過程)2005
図 1.3: The positioning of this study
1.3 論文の構成
本論文は, 第六章の構成からなり,各章の概要は次のように述べる.
第二章: 国際排出権取引取引市場における時系列データの分析法 第二章では, まず 国際 排出権取引市場について概説し, エージェントベースシミュレーション(ABS) を用 いた計算機モデルの経緯やその特徴について説明する. そして, 本研究が着目する 国際排出権取引市場や遵守制度と ABS における制度設計について概説する. 次に, 従来の時系列データの分析法について概説し, その特徴について説明する. そして, これまでのABSにおける時系列データの分析方法と比較し,本研究における分析手 法について概説する.
第三章: 国際排出権取引取引市場の参加国モデルとシナリオ分析 第三章では, 対象の出 力と計算機モデルの出力を確認できない国際排出権取引市場の参加国とその規則で ある遵守制度を取り上げる. 参加国モデルは,報酬の最大を求めていくと仮定し, 意 思決定に強化学習を用いることで参加国モデルの行動が変化する. また, 遵守制度 は,それぞれの参加国の状況に応じて制約するため,個々の参加国モデルに対して制 約を課せることができる. これらの仮説とシナリオ分析によって, 計算機モデルに よる出力の特徴を理解する.
第四章: 距離に基づく時系列データの分類法 第四章では, 計算機モデルの出力の分析方 法について取り上げ, 第三章で提案したモデルによるシミュレーション結果を分析 する. 計算機モデルの出力が対象の出力と比較できない場合, そのモデルの類似や 相違は対象の出力に基づいて判定ができず, 正当性や信頼性を得るのが難しい. そ こで, 少なくても計算機モデルの中で, 類似や相違を明らかにすることで,計算機モ デルの出力の結果を検討していくことが計算機モデルの発展に重要である. そこで, 距離に基づく分析としてBAM (Bayesian analysis method)の提案をおこない, その 結果について述べる.
度のシナリオ分析と, 第四章で提案した時系列データの分析法による結果から考察 する. シナリオ分析によって, この計算機モデルによる出力の特徴を抽出すること ができた. しかし,計算機モデルの出力が多くなることで分析者の負担が増加する.
モデルの出力は,分析方法(DAMとBAM)によって類似と相違を距離によって示す ことを可能にした. そこで, 複数の時系列データを並べて比較するより複数の時系 列データを距離による判別が容易になるため, 分析者の負担を軽減した.
第六章: 結論 第六章では,本研究の成果を取りまとめ,今後の課題について述べる. 本研 究は, 計算機モデルの出力と対象の出力が比較できないとして, 国際排出権取引市 場における ABS と その分析手法を提案し, 検証をおこなった. その結果, 複雑な 時系列データをそれぞれの分析によって, その計算機モデルの出力の特徴を分類し た. そして, 本研究は, ABS による社会システムの設計と分析方法の展開に貢献し た. しかし, 距離によって分類されたデータの性質や機能説明までは明らかにでき ず, 今後の課題となった. また, この距離に基づく分析方法は,計算機モデルの出力 に限った手法ではなく, 他の分野に応用可能であり, 今後検討する必要がある.
第 2 章
国際排出権取引市場における時系列デー タの分析法
2.1 国際排出権取引市場
国際排出権取引市場は,地球温暖化の温室効果ガスの抑制のため, 市場原理を活かして 地球全体の削減費用を少なく達成する市場の一つである. 各国は, 温室効果ガスの削減目 標を定め, 放出可能な温室効果ガスの排出量を“排出権”と呼び,ガス排出量の権利を売買 する. この排出権を参加国同士で取引する市場の一つが, 国際排出権取引市場である. そ して,全ての参加国の国内の排出量の削減が難しいことから, 削減目標を達成させるため に規則として遵守制度を導入した [20]. 温室効果ガスの削減が容易い国は排出権を売る ことで利益が得られ, 温室効果ガスの削減に対するインセンティブ(誘因)が生まれる. ま た, 温室効果ガスの削減が難しい国は,他の国から排出権を買うことで温室効果ガスの削 減できる. このことから, 排出権の売り手と買い手が存在し, 排出権の売買が可能となる.
この国際排出権取引市場の役割は, その環境負荷を低減するために経済的手法(市場原理) によって, 世界全体の温室効果ガスの削減である. そのため, 国際排出権取引市場の継続 が重要な課題である.
現在,排出権取引市場は, イギリスやノルウェーなどの国家主導で運用される市場とシ カゴ気候取引所などの民間主導で運用される市場があり, 様々な取引市場がを開設され
ている. 欧州連合(EU: European Union)は, 2005年からEU内において排出権取引(EU ETS: EU Emissions Trading Scheme)市場を実施し, EU内の国家に課せられた温室効果 ガスの削減目標を目指している. また, 日本の環境省は, 自主参加型国内排出権取引市場 を立上げ, 企業の自主的·積極的な努力を促し, 費用効率的かつ確実に温室効果ガス排出 量の削減を達成することを目指している[2]. 各国は, 企業間や国家間の排出権取引におけ る制度を検討しながら実施している. その中で,国際排出権取引市場に関する各国の削減 目標がは, 気候変動枠組条約(UNFCCC)で議論している. 近年, UNFCCCの第13回締 約国会議(COP13)において, U.S.Aが2013年以後のポスト京都議定書の温室効果ガス の削減目標の設定に同意することを表明した[21]. しかし, コペンハーゲンでおこなわれ た第15回締約国会議(COP15)において, 世界中の国の同意が得られず, 各国のポスト 京都議定書の削減目標は締結されない事態になった. このように, 国際排出権取引市場は 2008年から実施されているが,その制度設計や継続事態が不確かである.
2.1.1 国際排出権取引市場における ABS
ABS は, 図2.1のように計算機上に仮想的な意思決定主体(エージェント)と仮想的な 取引市場のモデルを構築し, 擬似的な取引をおこなうことにより,その現象を分析するこ とができる. ABS を用いた国際排出権取引市場では,エージェントを参加国とし,仮想的 な市場モデルを排出権取引市場として構築し,擬似的な取引をおこなっている. その結果, ABS を用いることで取引市場の価格変動が観測できることから, 市場形成の一例を示し たと報告している [13, 14, 15, 16]. しかし,これまでの ABS による国際排出権取引は, 遵 守制度の影響を考量した長期的な排出権の市場価格の分析がされていない. そこで,国際 排出権取引市場の参加国モデルを仮定し,遵守制度の影響として様々な視点から排出権の 価格変動と参加国の排出量の変動を分析する.
本研究のエージェントは, 排出権取引市場の価格を知覚し自らの行動を決定する自律 エージェントとして扱う. エージェントの自律性, 適応性を表現する方法としては, 強化 学習が適していると考えられている [22]. 国際排出権取引市場は, 開設されて間もない取
Environment
Agent
Price of rights
Agent Agent
Agent Agent
Agent
図 2.1: Agent-based Simulation
引市場であり, 不確かな環境である. 予め人間が設定するような意思決定では, そのよう な未知な環境に適応できないと考える. そこで, 本論文では, 人間の行動の集まりを国の 政策決定として捉え, 強化学習を用いるエージェントとする. 強化学習を用いたエージェ ントは, 未知なる環境においても, 利益の報酬を手掛かりに自分の行動を決定する. その ため,強化学習を用いたエージェントは, 報酬を獲得するために行動戦略を変更すること ができることから, 環境が変化しても新たな知識(環境に応じた適切な行動選択)を与え る必要がない利点がある [23].
2.1.2 エージェントベースシミュレーション
エージェントベースシミュレーション (ABS: Agent-based Simulation)は, 1990年代に 国内外で議論されるようになり, Santa Fe研究所のArthurら[9] [24]による人工株式市場 が現実世界の経済システムに似通った現象を造り出したことをきっかけに, 様々な人工市
Environment
Agent
Decision-making
Sensor: s Effector: a
Rule Set: S → A
s a
S A
図 2.2: Decision-making of Agent
場の研究がおこなわれるようになった. ABS は, 1980年代の分散人工知能 [25]から影響 を受け,「知能」をもつエージェントの相互作用によって現象の特性やエージェントの設 計に焦点が当られた. ここ言う知能とは, 図2.2のように,環境を知覚し,その情報に基づ いて自らの行動を決定できる独立したプログラムを指すことが多く,それを自律的な行動 主体と捉える. そこで, ABSは, 自律的なエージェントの集団から構成される分散システ ムの一種である. その振舞いは, エージェントの局所的な相互作用によって決定され, シ ステム外部からエージェントを制御する者は存在しない. また, システムの振舞いは個々 のエージェントの意思決定に影響を及ぼす. このような環境の中で,エージェントは自ら の目的を達成するように環境に対して適応的な行動をするため, システムの振舞いは非常 に複雑であり, エージェントの行動と相互作用の関係を明らかにすることは難しい. そこ で, 自律的な行動主体の相互作用が, 社会や経済システムの現象を表していると捉えるた め, エージェントの設計方法や ABS の分析手法が重要である.
エージェントは, 動的な環境に対して, 自らの目標を達成するように行動をとらなけれ ばならないため,事前に行動ルールを設計することは困難であり,設計したルールが複雑 な現象に対して永久に有効である保証はない. そこで, エージェントは,図2.2に示すよう に3つの要素で構成される.
Environment
Agent
Decision-making
Sensor: s Effector: a
Rule Set: S → A
s a
S A
Reward Evaluation Function
図 2.3: Reinforcement Learning
Sensor 環境の状態を認識し, 内部表現 s∈S に変換し,意思決定をするルールセットの 入力となる.
Decision-making あるセンサ情報 s に対して, 何らかの行動情報a ∈Aを対応づける.
条件S - 行動A の組であるルールセット RuleSetによって表す.
Effector 意思決定によって決められた行動情報 a に基づき,環境に対して行動として出
力となる.
この枠組みの中で, 自律性や適応性を表現する方法として強化学習がある[22]. 強化学 習は, 図2.3のように,エージェントが環境から得られる報酬という強化信号を用いて, 自 らの行動を評価し, この報酬を最大化することによって,それぞれのエージェントの意思 決定を変える方法として用いられている. 強化学習におけるQ-learningは, 無限界の試行 を仮定することによって, 意思決定の収束性が理論的に保証されている.
2.2 国際排出権取引市場の遵守制度
国際排出権取引市場の遵守制度は,各国が削減目標を約束期間内に達成できない場合の 京都議定書に基づく規則 [21]であり, その規則が排出権取引市場に影響があると考える.
また,遵守制度は,参加国の温室効果ガスの排出量の削減を促進する機能を持ち,現実の国 際排出権取引市場で運用されている. この遵守制度は, 京都議定書によって確立し, 温室 効果ガスの削減のための法的な拘束力がある. 京都議定書に同意する参加者国は,その法 的な拘束力の下で, 参加国自ら成し遂げる排出量の削減目標を設定しなければならない.
参加国の排出量の削減目標の達成を評価するために,遵守制度は,図2.6の右端が示す5年 分の約束期間における排出量と排出権を比較することで参加国の達成度合いを照合する.
例えば, 図2.6のように, 参加国の2008年から2012年までの約束期間における温室効果 ガスの排出量と排出権を比較し, 排出権が排出量を下回った場合,それぞの参加国に2013 年以降に規則を適応し, より温室効果ガスの削減を強制される. 一方, 排出権が排出量を 上回った場合, 規則を適応されず, さらにガス排出量の削減に取り組むことになる. そこ で, 図2.6の排出量は黒棒グラフで示し,排出権は斜線棒グラフで示す. 1年後の排出権の 斜線棒グラフは, 図2.6の上部の長方形の中にある毎月の排出量の合計として示す. 毎月, 排出量と排出権を積み立てることで1年分とし,それぞれの1年分の合計によって5年分 の排出量と排出権として表す.
そして, 現在, 国際排出権取引市場の約束期間は, 京都議定書に基づき, 図2.5のように 第一期間を2008年から2012年までとしている . その後, 第二期間が2013年から始まる ことになっており, 五年ごとの排出量と排出権の比較が繰り返しおこなわれ, 遵守制度の 判定がされる. 現時点では, ポスト京都議定書が決まっておらず, 図2.5の2013年以降の 各国の削減目標は定まっていない. しかし, 地球温暖化防止のため, 温室効果ガスの削減 がより一層求められていくと考えられる.
京都議定書の遵守制度は, 現在の約束期間で参加国の削減目標を達成できない場合, 二 つの規則がある [21]. 一つ目は, 次の約束期間に付与される排出権の量を遵守制度によっ て削減する. すなわち, 次の約束期間により多くの排出量を削減する必要がある. 二番目
10 20
2008 2009 2010 2011 2012
600 900 1200
Total of five years 300
1 2 3 4 5 6 7 8 9 10 11 12
emission right amount of emission
time [year]
time [month]
Amount
図 2.4: Amount of emission and emission right in five years
1990 2008
| 2012
2013 | 2018 emission right
amount of emission
Emission Reduction Targets of Kyoto Protocol Emission Reduction Targets of Post Kyoto Protocol
図 2.5: Emission reduction targets
は, 次の約束期間中, 国際排出権取引市場において排出権の売りを禁止する. 参加国は他 の参加国から排出権を買うか, 国内の排出量を削減することで削減目標の達成するように 行動を決定しなければならない. すなわち, 取引市場による排出権の買いまたは国内の排 出量の削減のどちらかの行動を選択しないと参加国の削減目標が達成できないことを意 味する. そこで, 排出量と排出権の量は, それぞれ1ヶ月をtimeで示し, 60ヶ月で5年分 を表す. 遵守制度は, 5年ごとに更新し,更新の回数をCP で表す.
ECP =
∑60 time=1
Emissiontime (2.1)
ERCP =
∑60 time=1
Righttime (2.2)
上の式では, 5年分の排出量(ECP)は排出量の1ヶ月分(Emissiontime)の合計として表 す. また排出権(ERCP)は, 排出権の1ヶ月分の量(Righttime)の合計として表す. 参加国 の排出量が排出権を越えない場合, その参加国は次の約束期間において通常取引になる.
すなわち, 参加国は排出権を買うことと売ることができる. しかし, 参加国の排出量が排 出権を越えた場合,その参加国は次の約束期間に売ることを規制された取引になる. すな わち,参加国は国内の排出量を削減するか, 取引市場で排出権を買うだけになる.
排出量(Emissiontime)と排出権(Righttime)はそれぞれ次のように式(2.3), (2.4)と(2.5) として定義される.
Emissiontime=ConsEtime−DRtime (2.3)
Righttime = AAU(CP)
60 ±ETtime (2.4)
AAU(CP)=Eyear1990×5×(1 + T arget
100 )(CP) (2.5)
これらの式では,参加国のtimeヶ月目のガス排出量(Emissiontime)は,timeヶ月目の一 定の排出量をConsEtime, 国内削減量をDRtimeとして定義する. 参加国のtimeヶ月目の
10 20
2008 2009 2010 2011 2012
600 900 1200
Total of five years 300
1 2 3 4 5 6 7 8 9 10 11 12
emission right amount of emission
time [year]
time [month]
Amount
図 2.6: Amount of emission and emission right in five years
排出権(Rightstime)は,timeヶ月目に割当てられた排出権の量をAAUtime(例えば,AAUCP
÷ 60ヶ月), そして排出権取引市場におけるtimeヶ月目の売買結果をETtimeとして定義
する. 最後に, 約束期間の繰り返し回数CP における割当てられた排出権の量(AAUCP) は, 基準となる1990年の排出量Eyear1990, 削減目標T argetから求める.
2.2.1 ガス排出量の割り増し削減
参加国の排出権が,現在の約束期間において排出量を上回るほど十分持っていない場合, 割当てられた排出権(AAUCP)は, 図2.7の右が示すように遵守制度に基づき,次の約束期 間のペナルティの量を削減される. これは, 参加国がその国で発生する排出量をより多く 削減することを意味する. 図2.7の左において, 白いボックスは排出権を示し, 次期期間
の2013-2017が示すように5年ごとに一定の量を減らされる. この削減に加えて, 許可さ
れる排出権の量は,さらに参加国が削減目標に達成できなった分を灰色ボックスのペナル ティの量として減らされる. ペナルティの量は,京都議定書に基づき現在の約束期間にお ける排出量の過剰部分に1.3倍かける. 次の約束期間における参加国の5年分の排出権は
2008-2012 2013
-2017 2008
-2012 2013 -2017
Reduction of emission right in ordinary case
Reduction of emission right in the penalty case
AAU(set emission right) penalty
図 2.7: Reduction of emission right
次のように計算される.
ERCP+1 =AAUCP+1−penaltyCP (2.6)
penaltyCP =
(ECP −ERCP)×P deg (if ECP > ERCP) 0 otherwise
(2.7)
上の式では, 次の期間の5年分の排出権(ERCP+1)は, AAUCP+1 −penaltyCP から求
める. penaltyCP は, 参加国がさらに排出権の量を減らすペナルティの量を示す. この
ペナルティの量は, 参加国の発生するガス排出量が排出権を上回る場合(言い換えれば, ECP > ERCP), (ECP −ERCP) × P deg から求める. 一方, 反対の場合(言い換えれば, ECP ≤ERCP), ペナルティの量は0である. ここで, P degはペナルティの割合を示し, 京 都議定書に基づいて1.3を設定する. このペナルティの量(penaltyCP)は, 参加国に現在 の約束期間よりも次の約束期間の排出量の削減を強制する.
2.2.2 排出権の販売禁止
参加国の排出権が, 現在の約束期間においてガス排出量を上回るほど十分持っていない 場合, 参加国はコストを払って国内削減の実施や排出権取引市場で排出権の買いをおこな うために排出権の売りを禁止される.
2.3 関連研究
経済システムの分析は, 図2.8のように主に計算的アプローチ(エージェントベースシ ミュレーション),理論的アプローチ(ゲーム理論など), 経験的アプローチ(実験経済学な ど)に分けられる[26]. 理論的アプローチの一つであるゲーム理論は, 意思決定理論の一 つで, プレイヤー(player), 戦略(strategy),利得(payoff)という3つの要素の関係を, ルー ルとして制約条件を論理的かつ理性的に記述する方法である[27] [28]. 経験的アプローチ の一つである実験経済学は, 検証したい経済理論に必要な環境を実験室内に設計し,被験 者を用いて実験室のなかで検証する方法である[29] [30]. この図2.8は, シミュレーション 結果の妥当性の一つとして, それぞれのアプローチ結果がどのような条件において一致す るのか検証することを提案している. そして,エージェントベースシミュレーションによ る出力がゲーム理論と比較し, 類似した結果を得ている [31]. また, エージェントベース シミュレーションによる出力が,実験経済学による出力と比較し、類似した結果を得てい る[17] [14] [15].
一方, 計算的アプローチと比較するのではなく, それぞれの分野において, 排出権取引 市場の研究がされている. 西條ら[30]は, 実験経済学の視点から排出権取引の制度設計に ついて分析し, 国内の排出権取引市場の制度設計について政策提言をおこなっている. 実 験経済学の被験者実験は,謝礼などの費用を必要とし, 被験者の拘束時間を必要とするこ とから分析方法が容易でない. また, 山形ら [32]は, 地球温暖化対策の国際合意形成過程 を微分ゲームを用いて,トップダウン式による事象を分解し, 定式化によって分析してい る. 微分ゲームは, 定式化されたパラメータを変化させ, 時間軸上における変化を観測す
Validity of Simulation results Alignment of computational models or Docking
(cross-element validation)
Theoretical analysis (game theory)
A link to the real world (experimental economics)
図 2.8: Three approaches to the validity of simulation results
るため, 確立されていない取引市場の定式化は難しい. 小池ら[33]は, 日本の科学者が取 り組んでいる地球温暖化問題についてまとめ,政策議論を支える科学的アプローチの国際 制度に関する研究や長期的な制度設計におけるシナリオ検討する研究が必要であると述 べている.
その中で, ABS は, エージェントの相互作用を人の相互作用と仮定し, その相互作用に よって取引市場を表す方法論がArthurらによって確立している[9]. そこで, 対象から仮 定した参加国モデルを用いて, 制度設計の影響を思考実験としておこなう. ABS の有益 な点は, 人間の思考実験では定めにくい境界条件やベストケースやワーストケースをシナ リオ分析によって発見することができる。一方で,大量のシミュレーション結果の中から 特徴あるデータを探し出すのは難しい. そこで,複数のシミュレーション結果を距離で表 示し,発見作業の負担を軽減する。
2.4 時系列分析
2.4.1 経済時系列データの分析方法
経済時系列データは,通常のデータの性質と異り, 将来の時系列データの変動が過去と 現在の変動の影響を受け, 不規則な変動を示すとされている. そこで, 経済時系列データ に関する分析は, 経済学や計量経済学, 金融工学, 数理統計などで長年おこなわれ,不規則 な変動の現象を解明し,その延長線上に将来の変動予測がおこなわれている[34] [35] [36].
これまでの時系列の分析は, 時系列データの季節的な傾向を除去する方法から始まり, 時 系列データの周期成分に着目したフーリエ解析などがおこなわれてきた. しかし, フー リエ解析は, 無限の時系列データに対して定義されているため, 実際の有限の時系列デー タに適用できなかった. そこで, 市場価格のような価格変動の構造は, 確率的に表せると して数学的表現が用いられている. その中で, 時系列データの分析は, 不規則な変動の現 象の将来予測をおこなうため, ARモデル(AR: autoregressive process)やARMAモデル (ARMA: autoregressive moving average process)が提案されている [36]. これらは, 時系 列データにモデルを当てはめるように近似してきた手法である.
これに対し,赤池は, モデルに時系列データを通し, 分析することを提案している [37].
2.4.2 ABS における経済時系列データの分析方法
一方で, ABS における経済時系列データは, 複数のエージェントの行動からなる相互 作用として市場価格などの現象を示すため,時系列データを図示する方法が用いられてき た. そして,この現象に対する時系列データの分析は,エージェントの行動履歴を参照し, 現象の要因を推論している. そのため, ABS における経済時系列データの分析方法は, 一 つ一つの現象とエージェントの行動履歴の参照が必要であり,エージェント数が増えるこ とによって困難になる. そして, ABS による国際排出権排出権取引市場の分析方法は, 分 析者に時系列データを図示する単純 な方法が取入れられてきた [13] [38]. そのため, 市 場価格は, 時系列データの上昇傾向や下降傾向, 継続や停止などの分析に限られた. しか
し, ABSの時系列データは不規則な現象を含んでおり, このような分析では複雑な現象が 十分に説明できない. この問題を解決をするために, 赤池は不規則な現象となる仮想市場 に対して,時間的な変動に着目し, 定常過程に近似した分析手法を提案した[39]. また, 荒 井らはABS のシミュレーション結果を比較する分析手法として,時系列データの定量分 析法を提案した[40]. この時系列データの定量分析法は, 離散フーリエ変換を用いるため 不規則な時系列データをパターンに変換している. しかし, 時系列データは, 分析者の図 示の範囲や表示方法によってパターンが異ることから,非定常性として取り扱う必要があ る. そこで, 本論文の第四章は,非定常性のある時系列データの分析方法として,ベイズ法 を用いた時系列データの分類方法を提案し, その結果について説明する. この方法は, モ デルに時系列データをあてはめる分析であり, ABS から造られれる複数の時系列データ の変動を分類する. 一つ一つのシミュレーション結果を比較するのではなく, 複数の時系 列データを分類することで, 国際排出権取引市場における社会システムの構造の理解に役 立てる.
第 3 章
国際排出権取引市場の参加国モデルとシ ナリオ分析
本章では, 排出権取引市場の参加国を仮定し, エージェントを構築し, そのエージェン トに対して遵守制度を取り入れる. 国際排出権取引市場は, 対象の出力がなく, 従来の計 算機モデルではできないため, 参加国モデルの相互作用と遵守制度によって, 排出権取引 市場の市場価格や参加国のガス排出量を表す. その現象を分析するため,計算機モデルの 出力からシナリオ分析をおこない, 提案した計算機モデルの特徴を理解する.
3.1 国際排出権取引の参加国モデル
3.1.1 概要
本研究におけるエージェントは, 京都議定書の遵守制度の成功条件を調査するために京 都議定書に同意した参加国をモデル化した (以下,参加国をエージェントと呼ぶ). 個々の エージェントの相互作用としてのエージェントベースモデルは, 人工生命や人工市場の分
野[41, 8]の中で, 社会や経済現象を分析するために株式市場, 外国為替市場, 電力市場に
適応されている[9, 10, 12]. そこで,エージェントベースモデルの概念を用いて,国際排出 権取引市場のエージェントモデルを提案する.
(Agent)
(Environment) International Emission
Trading Market Participant nation
(Agent) Participant nation
(Agent) Participant nation
(Agent) Participant nation Price of emission right
図 3.1: Participant nation and emissions trading
本研究のモデルは, 多数のエージェントから構成され,エージェントの排出量の削減目 標を達成するために,図3.1が示すように排出権の売り買いによって市場価格を決定する.
エージェントは, 毎月(time)ごとの可能な行動(例えば, 買うこと, 売ること, 国内削減) の中から行動を選択し, その結果に基づき選択した行動を評価する. また, 現実の国際排 出権取引市場と同じように5年間の約束期間ごとの削減目標の達成を確認する.
エージェントは, 図3.2が示すように, 二つの構成要素(例えば, 多くの状態と行動の ルールセット(rule set)と評価機構(evaluation function))と二つの変数(例えば, 排出権 (emission right)とガス排出量(amount of emission))から成り立つ. エージェントは, 自 らの国内排出量を削減するか排出権取引市場を通して排出権を取得し,削減目標を達成す る. そのため, 排出権取引の成功度に応じた報酬を与え, 最大の報酬を得るように選択す る強化学習[42]を利用する. Q-learning [43]は, 強化学習の一つとして主に利用されてい る. 次に, 図3.2が示すエージェントの行動決定の手順の概要について説明する.
(1) 状態
Price of emission right Amount of emission right
Market Price
Amount of Emission Cost of Emission
Emission Trading Market
Participant Nation Action a
Rule Set
State s
Reward
Emission Rights Amount of Emission (Agent)
(Environment)
(1)
(1) (1) (2)
(2)
(3) (3)
(4)
Function Evaluation
time
time (4)
図 3.2: Decision-making of participant nation (agent)
状態(State)stimeは,排出権の価格(Market Price),エージェント内の排出量(Amount of Emission)と排出権(Emission Rights)の保有量の3つで表す.
(2) ルールセットによる行動選択
行動選択は, 得られた状態を元に,ルールセット(Rule Set)から一つの行動(Action, 取引市場での排出権の売りと買い, または国内削減による排出量の削減の三つがあ る) atime を決定する.
(3) 行動
排出権の売買を選択した行動は,排出権の価格と取引量を取引市場に示す. または, 国内削減を選択した行動は, 費用と排出量の削減量をする.
(4) 行動選択の優先順位の変更
行動選択の優先順位は, ルールセットの重みの大きさによって表す. そこで, 報酬 (Reward)は,行動によって得られた結果を用いて評価機構(Evaluation Function)で
上記の手順の概要をより理解するため,次に詳細の手順について説明する.
3.1.2 状態
エージェントは,環境(市場価格)の状態(smtime)と 式(3.1)が示すエージェント内部の 状態(sntime)の組合わせを状態stime ∈Sとして認識する. Sは可能な状態の集合を表す.
stime= (smtime, sntime) (3.1)
smtime=
0 (M ptime ≤ζ) 1 (M ptime > ζ)
(3.2)
sntime =
0 (Righttime < Emissiontime) 1 (Rightime ≥Emissiontime)
(3.3) 上の式では,M ptime(市場取引の平均価格)≤ζ (エージェントの行動の平均価格)の場合, 環境(市場価格)の状態(smtime)は安価な排出権を0で示し,M ptime > ζの場合,環境(市場 価格)の状態(smtime)は高価な排出権を1で示す. 一方,Righttime(エージェントが保有する
排出権)< Emissiontime(エージェント内部で発生する排出量)の場合,エージェント内部の
状態(sntime)は, 排出権がガス排出量を下回るとして0で示し, Righttime≥Emissiontime の場合, エージェント内部の状態(sntime)は, 排出権がガス排出量を十分上回るとして1 で示す. 現在のモデルでは, エージェントの行動平均価格は ζ = 100に設定する.
3.1.3 ルールセットによる行動選択
状態(stime)を認識した後, エージェントは一つの行動(atime ∈ A(stime))を選択する.
A(stime) は状態(stime)における可能な行動の集合を示す. 行動(atime)は, 次のabtime, aptime と aatime の組合わせである.
atime = (abtime, aptime, aatime) (3.4)
abtime =
0 (buy)
1 (domestic emission reduction) 2 (sell)
(3.5)
上の式では, abtimeは, 買い, 売り, 国内削減のいずれかの行動を示す. 二番目のaptime は, 買いや売りの排出権の価格またはガス排出量の削減の費用として, 0から200の値を 設定する. 三番目のaatime は, 買いや売りの排出権の量またはガス排出量の削減の量とし て0から20を設定する.
それぞれのエージェントのルールセットは, 表3.1が示すルールの重み(weight)と状態 と行動の多くの組合わせで構成される. 例えば,ルールセットは,表3.1から状態の(stime)
= (0, 0),行動のatime=(buying emission right, 120, 10)と重みのQ(stime, atime) = 90の組 合わせによって表す. ここで,その重み(Q(stime, atime))は状態(stime)における行動(atime) を実行したときに得られる期待の報酬を意味する. エージェントの行動選択は, -greedy 選択法に基づいて, 確率(0 ≤ ≤ 1)で無作為に行動を選択し, 一方, 確率1-でQ値 (Q(stime, atime))の重みが最大になる行動を選択する[42]. 例えば, エージェントがstime
= (0, 0)の状態を認識した場合,確率1−の中で一番重み(Q(stime, atime) = 120)のある atime = (domestic reduction, 120, 10)の行動を選択する.
3.1.4 行動
売り手のエージェントと買い手のエージェントは, 毎月一回の注文によって取引する.
それぞれの排出権の要求の量や価格を提示された後,排出権取引市場において価格が決定 されるように, 排出権の価格と量に基づくダブルオークション形式を利用する. 一方で, 国内排出量の削減を決定した場合, エージェントのガス排出量を削減する.
表 3.1: Q-table of participant nation
State (stime) Action (atime) Weight Q(stime, atime)
... ... ...
0, 0 buying emission right, 120, 10 90 0, 0 selling emission right, 120, 10 100
0, 0 domestic reduction, 120, 10 120
0, 1 buying emission right, 140, 10 50
... ... ...
3.1.5 行動選択の優先順位の変更
エージェントが排出権の買いまたは売りのどちらかを選択した場合,エージェントは排 出権取引市場から売り買いによる成立した排出権の価格と量を受取り,先行研究[15]で利 用された次の式によって報酬(Rewardtime)を評価する.
Rewardtime =P riceagent× Amountsuccess
Amountagent (3.6)
上の式では,P riceagentはエージェントによる排出権の入札の価格,Amountagentはエー ジェントによる排出権の入札の量, Amountsuccessは獲得した排出権の量をそれぞれ示す.
エージェントが国内のガス排出量の削減を選択した場合,報酬(Rewardtime)は,エージェ ントが支払う費用(Costagent)に基づいてガス排出量を削減すると仮定して, 次のように 計算する.
Rewardtime =Costagent (3.7)
上の報酬を利用し, それぞれのエージェントは,次のQ-learningに基づき選ばれたルー ルセットの重みを更新する.
Q(stime, atime)←Q(stime, atime)+α
[
Rewardtime+1+γ max
a∈A(stime+1)Q(stime+1, a)−Q(stime, atime)
]
(3.8) Q-learningの学習機構において, 学習率はα (0 ≤α ≤1) によって学習の度合い, 割引 率はγ (0≤γ ≤1)によってどのくらい報酬を考慮するかをそれぞれ表す.
3.2 シミュレーション
3.2.1 シナリオ分析
シナリオ分析は,ベストケース,ワーストケース,平均などを検討し、その境界条件を調 査する方法である. その中のWhat-if分析は,「もし〜なら」と仮定を変えて計算機モデ ルの出力から計算機モデルの特徴を知る方法である. この方法は, 複数の不確実な要素が 存在する場合, それぞれの組合わせに分けて, 分析する項目を調べることができる. 本研 究では, 国際排出権取引市場の市場価格, 参加国のガス排出量に着目して分析し, 提案モ デルの特徴を理解する. そこで, 本研究は, 時系列データや箱ひげ図を用いて複数の視点 から分析する. 時系列データは時系列データの過程を調べる. 箱ひげ図は複数の数値デー タを5つの要約統計量(最小値, 第1四分位点, 中央値, 第3四分位点,最大値)を通して視 覚的に表す便利な方法である.
3.2.2 設定条件
本研究は, 計算機モデルの出力から計算機モデルの特徴を理解するため, 表3.3のパ ラメータを用いて, 次の表3.2の6つのシナリオに分けて比較をおこなう. 表3.2では,
Cases-A1とA2における全てのエージェントは, ガス排出量の削減目標を京都議定書に
基づく設定にし, Cases-B1とB2における全てのエージェントは, ガス排出量の削減目標 を同じに目標設定にし, Cases-C1とC2における全てのエージェントは, ガス排出量の削