電気通信大学大学院電気通信学研究科博士 ( 工学 ) の学位申請論文

(1)

国際排出権取引市場におけるエージェントベースシミュレーションの時系列データの分析法

仲田知弘

電気通信大学大学院電気通信学研究科博士 ( 工学 ) の学位申請論文

2010 年 3 月

(2)

国際排出権取引市場におけるエージェントベースシミュレーションの時系列データの分析法

博士論文審査委員会

主査渡邉成良教授

委員西野哲朗教授

委員吉浦裕教授

委員高玉圭樹准教授

委員高橋裕樹准教授

(3)

著作権所有者仲田知弘

2010

(4)

Analytical method of time series data via Agent-based simulations in

international Emissions trading market

Tomohiro Nakada

ABSTRACT

A traditional methodology of a computational modeling and simulation corresponds to an eﬀective object and an output of it. It is important to show the legitimation and validity of computational modeling and simulation. However, this methodology of a computational simulation covers the thought experiment to build a computational modeling based on hypothesis in the future phenomena and the unknown world. One of the computational simulation is Agent-based Simulation (ABS). The “agent” in ABS is a computational model as individuals. We can observe a phenomena of whole system by interaction between individual agents. The relationship between modeling and output of modeling is not clear.

First, to clarify the feature of computational output using scenario analysis, this paper proposes the model of participating nation and compliance mechanism according to Kyoto Protocol in international emission trading market via ABS. Second, this paper proposes the classiﬁcation method using Bayesian analytical method (BAM) to classify the time series data in the international emissions trading market depend on ABS and compares the case with Discrete Fourier transform analytical method (DAM).

These analytical methods have revealed the following results: (1) the computational

(5)

worst case by the scenario analysis; (2) the analytical methods of BAM and DAM show similarity and dissimilarity to classify multiple time series data in ABS; (3) One possibility is to infer the boundary conditions from the results of BAM; (4) By using two dimensions of BAM, we are easy to understand from multiple time series data.

In conclusion, our proposed model shows the feature of participating nation and compliance mechanism by scenario analysis. And, our proposed analytical methods classify time series data in the international emissions trading market via ABS. We can contribute to the development of design and analytical methods of social system in ABS.

(6)

国際排出権取引市場におけるエージェントベースシミュレーションの時系列データの分析法

仲田知弘

概要

近年, シミュレーションの研究は, 計算機能力の発達により, 数多くの計算機モデルの出力を取得できるようになった. また, センサと計算機の組合わせによって, 対象の出力の様々なデータを取得できるようになり, 対象の出力と計算機モデルの出力の一致が可能になりつつある. そして,従来の計算機モデルは,対象の出力に一致することで正当性·信頼性を確保してきたため, 対象世界の出力との比較が重要であった. その中で, 計算機モデルは,未知な世界や将来予測などの対象の出力が無い状況において, 仮説に基づくモデル構築をおこない, 思考実験としての役割を担いはじめた. その計算機モデルの一つが, Agent-based Simulation (ABS)であり,エージェントを人間に見立てて, その相互作用からシステム全体として現象を造りだすことで,社会や経済システムの分析方法として着目されている. しかし, この ABS の構築方法と出力の関係が明らかでない. そのため,擬似的な意思決定モデルを構築して,その相互作用の現象を分析することが必要である. そこで, 本研究は, この ABS を用いて未知なる国際排出権取引市場の参加国モデルと遵守制度を構築し,取引市場の価格変動を分析する. なぜなら,遵守制度の導入が,排出権取引市場の価格にどうのように働くかは試行しなければわからないからである. また, そのような計算機モデルの出力は,相互作用の影響を受けることから複雑な現象となり, 計算機モデルの複数の出力から一致によって判定することが難しい. そこで, 距離に基づく分析方法が,計算機モデルの出力を類似や相違によって分類できるかどうか検討する.

そこで, 本研究は,未知な国際排出権取引市場の価格変動や規則による現象を造りだすため, ABS に基づく参加国モデルと遵守制度を提案する. そして, その提案した計算機モ

(7)

デルが造り出す現象をシナリオ分析することにより,計算機モデルにおける遵守制度の特徴を抽出できると考える. また, 取引市場の価格変動のような時系列データを分類するため, 距離に基づく分析方法としてBayesian analysis method (BAM) を提案する. 複数の複雑な時系列データを距離によって類似と相違に分けることにより,分析者の負担軽減や主観的な判断の軽減に繋がると考える. そして,何を基準に計算機モデルの出力を分類するのかによって, その類似や相違などの距離は変わってくる. そこで, 計算機モデルの設計方法と分析手法の提案し, その有効性を次の手順によって確認する. (1) ABSにおける参加国の意思決定モデルと遵守制度を構築し,遵守制度の有無と削減目標の割合を変更してシミュレーションを実施する. (2)そのシミュレーション結果をシナリオ分析をおこない, 遵守制度の有無や削減目標の割合の境界条件, ベストケース, ワーストケースなどから特徴を抽出する. (3) 距離に基づいた分析方法 BAM が, 複数のシミュレーション結果を用いて類似と相違に分類できるかどうか試みる. また, 先行研究である離散フーリエ変換を用いた定量化手法(DAM)と比較し, 距離に基づく分析方法であるBAMとDAM の特徴を理解する.

その結果, 本研究によって以下の知見が得られた. (1) 仮説に基づいて構築した計算機モデルは, シナリオ分析によって境界条件, ベストケース, ワーストケースがなどが明らかになった. 特に, 削減目標と遵守制度の有無による違いが,計算機モデルの出力(排出権の市場価格, 参加国のガス排出量)に影響を示した. また, 提案した計算機モデルは,削減目標の1%の違いを現すことから,地球温暖化防止の一つの取り組みである国際排出権取引市場の分析に役立てられる. (2) BAM と DAM による分析手法は, 時系列データを単純に図示する方法に比べ, ABS の差異を提示した. (3) BAM による提案手法は, 変動する時系列データを類似と相違に分かれる場合,類似のグループと相違のグループを比較することで, シナリオ分析による境界条件の候補を提示する可能性がある. (4) BAM の視覚化は,上下左右による二次元の表示が,複数の時系列データの類似と相違を距離で示し, 理解しやすい. なぜなら, 1次元は長さを示すだけで類似と相違の判断を分析者らがおこなう必要がある. 3次元は,比較するデータによって座標の位置がわかりにくく,類似と相違の判断がしにくい.

(8)

そして, 提案した国際排出権取引市場の参加国モデルと遵守制度は, 排出権の市場価格と参加国のガス排出量の変動特性分析できることを示した. また, 提案したBAMによる分析方法は, 時系列データの変動を距離で表す分析法として有効性を示した. このことから, ABS における社会システムの設計と分析の方法論の展開に貢献できた.

(9)

図目次

1.1 Simulation process . . . . 3

1.2 Traditional methodology and proposal methodology . . . . 3

1.3 The positioning of this study. . . . 5

2.1 Agent-based Simulation . . . . 10

2.2 Decision-making of Agent . . . . 11

2.3 Reinforcement Learning . . . . 12

2.4 Amount of emission and emission right in ﬁve years . . . . 14

2.5 Emission reduction targets . . . . 14

2.6 Amount of emission and emission right in ﬁve years . . . . 16

2.7 Reduction of emission right . . . . 17

2.8 Three approaches to the validity of simulation results . . . . 19

3.1 Participant nation and emissions trading . . . . 23

3.2 Decision-making of participant nation (agent) . . . . 24

3.3 Time series data under the compliance and non-compliance mechanisms . 31 3.4 Reduction target on Kyoto Protocol vs. −8% reduction target under the compliance and non-compliance mechanisms . . . . 32

3.5 Time series data by changing the emission reduction targets of all participant nations . . . . 33

3.6 Changing the emission reduction targets under the compliance and non- compliance mechanisms. . . . 34

(13)

3.7 Time series data by changing the number of the nations with +8% emission

reduction target . . . . 36

3.8 Diﬀerent combinations of the emission reduction targets under the compliance and non-compliance mechanisms . . . . 37

4.1 cases-A1’ and A2’ (the second dimension) . . . . 51

4.2 cases-A1’ and A2’ (the ﬁrst dimension) . . . . 51

4.3 Market price with the non-compliance. . . . 52

4.4 Market price with the compliance . . . . 52

4.5 Comparison of DAM, BAM and Time series data . . . . 53

4.6 Comparison of Time series data and BAM . . . . 54

4.7 cases-C1’ and C2’ (the ﬁrst dimension) . . . . 60

4.8 cases-C1’ and C2’ (the second dimension). . . . 61

4.9 cases-C1’ and C2’ (the third dimension) . . . . 61

5.1 Exponential function (f(x) = _ex+e²^−x) . . . . 68

5.2 BAM using exponential function. . . . 68

(14)

表目次

3.1 Q-table of participant nation . . . . 27

3.2 Scenario of compliance mechanism and emission reduction targets . . . . 29

3.3 Parameters of participant nation, compliance mechanism, Q-Learning . . 30

3.4 Number of nations with the carbon emission reduction targets +8% or−8% 35 3.5 Total amount of emission and emission right of 39 nations in theory . . . 39

4.1 Experiment condition of compliance mechanism and emission reduction targets . . . . 49

4.2 Parameters of participant nation, Q-Learning . . . . 49

4.3 Results of MDS using DAM . . . . 56

4.4 Results of MDS using BAM . . . . 57

4.5 Distance depending on DAM. . . . 58

4.6 Distance depending on BAM. . . . 59

(15)

第 1 _章序論

1.1 背景

近年, 地球温暖化対策の一つとして, 温室効果ガスの削減を目指した排出権取引¹(ET:

Emissions Trading)市場が各国で検討されている[1]. 排出権取引は,温室効果ガスを削減

するために予め目標としたガス排出の量を排出権と定め, 温室効果ガスの排出量が排出権を上回る側と下回る側によって排出権の売買をおこなう方法である. 現実の排出権取引市場は,企業または国の参加する市場に分けることができる. 企業が参加する排出権取引市場は, イギリスやノルウェーなどの国家主導で運用される市場とシカゴ気候取引所などの民間主導で運用されている. そして, 日本の場合は, 環境省によって自主参加型国内排出枠取引市場を立上げ, 企業の自主的·積極的な温室効果ガスの削減の一環として取り組むように促しているが, 参加企業が少なく, 社会的な実験を試みている段階である [2]. また, 国が参加する排出権取引市場は, 欧州連合(EU: European Union)の排出権取引市場 (EU ETS: EU Emissions Trading Scheme)と国際排出権取引市場がある. 欧州連合の排出権取引市場は, 2005年からEUの参加国による排出権取引が実施されている. 国際排出権取引市場は,世界中の京都議定書に賛同した参加国が排出権を取引する市場で, 2008年から実施されている. これらの様々な排出権取引市場は, 企業間や国家間の排出権取引における制度を検討しながら実施しているため, 各取引市場において異る規則が存在する.

1排出枠取引,排出量取引と呼ぶ場合もあるが,本稿では排出権取引を用いる

(16)

そして, 国際排出権取引市場は, 遵守制度と言う規則が実施されている. その規則の導入が排出権取引市場の価格にどうのように働くかは試行しなければわからない. その中で計算機モデルを用いたシミュレーション研究は, 参加国モデルや規則を仮想的に構築することができる.

シミュレーション(simulation)の語源は“Simulate”であり, 「試してみる」, 「試行」

に翻訳されており, 様々な案を試行錯誤することの意味である[3]. シミュレーションは, 様々な試行錯誤を計算機上でおこなう思考実験である. そして, 従来の計算機モデルによるシミュレーションの手順は, 次の図1.1のように5段階の手順でおこなわれている [4].

まず, 始めに対象を観察し, 対象の振舞いや分析する範囲を定め, 対象世界の特徴を抽出して計算機モデルを作成する. その後, 計算機モデルを完成させ, シミュレーションを実行する. そして, シミュレーション結果と評価基準を照らし合わせ, 特徴抽出やモデルの修正,シミュレーションの再実行を繰り返し, その対象世界の分析やシステムの最適値などを発見した. 一般的に従来のシミュレーションは, その結果の正当性や信頼性を確保するため,図1.2の左側のように対象の出力と計算機モデルの一致を確認している. しかし, 図1.2の右側のように対象を想定した仮定で作られた計算機モデルは,対象の出力が無く, モデルの出力と比較ができないため, 従来の計算機モデルのように正当性·信頼性を確保できない. また, 対象の出力が無いため,対象の特徴を抽出ができず,計算機モデルの作成ができない.

そこで, 対象を仮定し, 計算機モデルを構築する方法としてエージェントベースシミュレーション (ABS) がある. ABSは,エージェントの相互作用を人間同士の相互作用に見立て, その相互作用によって引き起こされる現象を模擬する手法である [5] [6]. そこで, ABS は, 人工生命や人工市場に応用され, 人工市場の中では, 図1.3のように株式取引市場や外国為替取引市場,電力取引市場について研究されてきた[7] [8] [9] [10] [11] [12]. その中で, ABS に基づく国際排出権取引市場の構築方法がこれまでに提案され,擬似的な取引の結果,取引市場の価格変動が観測できることから市場形成の一例を示したと報告して

いる [13] [14] [15] [16]. しかし, 国際排出権取引市場は開始から間もないため, 実世界に

(17)

対象の観察

特徴の抽出

モデルの作成

シミュレーション

結果の評価

（対象とモデルとの比較）

修正または繰り返し実施

図 1.1: Simulation process

（対象とモデルとの比較：有）（対象とモデルとの比較：無）

モデル対象

特徴抽出

入力

出力出力

一致の確認

モデル1 対象

出力

入力入力

モデル2

出力

試行

対象入力

出力仮定

比較本研究の範囲

入力

図 1.2: Traditional methodology and proposal methodology

(18)

ミュレーション結果は,被験者を用いた実験経済学によるデータとの近似[14] [15] [17]や EUの排出権取引市場のデータとの近似[16]によって妥当性を示してきた. しかし,シミュレーションの用いられ方は,シミュレーション結果と実世界のデータを近似させる立場と, 仮説による振舞いを検証するための思考実験の立場がある [18] [19]. 本研究は, 後者の立場を支持し, 人的あるいは社会的リスクを伴うことなく, 思考実験としてシミュレーションを造り出すことである. そこで, 本研究は, 未知なる国際排出権取引市場の参加国モデルと遵守制度の影響から取引市場の価格変動を造りだして分析する. 本研究は, 図1.3に示すように, 対象の出力が無いシミュレーションであり,経験的アプローチや理論的アプローチとの一致を目指すのではなく,シミュレーション結果の分類や特徴の抽出を計算的アプローチの中で試みる.

1.2 目的と方法

本研究の目的は,対象の出力と計算機モデルの出力が比較ができない計算機モデルの構築と計算機モデルの出力の評価手法を検討することである. そして, 本研究で扱うシミュレーションは, 複数のエージェントの相互作用によって現象を造り出すため, 計算機モデルと計算機モデルの出力の関係が明らかではない. そこで,実施されて間もない国際排出権取引市場の参加国モデルを構築し,シミュレーション結果から計算機モデルの性質を分析する. また, 距離に基づいた分析法を提案し, 複数の時系列データを直接見るのではなく, 距離によって類似や差異を判断できる方法論を検討する. そこで, 本研究は, 以下の手順によって, 計算機モデルを構築し,それぞれの分析法によって確認した. (1)参加国の意思決定モデルと遵守制度を構築し,遵守制度の有無や削減目標を変化させてシミュレーションを実施する. (2) シナリオ分析によって, 計算機モデルの出力から境界条件やベストケース、ワーストケースなどの特徴を抽出し, 計算機モデルの差異を理解する. (2) 距離に基づいた分析方法を提案し, 複数の計算機モデルの出力を分類し, その類似と相違を距離で判断する.

(19)

（対象とモデルとの比較：有）（対象とモデルとの比較：無）

理論的アプローチ

経験的アプローチ

計算論的アプローチ智（電力取引市場）2007

西條（排出権取引市場）2006 OKANO（排出権取引市場）2003

水田（排出権取引市場）2001, 2004

織田（排出権取引市場）2003

MATSUMOTO（排出権取引市場）2008

和泉（外国為替取引市場）2001 田中（電力取引市場）2004 Arthur（株式取引市場）1996

高階（株式取引市場）2000

本研究

シナリオ分析による結果の評価 BAMによる結果の評価

Path（株式取引市場）1994

山形（温室効果ガスの国際合意形成過程）2005

図 1.3: The positioning of this study

(20)

1.3 _{論文の構成}

本論文は, 第六章の構成からなり,各章の概要は次のように述べる.

第二章: 国際排出権取引取引市場における時系列データの分析法第二章では, まず国際排出権取引市場について概説し, エージェントベースシミュレーション(ABS) を用いた計算機モデルの経緯やその特徴について説明する. そして, 本研究が着目する国際排出権取引市場や遵守制度と ABS における制度設計について概説する. 次に, 従来の時系列データの分析法について概説し, その特徴について説明する. そして, これまでのABSにおける時系列データの分析方法と比較し,本研究における分析手法について概説する.

第三章: 国際排出権取引取引市場の参加国モデルとシナリオ分析第三章では, 対象の出力と計算機モデルの出力を確認できない国際排出権取引市場の参加国とその規則である遵守制度を取り上げる. 参加国モデルは,報酬の最大を求めていくと仮定し, 意思決定に強化学習を用いることで参加国モデルの行動が変化する. また, 遵守制度は,それぞれの参加国の状況に応じて制約するため,個々の参加国モデルに対して制約を課せることができる. これらの仮説とシナリオ分析によって, 計算機モデルによる出力の特徴を理解する.

第四章: 距離に基づく時系列データの分類法第四章では, 計算機モデルの出力の分析方法について取り上げ, 第三章で提案したモデルによるシミュレーション結果を分析する. 計算機モデルの出力が対象の出力と比較できない場合, そのモデルの類似や相違は対象の出力に基づいて判定ができず, 正当性や信頼性を得るのが難しい. そこで, 少なくても計算機モデルの中で, 類似や相違を明らかにすることで,計算機モデルの出力の結果を検討していくことが計算機モデルの発展に重要である. そこで, 距離に基づく分析としてBAM (Bayesian analysis method)の提案をおこない, その結果について述べる.

(21)

度のシナリオ分析と, 第四章で提案した時系列データの分析法による結果から考察する. シナリオ分析によって, この計算機モデルによる出力の特徴を抽出することができた. しかし,計算機モデルの出力が多くなることで分析者の負担が増加する.

モデルの出力は,分析方法(DAMとBAM)によって類似と相違を距離によって示すことを可能にした. そこで, 複数の時系列データを並べて比較するより複数の時系列データを距離による判別が容易になるため, 分析者の負担を軽減した.

第六章: 結論第六章では,本研究の成果を取りまとめ,今後の課題について述べる. 本研究は, 計算機モデルの出力と対象の出力が比較できないとして, 国際排出権取引市場における ABS とその分析手法を提案し, 検証をおこなった. その結果, 複雑な時系列データをそれぞれの分析によって, その計算機モデルの出力の特徴を分類した. そして, 本研究は, ABS による社会システムの設計と分析方法の展開に貢献した. しかし, 距離によって分類されたデータの性質や機能説明までは明らかにできず, 今後の課題となった. また, この距離に基づく分析方法は,計算機モデルの出力に限った手法ではなく, 他の分野に応用可能であり, 今後検討する必要がある.

(22)

第 2 _章

国際排出権取引市場における時系列データの分析法

2.1 国際排出権取引市場

国際排出権取引市場は,地球温暖化の温室効果ガスの抑制のため, 市場原理を活かして地球全体の削減費用を少なく達成する市場の一つである. 各国は, 温室効果ガスの削減目標を定め, 放出可能な温室効果ガスの排出量を“排出権”と呼び,ガス排出量の権利を売買する. この排出権を参加国同士で取引する市場の一つが, 国際排出権取引市場である. そして,全ての参加国の国内の排出量の削減が難しいことから, 削減目標を達成させるために規則として遵守制度を導入した [20]. 温室効果ガスの削減が容易い国は排出権を売ることで利益が得られ, 温室効果ガスの削減に対するインセンティブ(誘因)が生まれる. また, 温室効果ガスの削減が難しい国は,他の国から排出権を買うことで温室効果ガスの削減できる. このことから, 排出権の売り手と買い手が存在し, 排出権の売買が可能となる.

この国際排出権取引市場の役割は, その環境負荷を低減するために経済的手法(市場原理) によって, 世界全体の温室効果ガスの削減である. そのため, 国際排出権取引市場の継続が重要な課題である.

現在,排出権取引市場は, イギリスやノルウェーなどの国家主導で運用される市場とシカゴ気候取引所などの民間主導で運用される市場があり, 様々な取引市場がを開設され

(23)

ている. 欧州連合(EU: European Union)は, 2005年からEU内において排出権取引(EU ETS: EU Emissions Trading Scheme)市場を実施し, EU内の国家に課せられた温室効果ガスの削減目標を目指している. また, 日本の環境省は, 自主参加型国内排出権取引市場を立上げ, 企業の自主的·積極的な努力を促し, 費用効率的かつ確実に温室効果ガス排出量の削減を達成することを目指している[2]. 各国は, 企業間や国家間の排出権取引における制度を検討しながら実施している. その中で,国際排出権取引市場に関する各国の削減目標がは, 気候変動枠組条約（UNFCCC)で議論している. 近年, UNFCCCの第13回締約国会議（COP13）において, U.S.Aが2013年以後のポスト京都議定書の温室効果ガスの削減目標の設定に同意することを表明した[21]. しかし, コペンハーゲンでおこなわれた第15回締約国会議（COP15）において, 世界中の国の同意が得られず, 各国のポスト京都議定書の削減目標は締結されない事態になった. このように, 国際排出権取引市場は 2008年から実施されているが,その制度設計や継続事態が不確かである.

2.1.1 国際排出権取引市場における ABS

ABS は, 図2.1のように計算機上に仮想的な意思決定主体(エージェント)と仮想的な取引市場のモデルを構築し, 擬似的な取引をおこなうことにより,その現象を分析することができる. ABS を用いた国際排出権取引市場では,エージェントを参加国とし,仮想的な市場モデルを排出権取引市場として構築し,擬似的な取引をおこなっている. その結果, ABS を用いることで取引市場の価格変動が観測できることから, 市場形成の一例を示したと報告している [13, 14, 15, 16]. しかし,これまでの ABS による国際排出権取引は, 遵守制度の影響を考量した長期的な排出権の市場価格の分析がされていない. そこで,国際排出権取引市場の参加国モデルを仮定し,遵守制度の影響として様々な視点から排出権の価格変動と参加国の排出量の変動を分析する.

本研究のエージェントは, 排出権取引市場の価格を知覚し自らの行動を決定する自律エージェントとして扱う. エージェントの自律性, 適応性を表現する方法としては, 強化学習が適していると考えられている [22]. 国際排出権取引市場は, 開設されて間もない取

(24)

Environment

Agent

Price of rights

Agent Agent

Agent

図 2.1: Agent-based Simulation

引市場であり, 不確かな環境である. 予め人間が設定するような意思決定では, そのような未知な環境に適応できないと考える. そこで, 本論文では, 人間の行動の集まりを国の政策決定として捉え, 強化学習を用いるエージェントとする. 強化学習を用いたエージェントは, 未知なる環境においても, 利益の報酬を手掛かりに自分の行動を決定する. そのため,強化学習を用いたエージェントは, 報酬を獲得するために行動戦略を変更することができることから, 環境が変化しても新たな知識(環境に応じた適切な行動選択)を与える必要がない利点がある [23].

2.1.2 エージェントベースシミュレーション

エージェントベースシミュレーション (ABS: Agent-based Simulation)は, 1990年代に国内外で議論されるようになり, Santa Fe研究所のArthurら[9] [24]による人工株式市場が現実世界の経済システムに似通った現象を造り出したことをきっかけに, 様々な人工市

(25)

Environment

Agent

Decision-making

Sensor: s Effector: a

Rule Set: S → A

s a

S A

図 2.2: Decision-making of Agent

場の研究がおこなわれるようになった. ABS は, 1980年代の分散人工知能 [25]から影響を受け,「知能」をもつエージェントの相互作用によって現象の特性やエージェントの設計に焦点が当られた. ここ言う知能とは, 図2.2のように,環境を知覚し,その情報に基づいて自らの行動を決定できる独立したプログラムを指すことが多く,それを自律的な行動主体と捉える. そこで, ABSは, 自律的なエージェントの集団から構成される分散システムの一種である. その振舞いは, エージェントの局所的な相互作用によって決定され, システム外部からエージェントを制御する者は存在しない. また, システムの振舞いは個々のエージェントの意思決定に影響を及ぼす. このような環境の中で,エージェントは自らの目的を達成するように環境に対して適応的な行動をするため, システムの振舞いは非常に複雑であり, エージェントの行動と相互作用の関係を明らかにすることは難しい. そこで, 自律的な行動主体の相互作用が, 社会や経済システムの現象を表していると捉えるため, エージェントの設計方法や ABS の分析手法が重要である.

エージェントは, 動的な環境に対して, 自らの目標を達成するように行動をとらなければならないため,事前に行動ルールを設計することは困難であり,設計したルールが複雑な現象に対して永久に有効である保証はない. そこで, エージェントは,図2.2に示すように3つの要素で構成される.

(26)

Environment

Agent

Decision-making

Sensor: s Effector: a

Rule Set: S → A

s a

S A

Reward Evaluation Function

図 2.3: Reinforcement Learning

Sensor 環境の状態を認識し, 内部表現 s∈S に変換し,意思決定をするルールセットの入力となる.

Decision-making あるセンサ情報 s に対して, 何らかの行動情報a ∈Aを対応づける.

条件S - 行動A の組であるルールセット RuleSetによって表す.

Eﬀector 意思決定によって決められた行動情報 a に基づき,環境に対して行動として出

力となる.

この枠組みの中で, 自律性や適応性を表現する方法として強化学習がある[22]. 強化学習は, 図2.3のように,エージェントが環境から得られる報酬という強化信号を用いて, 自らの行動を評価し, この報酬を最大化することによって,それぞれのエージェントの意思決定を変える方法として用いられている. 強化学習におけるQ-learningは, 無限界の試行を仮定することによって, 意思決定の収束性が理論的に保証されている.

(27)

2.2 国際排出権取引市場の遵守制度

国際排出権取引市場の遵守制度は,各国が削減目標を約束期間内に達成できない場合の京都議定書に基づく規則 [21]であり, その規則が排出権取引市場に影響があると考える.

また,遵守制度は,参加国の温室効果ガスの排出量の削減を促進する機能を持ち,現実の国際排出権取引市場で運用されている. この遵守制度は, 京都議定書によって確立し, 温室効果ガスの削減のための法的な拘束力がある. 京都議定書に同意する参加者国は,その法的な拘束力の下で, 参加国自ら成し遂げる排出量の削減目標を設定しなければならない.

参加国の排出量の削減目標の達成を評価するために,遵守制度は,図2.6の右端が示す5年分の約束期間における排出量と排出権を比較することで参加国の達成度合いを照合する.

例えば, 図2.6のように, 参加国の2008年から2012年までの約束期間における温室効果ガスの排出量と排出権を比較し, 排出権が排出量を下回った場合,それぞの参加国に2013 年以降に規則を適応し, より温室効果ガスの削減を強制される. 一方, 排出権が排出量を上回った場合, 規則を適応されず, さらにガス排出量の削減に取り組むことになる. そこで, 図2.6の排出量は黒棒グラフで示し,排出権は斜線棒グラフで示す. 1年後の排出権の斜線棒グラフは, 図2.6の上部の長方形の中にある毎月の排出量の合計として示す. 毎月, 排出量と排出権を積み立てることで1年分とし,それぞれの1年分の合計によって5年分の排出量と排出権として表す.

そして, 現在, 国際排出権取引市場の約束期間は, 京都議定書に基づき, 図2.5のように第一期間を2008年から2012年までとしている . その後, 第二期間が2013年から始まることになっており, 五年ごとの排出量と排出権の比較が繰り返しおこなわれ, 遵守制度の判定がされる. 現時点では, ポスト京都議定書が決まっておらず, 図2.5の2013年以降の各国の削減目標は定まっていない. しかし, 地球温暖化防止のため, 温室効果ガスの削減がより一層求められていくと考えられる.

京都議定書の遵守制度は, 現在の約束期間で参加国の削減目標を達成できない場合, 二つの規則がある [21]. 一つ目は, 次の約束期間に付与される排出権の量を遵守制度によって削減する. すなわち, 次の約束期間により多くの排出量を削減する必要がある. 二番目

(28)

10 20

2008 2009 2010 2011 2012

600 900 1200

Total of five years 300

1 2 3 4 5 6 7 8 9 10 11 12

emission right amount of emission

time [year]

time [month]

Amount

図 2.4: Amount of emission and emission right in ﬁve years

1990 2008

| 2012

2013 | 2018 emission right

amount of emission

Emission Reduction Targets of Kyoto Protocol Emission Reduction Targets of Post Kyoto Protocol

図 2.5: Emission reduction targets

(29)

は, 次の約束期間中, 国際排出権取引市場において排出権の売りを禁止する. 参加国は他の参加国から排出権を買うか, 国内の排出量を削減することで削減目標の達成するように行動を決定しなければならない. すなわち, 取引市場による排出権の買いまたは国内の排出量の削減のどちらかの行動を選択しないと参加国の削減目標が達成できないことを意味する. そこで, 排出量と排出権の量は, それぞれ1ヶ月をtimeで示し, 60ヶ月で5年分を表す. 遵守制度は, 5年ごとに更新し,更新の回数をCP で表す.

ECP =

∑60 time=1

Emissiontime (2.1)

ER_CP =

∑60 time=1

Right_time (2.2)

上の式では, 5年分の排出量(E_CP)は排出量の１ヶ月分(Emission_time)の合計として表す. また排出権(ER_CP)は, 排出権の１ヶ月分の量(Right_time)の合計として表す. 参加国の排出量が排出権を越えない場合, その参加国は次の約束期間において通常取引になる.

すなわち, 参加国は排出権を買うことと売ることができる. しかし, 参加国の排出量が排出権を越えた場合,その参加国は次の約束期間に売ることを規制された取引になる. すなわち,参加国は国内の排出量を削減するか, 取引市場で排出権を買うだけになる.

排出量(Emission_time)と排出権(Right_time)はそれぞれ次のように式(2.3), (2.4)と(2.5) として定義される.

Emission_time=ConsE_time−DR_time (2.3)

Righttime = AAU_(CP)

60 ±ETtime (2.4)

AAU_(CP₎=Eyear₁₉₉₀×5×(1 + T arget

100 )^(CP) (2.5)

これらの式では,参加国のtimeヶ月目のガス排出量(Emission_time)は,timeヶ月目の一 定の排出量をConsE_time, 国内削減量をDR_timeとして定義する. 参加国のtimeヶ月目の

(30)

10 20

2008 2009 2010 2011 2012

600 900 1200

Total of five years 300

1 2 3 4 5 6 7 8 9 10 11 12

emission right amount of emission

time [year]

time [month]

Amount

図 2.6: Amount of emission and emission right in ﬁve years

排出権(Rights_time)は,timeヶ月目に割当てられた排出権の量をAAU_time(例えば,AAU_CP

÷ 60ヶ月), そして排出権取引市場におけるtimeヶ月目の売買結果をET_timeとして定義

する. 最後に, 約束期間の繰り返し回数CP における割当てられた排出権の量(AAU_CP) は, 基準となる1990年の排出量Eyear₁₉₉₀, 削減目標T argetから求める.

2.2.1 ガス排出量の割り増し削減

参加国の排出権が,現在の約束期間において排出量を上回るほど十分持っていない場合, 割当てられた排出権(AAU_CP)は, 図2.7の右が示すように遵守制度に基づき,次の約束期間のペナルティの量を削減される. これは, 参加国がその国で発生する排出量をより多く削減することを意味する. 図2.7の左において, 白いボックスは排出権を示し, 次期期間

の2013-2017が示すように5年ごとに一定の量を減らされる. この削減に加えて, 許可さ

れる排出権の量は,さらに参加国が削減目標に達成できなった分を灰色ボックスのペナルティの量として減らされる. ペナルティの量は,京都議定書に基づき現在の約束期間における排出量の過剰部分に1.3倍かける. 次の約束期間における参加国の5年分の排出権は

(31)

2008-2012 2013

-2017 2008

-2012 2013 -2017

Reduction of emission right in ordinary case

Reduction of emission right in the penalty case

AAU(set emission right) penalty

図 2.7: Reduction of emission right

次のように計算される.

ER_CP+1 =AAU_CP₊₁−penalty_CP (2.6)

penaltyCP =











(ECP −ERCP)×P deg (if E_CP > ER_CP) 0 otherwise

(2.7)

上の式では, 次の期間の5年分の排出権(ER_CP₊₁)は, AAU_CP₊₁ −penalty_CP から求

める. penalty_CP は, 参加国がさらに排出権の量を減らすペナルティの量を示す. この

ペナルティの量は, 参加国の発生するガス排出量が排出権を上回る場合(言い換えれば, E_CP > ER_CP), (E_CP −ER_CP) × P deg から求める. 一方, 反対の場合(言い換えれば, E_CP ≤ER_CP), ペナルティの量は0である. ここで, P degはペナルティの割合を示し, 京都議定書に基づいて1.3を設定する. このペナルティの量(penalty_CP)は, 参加国に現在の約束期間よりも次の約束期間の排出量の削減を強制する.

(32)

2.2.2 排出権の販売禁止

参加国の排出権が, 現在の約束期間においてガス排出量を上回るほど十分持っていない場合, 参加国はコストを払って国内削減の実施や排出権取引市場で排出権の買いをおこなうために排出権の売りを禁止される.

2.3 _関連研究

経済システムの分析は, 図2.8のように主に計算的アプローチ(エージェントベースシミュレーション),理論的アプローチ(ゲーム理論など), 経験的アプローチ(実験経済学など)に分けられる[26]. 理論的アプローチの一つであるゲーム理論は, 意思決定理論の一つで, プレイヤー(player), 戦略(strategy),利得(payoﬀ)という3つの要素の関係を, ルールとして制約条件を論理的かつ理性的に記述する方法である[27] [28]. 経験的アプローチの一つである実験経済学は, 検証したい経済理論に必要な環境を実験室内に設計し,被験者を用いて実験室のなかで検証する方法である[29] [30]. この図2.8は, シミュレーション結果の妥当性の一つとして, それぞれのアプローチ結果がどのような条件において一致するのか検証することを提案している. そして,エージェントベースシミュレーションによる出力がゲーム理論と比較し, 類似した結果を得ている [31]. また, エージェントベースシミュレーションによる出力が,実験経済学による出力と比較し、類似した結果を得ている[17] [14] [15].

一方, 計算的アプローチと比較するのではなく, それぞれの分野において, 排出権取引市場の研究がされている. 西條ら[30]は, 実験経済学の視点から排出権取引の制度設計について分析し, 国内の排出権取引市場の制度設計について政策提言をおこなっている. 実験経済学の被験者実験は,謝礼などの費用を必要とし, 被験者の拘束時間を必要とすることから分析方法が容易でない. また, 山形ら [32]は, 地球温暖化対策の国際合意形成過程を微分ゲームを用いて,トップダウン式による事象を分解し, 定式化によって分析している. 微分ゲームは, 定式化されたパラメータを変化させ, 時間軸上における変化を観測す

(33)

Validity of Simulation results Alignment of computational models or Docking

(cross-element validation)

Theoretical analysis (game theory)

A link to the real world (experimental economics)

図 2.8: Three approaches to the validity of simulation results

るため, 確立されていない取引市場の定式化は難しい. 小池ら[33]は, 日本の科学者が取り組んでいる地球温暖化問題についてまとめ,政策議論を支える科学的アプローチの国際制度に関する研究や長期的な制度設計におけるシナリオ検討する研究が必要であると述べている.

その中で, ABS は, エージェントの相互作用を人の相互作用と仮定し, その相互作用によって取引市場を表す方法論がArthurらによって確立している[9]. そこで, 対象から仮定した参加国モデルを用いて, 制度設計の影響を思考実験としておこなう. ABS の有益な点は, 人間の思考実験では定めにくい境界条件やベストケースやワーストケースをシナリオ分析によって発見することができる。一方で,大量のシミュレーション結果の中から特徴あるデータを探し出すのは難しい. そこで,複数のシミュレーション結果を距離で表示し,発見作業の負担を軽減する。

(34)

2.4 _{時系列分析}

2.4.1 経済時系列データの分析方法

経済時系列データは,通常のデータの性質と異り, 将来の時系列データの変動が過去と現在の変動の影響を受け, 不規則な変動を示すとされている. そこで, 経済時系列データに関する分析は, 経済学や計量経済学, 金融工学, 数理統計などで長年おこなわれ,不規則な変動の現象を解明し,その延長線上に将来の変動予測がおこなわれている[34] [35] [36].

これまでの時系列の分析は, 時系列データの季節的な傾向を除去する方法から始まり, 時系列データの周期成分に着目したフーリエ解析などがおこなわれてきた. しかし, フーリエ解析は, 無限の時系列データに対して定義されているため, 実際の有限の時系列データに適用できなかった. そこで, 市場価格のような価格変動の構造は, 確率的に表せるとして数学的表現が用いられている. その中で, 時系列データの分析は, 不規則な変動の現象の将来予測をおこなうため, ARモデル(AR: autoregressive process)やARMAモデル (ARMA: autoregressive moving average process)が提案されている [36]. これらは, 時系列データにモデルを当てはめるように近似してきた手法である.

これに対し,赤池は, モデルに時系列データを通し, 分析することを提案している [37].

2.4.2 ABS における経済時系列データの分析方法

一方で, ABS における経済時系列データは, 複数のエージェントの行動からなる相互作用として市場価格などの現象を示すため,時系列データを図示する方法が用いられてきた. そして,この現象に対する時系列データの分析は,エージェントの行動履歴を参照し, 現象の要因を推論している. そのため, ABS における経済時系列データの分析方法は, 一つ一つの現象とエージェントの行動履歴の参照が必要であり,エージェント数が増えることによって困難になる. そして, ABS による国際排出権排出権取引市場の分析方法は, 分析者に時系列データを図示する単純な方法が取入れられてきた [13] [38]. そのため, 市場価格は, 時系列データの上昇傾向や下降傾向, 継続や停止などの分析に限られた. しか

(35)

し, ABSの時系列データは不規則な現象を含んでおり, このような分析では複雑な現象が十分に説明できない. この問題を解決をするために, 赤池は不規則な現象となる仮想市場に対して,時間的な変動に着目し, 定常過程に近似した分析手法を提案した[39]. また, 荒井らはABS のシミュレーション結果を比較する分析手法として,時系列データの定量分析法を提案した[40]. この時系列データの定量分析法は, 離散フーリエ変換を用いるため不規則な時系列データをパターンに変換している. しかし, 時系列データは, 分析者の図示の範囲や表示方法によってパターンが異ることから,非定常性として取り扱う必要がある. そこで, 本論文の第四章は,非定常性のある時系列データの分析方法として,ベイズ法を用いた時系列データの分類方法を提案し, その結果について説明する. この方法は, モデルに時系列データをあてはめる分析であり, ABS から造られれる複数の時系列データの変動を分類する. 一つ一つのシミュレーション結果を比較するのではなく, 複数の時系列データを分類することで, 国際排出権取引市場における社会システムの構造の理解に役立てる.

(36)

第 3 _章

国際排出権取引市場の参加国モデルとシナリオ分析

本章では, 排出権取引市場の参加国を仮定し, エージェントを構築し, そのエージェントに対して遵守制度を取り入れる. 国際排出権取引市場は, 対象の出力がなく, 従来の計算機モデルではできないため, 参加国モデルの相互作用と遵守制度によって, 排出権取引市場の市場価格や参加国のガス排出量を表す. その現象を分析するため,計算機モデルの出力からシナリオ分析をおこない, 提案した計算機モデルの特徴を理解する.

3.1 国際排出権取引の参加国モデル

3.1.1 概要

本研究におけるエージェントは, 京都議定書の遵守制度の成功条件を調査するために京都議定書に同意した参加国をモデル化した (以下,参加国をエージェントと呼ぶ). 個々のエージェントの相互作用としてのエージェントベースモデルは, 人工生命や人工市場の分

野[41, 8]の中で, 社会や経済現象を分析するために株式市場, 外国為替市場, 電力市場に

適応されている[9, 10, 12]. そこで,エージェントベースモデルの概念を用いて,国際排出権取引市場のエージェントモデルを提案する.

(37)

(Agent)

(Environment) International Emission

Trading Market Participant nation

(Agent) Participant nation

(Agent) Participant nation Price of emission right

図 3.1: Participant nation and emissions trading

本研究のモデルは, 多数のエージェントから構成され,エージェントの排出量の削減目標を達成するために,図3.1が示すように排出権の売り買いによって市場価格を決定する.

エージェントは, 毎月(time)ごとの可能な行動(例えば, 買うこと, 売ること, 国内削減) の中から行動を選択し, その結果に基づき選択した行動を評価する. また, 現実の国際排出権取引市場と同じように5年間の約束期間ごとの削減目標の達成を確認する.

エージェントは, 図3.2が示すように, 二つの構成要素(例えば, 多くの状態と行動のルールセット(rule set)と評価機構(evaluation function))と二つの変数(例えば, 排出権 (emission right)とガス排出量(amount of emission))から成り立つ. エージェントは, 自らの国内排出量を削減するか排出権取引市場を通して排出権を取得し,削減目標を達成する. そのため, 排出権取引の成功度に応じた報酬を与え, 最大の報酬を得るように選択する強化学習[42]を利用する. Q-learning [43]は, 強化学習の一つとして主に利用されている. 次に, 図3.2が示すエージェントの行動決定の手順の概要について説明する.

(1) 状態

(38)

Price of emission right Amount of emission right

Market Price

Amount of Emission Cost of Emission

Emission Trading Market

Participant Nation Action a

Rule Set

State s

Reward

Emission Rights Amount of Emission (Agent)

(Environment)

(1)

(1) (1) (2)

(2)

(3) (3)

(4)

Function Evaluation

time

time (4)

図 3.2: Decision-making of participant nation (agent)

状態(State)s_timeは,排出権の価格(Market Price),エージェント内の排出量(Amount of Emission)と排出権(Emission Rights)の保有量の3つで表す.

(2) ルールセットによる行動選択

行動選択は, 得られた状態を元に,ルールセット(Rule Set)から一つの行動(Action, 取引市場での排出権の売りと買い, または国内削減による排出量の削減の三つがある) a_time を決定する.

(3) 行動

排出権の売買を選択した行動は,排出権の価格と取引量を取引市場に示す. または, 国内削減を選択した行動は, 費用と排出量の削減量をする.

(4) 行動選択の優先順位の変更

行動選択の優先順位は, ルールセットの重みの大きさによって表す. そこで, 報酬 (Reward)は,行動によって得られた結果を用いて評価機構(Evaluation Function)で

(39)

上記の手順の概要をより理解するため,次に詳細の手順について説明する.

3.1.2 _状態

エージェントは,環境(市場価格)の状態(sm_time)と式(3.1)が示すエージェント内部の状態(sn_time)の組合わせを状態s_time ∈Sとして認識する. Sは可能な状態の集合を表す.

s_time= (sm_time, sn_time) (3.1)

sm_time=









0 (M p_time ≤ζ) 1 (M p_time > ζ)

(3.2)

sn_time =









0 (Right_time < Emission_time) 1 (Righ_time ≥Emission_time)

(3.3) 上の式では,M p_time(市場取引の平均価格)≤ζ (エージェントの行動の平均価格)の場合, 環境(市場価格)の状態(sm_time)は安価な排出権を0で示し,M p_time > ζの場合,環境(市場価格)の状態(sm_time)は高価な排出権を1で示す. 一方,Right_time(エージェントが保有する

排出権)< Emission_time(エージェント内部で発生する排出量)の場合,エージェント内部の

状態(sn_time)は, 排出権がガス排出量を下回るとして0で示し, Right_time≥Emission_time の場合, エージェント内部の状態(sn_time)は, 排出権がガス排出量を十分上回るとして1 で示す. 現在のモデルでは, エージェントの行動平均価格は ζ = 100に設定する.

3.1.3 ルールセットによる行動選択

状態(s_time)を認識した後, エージェントは一つの行動(a_time ∈ A(s_time))を選択する.

A(s_time) は状態(s_time)における可能な行動の集合を示す. 行動(a_time)は, 次のab_time, ap_time と aa_time の組合わせである.

(40)

a_time = (ab_time, ap_time, aa_time) (3.4)

ab_time =











0 (buy)

1 (domestic emission reduction) 2 (sell)

(3.5)

上の式では, ab_timeは, 買い, 売り, 国内削減のいずれかの行動を示す. 二番目のap_time は, 買いや売りの排出権の価格またはガス排出量の削減の費用として, 0から200の値を設定する. 三番目のaa_time は, 買いや売りの排出権の量またはガス排出量の削減の量として0から20を設定する.

それぞれのエージェントのルールセットは, 表3.1が示すルールの重み(weight)と状態と行動の多くの組合わせで構成される. 例えば,ルールセットは,表3.1から状態の(s_time)

= (0, 0),行動のa_time=(buying emission right, 120, 10)と重みのQ(s_time, a_time) = 90の組合わせによって表す. ここで,その重み(Q(s_time, a_time))は状態(s_time)における行動(a_time) を実行したときに得られる期待の報酬を意味する. エージェントの行動選択は, -greedy 選択法に基づいて, 確率(0 ≤ ≤ 1)で無作為に行動を選択し, 一方, 確率1-でQ値 (Q(s_time, a_time))の重みが最大になる行動を選択する[42]. 例えば, エージェントがs_time

= (0, 0)の状態を認識した場合,確率1−の中で一番重み(Q(s_time, a_time) = 120)のある a_time = (domestic reduction, 120, 10)の行動を選択する.

3.1.4 _行動

売り手のエージェントと買い手のエージェントは, 毎月一回の注文によって取引する.

それぞれの排出権の要求の量や価格を提示された後,排出権取引市場において価格が決定されるように, 排出権の価格と量に基づくダブルオークション形式を利用する. 一方で, 国内排出量の削減を決定した場合, エージェントのガス排出量を削減する.

(41)

表 3.1: Q-table of participant nation

State (stime) Action (atime) Weight Q(stime, atime)

... ... ...

0, 0 buying emission right, 120, 10 90 0, 0 selling emission right, 120, 10 100

0, 0 domestic reduction, 120, 10 120

0, 1 buying emission right, 140, 10 50

... ... ...

3.1.5 行動選択の優先順位の変更

エージェントが排出権の買いまたは売りのどちらかを選択した場合,エージェントは排出権取引市場から売り買いによる成立した排出権の価格と量を受取り,先行研究[15]で利用された次の式によって報酬(Reward_time)を評価する.

Reward_time =P rice_agent× Amount_success

Amount_agent (3.6)

上の式では,P rice_agentはエージェントによる排出権の入札の価格,Amount_agentはエージェントによる排出権の入札の量, Amount_successは獲得した排出権の量をそれぞれ示す.

エージェントが国内のガス排出量の削減を選択した場合,報酬(Reward_time)は,エージェントが支払う費用(Cost_agent)に基づいてガス排出量を削減すると仮定して, 次のように計算する.

Reward_time =Cost_agent (3.7)

上の報酬を利用し, それぞれのエージェントは,次のQ-learningに基づき選ばれたルールセットの重みを更新する.

(42)

Q(stime, atime)←Q(stime, atime)+α

[

Rewardtime+1+γ max

a∈A(stime+1)Q(stime+1, a)−Q(stime, atime)

]

(3.8) Q-learningの学習機構において, 学習率はα (0 ≤α ≤1) によって学習の度合い, 割引率はγ (0≤γ ≤1)によってどのくらい報酬を考慮するかをそれぞれ表す.

3.2 シミュレーション

3.2.1 シナリオ分析

シナリオ分析は,ベストケース,ワーストケース,平均などを検討し、その境界条件を調査する方法である. その中のWhat-if分析は,「もし〜なら」と仮定を変えて計算機モデルの出力から計算機モデルの特徴を知る方法である. この方法は, 複数の不確実な要素が存在する場合, それぞれの組合わせに分けて, 分析する項目を調べることができる. 本研究では, 国際排出権取引市場の市場価格, 参加国のガス排出量に着目して分析し, 提案モデルの特徴を理解する. そこで, 本研究は, 時系列データや箱ひげ図を用いて複数の視点から分析する. 時系列データは時系列データの過程を調べる. 箱ひげ図は複数の数値データを5つの要約統計量(最小値, 第1四分位点, 中央値, 第3四分位点,最大値)を通して視覚的に表す便利な方法である.

3.2.2 設定条件

本研究は, 計算機モデルの出力から計算機モデルの特徴を理解するため, 表3.3のパラメータを用いて, 次の表3.2の6つのシナリオに分けて比較をおこなう. 表3.2では,

Cases-A1とA2における全てのエージェントは, ガス排出量の削減目標を京都議定書に

基づく設定にし, Cases-B1とB2における全てのエージェントは, ガス排出量の削減目標を同じに目標設定にし, Cases-C1とC2における全てのエージェントは, ガス排出量の削

電気通信大学大学院 電気通信学研究科 博士 ( 工学 ) の学位申請論文

国際排出権取引市場におけるエージェントベース シミュレーションの時系列データの分析法

仲田 知弘