板情報を利用した指値執行システムの提案

全文

(1)2010 年度修士論文. 板情報を利用した指値執行システムの提案. 提出日： 2010 年 2 月 1 日. 指導：村岡洋一教授早稲田大学基幹理工学研究科. 情報理工学専攻. 学籍番号： 5108b020-8 大矢. 倫靖.

(2) i. 目次第1章. 序論. 1. 1.1. 研究の背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.2. 研究の目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.3. 研究の実装 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.4. 本論文の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 従来の関連研究. 4. 2.1. 従来の関連研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 2.2. 従来の関連研究との相違点 . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 本研究の手法. 6. 3.1. 板の性質 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 3.2. 提案システム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 3.3. 何を学習させるのか . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 第2章. 第3章. 第4章. ニューラルネットワークと株価予測モデル. 11. 4.1. ニューラルネットワークとは. . . . . . . . . . . . . . . . . . . . . . . .. 11. 4.2. ニューラルネットワークの利点 . . . . . . . . . . . . . . . . . . . . . .. 11. 4.3. ニューラルネットワークの欠点 . . . . . . . . . . . . . . . . . . . . . .. 12. 4.4. バックプロパゲーション . . . . . . . . . . . . . . . . . . . . . . . . . .. 12. 4.5. ニューラルネットワークを利用してみる . . . . . . . . . . . . . . . . . .. 14. 4.6. 板、株価データのニューラルネットワークを用いたモデル . . . . . . . .. 15. 4.7. 学習環境 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 19. 指値の執行確率. 21. 第5章.

(3) ii 5.1. 指値とは . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. 5.2. アルゴリズムトレーディング. . . . . . . . . . . . . . . . . . . . . . . .. 21. 5.3. ブラウン運動の初到達時刻分布 . . . . . . . . . . . . . . . . . . . . . .. 22. 評価と考察. 34. 6.1. ニューラルネットワークの評価 . . . . . . . . . . . . . . . . . . . . . .. 34. 6.2. ニューラルネットワークモデル . . . . . . . . . . . . . . . . . . . . . .. 34. 6.3. 結果の解釈 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36. 6.4. 指値約定確率の評価 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 37. 結論. 41. 結論とまとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 41. 付録. 43. 第6章. 第7章. 7.1 第8章. アルゴリズムトレーディングの世界. 8.1. 代表的な執行アルゴリズム . . . . . . . . . . . . . . . . . . . . . . . . .. 43. 8.2. Statistical Arbitrage . . . . . . . . . . . . . . . . . . . . . . . . . . .. 45. 参考文献. 47. 付録. 50. 外部発表.

(4) iii. 図目次 3.1. 提案システム概要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 3.2. データベース構造の様子 . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 4.1. ニューロンの説明. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12. 4.2. ニューラルネットワーク概要. . . . . . . . . . . . . . . . . . . . . . . .. 14. 4.3. 日中の価格変動と出来高 (2008/06/02) . . . . . . . . . . . . . . . . . .. 17. 4.4. 日中の価格変動と出来高 (2008/06/03) . . . . . . . . . . . . . . . . . .. 18. 4.5. 正規化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 20. 4.6. FANN の様子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 20. 5.1. ブラウン運動のサンプルパス. . . . . . . . . . . . . . . . . . . . . . . .. 23. 5.2. ブラウン運動の経路と鏡像経路 . . . . . . . . . . . . . . . . . . . . . .. 23. 5.3. ブラウン運動のパス . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 25. 5.4. パラメータの簡単な説明 . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. 5.5. ブラウン運動の初到達時刻分布、確率密度関数 . . . . . . . . . . . . . .. 26. 5.6. ブラウン運動の初到達時刻分布、累積密度関数 . . . . . . . . . . . . . .. 27. 5.7. 買い気配 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 5.8. 買い気配 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 5.9. 買い気配 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 5.10. 買い気配 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 29. 5.11. 買い気配 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 29. 5.12. 売り気配 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30. 5.13. 売り気配 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30. 5.14. 売り気配 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 31.

(5) iv 5.15. 売り気配 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 31. 5.16. 売り気配 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. 5.17. 買い気配の累積分布関数 . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. 5.18. 売り気配の累積分布関数 . . . . . . . . . . . . . . . . . . . . . . . . . .. 33. 6.1. ニューラルネットワークの評価 . . . . . . . . . . . . . . . . . . . . . .. 37. 8.1. 多様なアルゴリズム取引 . . . . . . . . . . . . . . . . . . . . . . . . . .. 44.

(6) v. 表目次 3.1. 係数の関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 4.1. 非線形モデルの各係数 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 16. 4.2. ニューラルネットワークの入力変数 . . . . . . . . . . . . . . . . . . . .. 19. 6.1. トレーニング結果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35. 6.2. テスト結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36. 6.3. 正規分布の検定結果 (1 分足) . . . . . . . . . . . . . . . . . . . . . . . .. 39. 6.4. 正規分布の検定結果 (5 分足) . . . . . . . . . . . . . . . . . . . . . . . .. 40.

(7) 1. 第1章. 序論本章では、研究の背景や、目的、本論文の構成について述べる。. 1.1 研究の背景最近の証券取引においては、コンピュータやテクノロジーの占める位置付けは、従来よりも大きくなりつつあると考える。例えば、近年、HFT(High Frequency Trading) のような高頻度売買が話題となっている。従来の長い期間の投資から、短い期間を利用したトレードが注目されている。米国の例では*1 NASDAQ や BATS などの証券取引所が高速な取引を可能としており、BATS 証券取引所 [1] によれば、「我々のシステムは注文の反応速度の計測をミリセカンド (1/1000 秒) で行っているのではなく、マイクロセカンド (1/1000 ミリ秒) で行っている。スピードの重要さは今日の自動売買、アルゴリズム取引の発展と共に大きくなっている」と書かれており、IT 技術への依存が大きくなっていることが分かる。短い期間の投資になるにつれて、古くから議論されていた株価の予測可能性について、効率的市場仮説 [2] のような、ニュースや材料は全て株価に織り込まれており、テクニカル分析やファンダメンタル分析のような分析も効果が無く、株価は常に適正価格である、という仮説が通用するのかというテーマはこれからも注目されると考えられる。当時の研究は、日足や月足のような分析粒度で行われたものがほとんどであり、現在のように短い *1. これに関しては、米国でも大きな議論になっており、短いタームのトレードになっていくにつれ、インフラ投資の大きさのみが収益に直結するような批判もある。また、フラッシュ・オーダーと呼ばれる注文が、他人よりも先に注文内容が分かるなどとして、廃止の方向に至るなどの問題があった。.

(8) 2 期間での予測可能性まで論じた文献は少ない。日本の例においても、東京証券取引所が Arrowhead[3] と呼ばれる新システムを導入するなど、高速な取引が行われやすい環境が構築されやすくなっている。このように速い環境で証券の売買が行われるようになった場合には、人間が行う意思決定だけでは難しくなり、コンピュータによる取引がメリットになりやすいと考える。コンピュータに取引させる場合にも、適切にプログラムを作成する必要があり、板や注文を状況を見た上で、適切に注文を出すということが求められているだろう。その中でも、板を見て指値を出す、というニーズは高まり、例えば東京証券取引所の. Arrowhead の例で考えた場合に、成行注文を出すと従来のシステムよりも不利に約定する可能性も高いために、指値をどこに指すかという意思決定の重要さは以前より高まっているであろうと考えられる。. 1.2 研究の目的本研究においては、短い期間でのマーケットの性質やトレーディングについて着目することで、株価の予測可能性や、株式等の注文の執行についてより良い値段で約定させることが出来るかという可能性について考察する。また、板とは、買いの注文と売りの注文をマッチングさせる様子を表しており、需要と供給のバランスの均衡点を表している根源的な部分である、という意味においても、板データを解析することは、市場の本質的な性質を探るという意味でも重要である。. 1.3 研究の実装本研究では、機械学習により相場の学習を行う。その情報を元に、指値の執行確率を計算する。機械学習にはニューラルネットワークを用い、指値の執行確率の計算には、数理ファイナンスで用いられるブラウン運動の初到達時刻分布の性質を使用した。.

(9) 3. 1.4 本論文の構成本論文は以下の 7 章からなる。第 1 章. 序章. 本論文の概要、目的、構成について述べる。第 2 章. 従来の関連研究. 従来の関連研究を紹介し、本研究との相違点を述べる。第 3 章. 本研究の手法. 提案する手法について述べる。第 4 章. ニューラルネットワークの仕組み. 機械学習である、ニューラルネットワークの仕組みについて述べる。第 5 章. 指値の執行確率. 指値が執行する確率について述べる。第 6 章. 評価と考察. 本手法の評価を行い、その結果を考察する。第 7 章. 結論. 本論文のまとめ、今後の課題を述べる。.

(10) 4. 第2章. 従来の関連研究本章では、従来の関連研究と比較し、相違点と、本研究の新規性について述べる。. 2.1 従来の関連研究本研究においては、機械学習、特にニューラルネットワークを株価等の時系列に応用した研究と、板データのような、時系列の高頻度データである研究の両方の分野の研究について紹介する。. 2.1.1 ニューラルネットワークに関する研究ニューラルネットワークを利用して、株価を予測する研究は数多くなされている。時系列予測で使われる ARIMA モデルとニューラルネットワークの比較を論じた [4] や、NY ダウや Nasdaq など米国市場を中心に、ニューラルネットワークや GA を用いる場合の方が、バイアンドホールドよりも上回り、効率的市場仮説のような現象とは異なることを述べた研究 [5] がある。ニューラルネットワークによる予測精度に関しては、フィルタリングを行ったほうが精度が上がる [6] という研究もあり、実務的な視点からでは、クオンツモデルにおいての過学習について述べられた [7] など、ニューラルネットワークを実際に役立てようという視点もある。.

(11) 5. 2.1.2 高頻度データに関する研究近年においては、株価のような時系列を扱う場合においても、従来の日足を用いた長期的な予測や傾向について述べられた研究だけではなく、短い期間の高頻度なマーケットのデータを対象とする研究が増えている [8]。統計的裁定 (statistical arbitrage) と呼ばれる手法 [9][10] など、マーケットにおける収益機会も短い期間のトレードへとシフトしつつある。効率的市場仮説 [2] のような、株価の予測が困難であるという状況は、日足や週足のような分析粒度のデータについて行われた研究がほとんどであり、短い期間に関して効率的市場仮説が正しいかどうかは議論が分かれるところであろう。短い期間のトレーディングが出来るようなマーケットの環境が欧米を中心に出来上がりつつある。板や日中の株価変動、流動性などの性質を調べた研究 [11][12] は多くなっている。日本の市場については、マイクロマーケットストラクチャーの研究を行っている [13] や、待ち行列の理論を使用し板の動きを数理的にモデリングした [14] などがある。日本の場合は欧米と異なり、株式に関しては流動性が東京証券取引所の一箇所に集中していることから、研究対象として扱われることもしばしばある。. 2.2 従来の関連研究との相違点従来の研究では短い期間の予測についてや板を見る、というアプローチに対して、機械学習を試みるという研究は数少ないと考えられる。日本の市場についての研究である [15] などがあるが、板のパターンの因果関係を十分に説明するまでには至ってないと考えられる。指値の約定確率の方に関しても、ブラウン運動の初到達時刻分布のような性質は、バリアオプション*1 など、デリバティブのプライシングに使われることは多いが、指値の約定に使えるアウトプットにしてある、という点は新規性があると考えられる。. *1. バリアオプションとは、所定の条件に達することを条件にオプションの価値が発生する、あるいは逆に所定の条件に達すると、オプション価値がゼロになるオプションのことである。.

(12) 6. 第3章. 本研究の手法本章では、提案する手法の概要について述べる。板を分析する背景やニューラルネットワークのモデル、指値の約定確率を計算する上で使用するブラウン運動などについて簡潔に紹介する。. 3.1 板の性質本稿では、日経 225 先物における、初歩的な板の性質について述べる。現物株とは異なり、板に関してどの値段にも多く注文が並んでいる。価格が動く際には板も動くことから、板の情報は価格形成において重要な役割を果たしていると考えられる。現物株の場合は、個別銘柄によっては、十分な流動性が無く、板に並んでいる枚数を見ても、少量しか並んでいなかったり、出来高が少ないために値段が飛んで板が並んでいる場合も多い。そのような状況では、板の状況をモデリングするということは困難となる。そこで、日経 225 先物のような、流動性が十分あり、どの価格帯の板にも多く枚数が並んでいるプロダクトを選択した。日経 225 の場合は、呼値が 10 円となっており、表 3.1 のような様子となっている。. 3.2 提案システム本システムにおいては、5 分後の相場の方向を現在の板の形状から大まかにニューラルネットワークを用いて予測する。方向は上がる、下がる、変化しないの 3 通りに分類している。この情報を元に、指値をどの位置に、何分間置いたらよいか、という意思決定を行.

(13) 7 表 3.1 係数の関係. 売り気配. 価格. 250. 10030. 190. 10020. 305. 10010. 263. 10000. 35. 9990. 買い気配. 9980. 25. 9970. 350. 9960. 270. 9950. 390. 9940. 125. うために、ブラウン運動の初到達分布の性質を利用して、指値をある位置に一定期間指して置いた場合の約定する確率を計算する。システムの概要は図 3.1 の通りである。学習データの調達板情報は日経メディアマーケティング株式会社からのデータを利用した。学習に用いたデータは 2008 年 7 月からの毎日の日経 225 先物の板データを用い、3 ヶ月間分を学習期間に、テストデータとしてその翌 1 ヶ月分の板データを利用した。1 日の板データとして、5 分ごとの板のスナップショットを記録したものを利用した。正規化した板の情報を用い、次の 5 分後の株価がどうなるかを 3 パターンに分類して学習を行った。このデータは膨大であり、1 ヶ月あたり 1GB 近くあるファイルであるため、効率の良いデータベース処理が必要である。このデータは、気配値も含まれており、その日の値動きを詳細に把握することが出来る。板データの格納本研究においては、Java と MySQL を用いて、データベースを構築した。更新日時、銘柄コード、限月、約定フラグ、価格、出来高といった情報を保持している。.

(14) 8. 図 3.1. 提案システム概要. CREATE TABLE ‘stock_tickly_200807‘ ( ‘id‘ int(11) NOT NULL auto_increment, ‘update_date‘ datetime default NULL, ‘stock_code‘ int(11) default NULL, ‘maturity_type‘ int(11) default NULL, ‘exec_type‘ int(11) default NULL, ‘price‘ int(11) default NULL, ‘volume‘ mediumtext, ‘indication_type‘ int(11) default NULL, ‘indication_flag‘ int(11) default NULL, PRIMARY KEY. (‘id‘),. KEY ‘id‘ (‘id‘), KEY ‘update_date‘ (‘update_date‘) ) 実際のデータベース構造の様子を下記の図に載せてある。.

(15) 9. 図 3.2. データベース構造の様子. 3.3 何を学習させるのかニューラルネットワークのような機械学習においては、中身がブラックボックスであることも多く、入力を適当な変数に選んでしまっても、システムが構築できてしまうという問題点がある。実際に株価を予測するためには適切な変数を導入する必要がある。本研究においては、板の配置、過去のトレンド、寄付からの時間という 3 つの要素を学習させることで予測精度の高いモデルが構築できるのではないかと考えた。.

(16) 10. 板の配置板は需給を表しており、買いと売りの注文がマッチングする場所である。大口の投資家が注文を出すときには大きな板 (注文数) を出す場合も多く、価格形成に大きな影響を与えることもあることから、板の枚数やパターンといった配置は株価予測において重要な役割を果たしているのではないかと考えられる。価格帯と枚数の関係を平均からの相対的な値で表すことで、人間の視覚的な直感の板の印象をモデルに反映している。過去のトレンドテクニカル分析などを利用して株価を予測する場合を考えても、過去のトレンドを見ることは一定の効果があると考えられる。株価がランダムウォークをしているかという問いに対しても、それを棄却するような研究も数多くあり、ランダムウォークではないとすると、トレンドが存在する可能性が大きいために、過去のトレンドは株価予測に対して非常に重要な役割を果たしているのではないかと考えられる。寄付からの時間株価の変動に関して、一日という時間の中においても、売買が集中する時間帯が存在したり、特定のパターンが生じるなど、何らかの特徴があると考えられる。具体的には寄付付近には出来高が集中するといった傾向や、ボラティリティが高いといった傾向もあるので、約定のしやすさに関しても、寄付からの時間は重要な役割を果たしていると考えられる。以上の 3 つの要素を考慮した上で、短期の株価を予測することを考える。財務情報や市況情報は、長期的な株価形成には役立つ可能性があるが、5 分後の株価を予測するような短期のタイムフレームにおいてはそれほど影響は無いと考え、この 3 つにした。.

(17) 11. 第4章. ニューラルネットワークと株価予測モデル本章では、ニューラルネットワークの仕組みと、日経 225 株価先物指数の予測モデルについて解説する。. 4.1 ニューラルネットワークとはニューラルネットワーク (Neural network) は、脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルである。簡単な図を図 4.1 に示す。生物学や神経科学との区別のため、人工ニューラルネットワークとも呼ばれる (Wikipedia より)。このモデルを用いることで、人間の脳のように学習をさせることで、未知データに対しても因果関係が複雑な現象を説明出来るのではないかと考えられる。. 4.2 ニューラルネットワークの利点一般に株価のような時系列を取り扱うには、パラメトリックなモデルを仮定して、データに合うようなモデルを構築していくことになるが、残差が正規分布であるといったパラメトリックな仮定を置かなくても良い、大量のノイズの混入などにも強い、といった特徴がある。入力と出力さえ与えてしまえば、中の構造を考える必要があまりなくモデルが構築できる、といったメリットがある。.

(18) 12. 図 4.1. ニューロンの説明. 4.3 ニューラルネットワークの欠点ニューラルネットワークの欠点としては、学習に使用したデータに関しては再現性が高く、正しい答えを返すことが多いが、未学習のデータに関しては、どのような予測値が出力されるか保証が無いという問題がある。ユニット数を増やしたときに、過学習となってしまう可能性がある。学習にも時間がかかってしまう場合や、単純なバックプロパゲーションのような方法だとまた、ニューラルネットワークは、中の構造がブラックボックスであり、どのような因果関係があるかが把握しづらいことが欠点としてあげられる。. 4.4 バックプロパゲーションバックプロパゲーションは最急降下法を用いた手法の一つであり、学習データに対して逐次重みをアップデートすることで教師信号との誤差を最小にすることで学習を行う. [17][18]。誤差. 1∑ (ti − Oi )2 E= 2 i=1 n. (4.1).

(19) 13 を最小化するような重みを決定することを考える。E を Wkj で偏微分すればよく、中間層-出力層に関しては、学習係数を η 、中間層の出力を H とすると. ∆Wkj = −η. ∂E ∂E ∂Ok ∂Uk = −η ∂Wkj ∂Ok ∂Uk ∂Wkj. (4.2). となるような修正量にすればよい。学習係数 η は、一度にどの程度結合の重みを変化させるかを表しており、大きすぎると大雑把な学習となってしまい、小さすぎると学習の計算時間が膨大にかかってしまうトレードオフの関係がある。まずは、それぞれの微分を考えると、. ∂E ∂ 1 = (tk − Ok )2 ∂Ok ∂Ok 2 = −(tk − Ok ). (4.3) (4.4). であり、. ∂Ok ∂ 1 = ∂Uk ∂Uk 1 + e−Uk e−Uk = (1 + e−Uk )2 1 1 (1 − ) = −U k 1+e 1 + e−Uk = Ok (1 − Ok ). (4.5) (4.6) (4.7) (4.8). という関係がある。ネット値を結合加重で偏微分すると、. ∂Uk ∂ = (H1 Wk1 + H2 Wk2 + ... + Hj Wkj ) ∂Wkj ∂Wkj = Hj. (4.9) (4.10). となり、修正量は. ∂E ∂Wkj ∂E ∂Ok ∂Uk = −η ∂Ok ∂Uk ∂Wkj = −η{−(tk − Ok )Ok (1 − Ok )Hj }. ∆Wkj = −η. (4.11) (4.12) (4.13).

(20) 14 のようにして、出力層の結合荷重を求められる。入力層-中間層に関しても同様に、. ∂E ∂Wji n ∑ ∂Ei ∂Oi ∂Uk ∂Hj ∂Tj = −η( ) ∂O ∂U ∂H ∂Tj ∂Wji i k j i=1. ∆Wji = −η. = ηHj (1 − Hj )Xi. n ∑. (4.14) (4.15). Wkj (tk − Ok )Ok (1 − Ok ). i=1. のようにして重みをアップデートして、誤差が一定値以下となるように学習をさせる。本研究においては教師データとして、実際に 5 分後に株価が、上がる、下がる、変わらない、のどのパターンに当てはまったかを学習させている。. 図 4.2. ニューラルネットワーク概要. 4.5 ニューラルネットワークを利用してみるニューラルネットワークを用いて、非線形の問題を正しく扱うことができるかを検証した。まずは、株価データを扱う前に、基本的な演算処理能力として簡単な実験を行った。条件としては、13 個の入力と 1 個の出力を考える。その手法は次の通りである。. x = (x1 , x2 ...) と y の関係を与えた上で、単純な問題として解いてみる。.

(21) 15. 入出力入力を x = (x1 , x2 ...), −1 ≤ x ≤ 1 とし、出力を y(−1 ≤ y ≤ 1) とする。x(各要素は乱数) と y の組を 200 個作成し、この因果関係を学習させる。学習させた内部のパラメータを用い、未知のデータに対して同じように 200 個の x̂(各要素は乱数) と ŷ の関係が学習させたような結果になっているかを調べることにする。yˆk を実際の正解である tk (教師信号) と比較し、その誤差を評価することで、正解に近いかどうかを判定することにした。誤差誤差を E = (tk − yˆk )2 (k = 1, 2, ..200) のように定義する。. 1. 平均の例 ∑n y = i=1 xi /n という因果関係を与え、上述のようなシミュレーションを行った。結果はトレーニングの時に生じた誤差 Et = 0.074496017 となり、未知データに対して生じた誤差 Eu = 0.10407158 となり、両者の差が小さいことから、ニューラルネットワークがかなり正確に「平均」という関係を学習していることが確認できる。. 2. 非線形の関数 y=. 1 の例を考える。各係数は表 4.1 のように設定 1 + exp{−(a1 x + a2 x + .. + a13 x)}. し、平均の例と同様にシミュレーションを行った。結果はトレーニングの時に生じた誤差. Et = 0.08706404 となり、未知データに対して生じた誤差 Eu = 0.117811985 となり、同様に両者の差が小さいことから、ニューラルネットワークが非線形である関数もかなり正確に学習することが出来たと考えられる。このような複雑な現象であっても学習できるところが、ニューラルネットワークの利点である。. 4.6 板、株価データのニューラルネットワークを用いたモデル本セクションでは、実際に板、株価データをニューラルネットワークに使えるような形にした。板情報、トレンド情報、寄付からの時間という 3 つの要素を利用し、株価を予測するモデルとしている。.

(22) 16 表 4.1 非線形モデルの各係数. 係数. 値. a1. 0.9. a2. 0.8. a3. 0.7. a4. 0.6. a5. 0.5. a6. 0.4. a7. -0.9. a8. -0.8. a9. -0.7. a10. -0.6. a11. -0.5. a12. -0.4. a13. 1. 4.6.1 板情報の扱い方まず、板情報を正規化する (図 4.5)。板を各値段の高いほうから 1,2,..,16 とし、枚数のベクトル v = (v1 , v2 , ...v16 )(8 本値) のように表した上で、各枚数を正規化する。正規化にあたってはニューラルネットワークの入力が −1 から +1 の範囲に収まっている必要があるので、以下のような手順で行う。正規化済み買い (売り) 板に並んでいる数を padj とすると、. padj =. p−µ σ. (4.16). p は買い (売り) 板に並んでいる数、µ はその時間における、買い (売り) 板に並んでいる平均、σ はその時間における、買い (売り) 板に並んでいる枚数の標準偏差である。−1 から +1 の範囲に抑えるために、−1 以下の数は −1 に、+1 以上の数は +1 に変換した。ニューラルネットワークの入力としては、このうち、価格形成に大きく影響を与えるであろう、買い気配 1-4、売り気配 1-4 の直近の価格に近い部分を採用した。.

(23) 17. 4.6.2 トレンド情報の扱い方次に、板情報とは別に、トレンドの情報を入力に与える。株価にはトレンドが存在する、という仮定に基づいている。n 分前から n + 1 分前 (n = 0, 1, 2, 3, 4) の価格変化を見て、上昇していれば +1 を、変化しなければ 0、下落している場合には −1 をとしている。. 4.6.3 寄付からの時間株価の変動に関して、一日という時間の中においても、売買が集中する時間帯が存在したり、特定のパターンが生じるなど、何らかの特徴があると考えられる [19]。寄付付近は売買が集中するなど、傾向が見られると考え、寄付からの時間を −1 から +1 の範囲で表現し、パラメータの一つに加えた。日中の価格変動と出来高の例を図 4.3,4.4 に示す。. 出来高. 出来高日経平均株価(先物). 15:09. 15:01. 14:53. 14:45. 14:37. 14:29. 14:21. 14:13. 14:05. 13:57. 13:49. 13:41. 13:33. 13:25. 13:17. 13:09. 0 13:01. 14050 12:53. 500 12:45. 14100 12:37. 1000. 11:00. 14150. 10:52. 1500. 10:44. 14200. 10:36. 2000. 10:28. 14250. 10:20. 2500. 9:56. 14300. 10:12. 3000. 9:48. 14350. 10:04. 3500. 9:40. 14400. 9:32. 4000. 9:24. 14450. 9:16. 4500. 9:08. 14500. 9:00. 株価. 2008年6月2日. 時刻. 図 4.3 日中の価格変動と出来高 (2008/06/02).

(24) 18. 14350. 7000. 14300. 6000 5000. 株価. 14250. 4000 14200. 出来高. 2008年6月3日. 3000 出来高. 日経平均株価(先物). 14150. 2000. 15:10. 15:03. 14:56. 14:49. 14:42. 14:35. 14:28. 14:21. 14:14. 14:07. 14:00. 13:53. 13:46. 13:39. 13:32. 13:25. 13:18. 13:11. 13:04. 12:57. 12:50. 12:43. 12:36. 11:00. 10:53. 10:46. 10:39. 10:32. 10:25. 10:18. 9:57. 10:11. 9:50. 10:04. 9:43. 9:36. 9:29. 9:22. 0 9:15. 14050 9:08. 1000. 9:01. 14100. 時刻. 図 4.4 日中の価格変動と出来高 (2008/06/03). 4.6.4 予測モデル前述の板情報、トレンド情報、寄付からの時間の 3 つを考慮した上で、表 4.2 のような入力 x ベクトルを作成し、ニューラルネットワークの内部構造の関数を f とする。入力に対して、実際の正解 (5 分後に株価が上がるかどうか) データを出力にしている。5 分後に株価が 2 ティック以上上昇すれば、+1 を 2 ティック以上下降すれば −1 を、それ以外の場合には 0 としている。2 ティックとしているのは、1 ティックの上下は、直前に約定した値段によって生じてしまう可能性があるためである。この関係を. y = f (x). (4.17). として表している (y は出力)。ニューラルネットワークの中間層は 1 層とし、ニューロン数は 50 とした。ニューラルネットワークの実装としては、高速なライブラリである. FANN[20] を用いた。.

(25) 19 表 4.2. ニューラルネットワークの入力変数. 入力変数. 意味. x1. 売り気配 4. x2. 売り気配 3. x3. 売り気配 2. x4. 売り気配 1. x5. 買い気配 1. x6. 買い気配 2. x7. 買い気配 3. x8. 買い気配 4. x9. 0 分前から 1 分前の価格変化. x10. 1 分前から 2 分前の価格変化. x11. 2 分前から 3 分前の価格変化. x12. 3 分前から 4 分前の価格変化. x13. 4 分前から 5 分前の価格変化. x14. 寄付からの経過時間. 4.7 学習環境ニューラルネットワークを実装する上で、上記に従ってプログラムしても良いが、学習させる変数が増えてくると、計算速度が遅くなる、局所解に陥りやすくなるといった問題点があり、このような問題を解決する必要がある。そこで、FANN というライブラリを使用し、シミュレーションを行った。ページの概要を図 4.6 に示す。オープンソースのフリーのライブラリであり、PHP, C++, .NET, Ada,. Python, Delphi, Octave, Ruby, Prolog Pure Data, Mathematica といった多数の言語からも呼び出しが可能であり、高速であるといった点が特徴である。.

(26) 20. 板の様子. ニューラルネットワークによる予測. 正規化 0.1510 -0.6770 -0.7111 -0.6514 -0.4166 -0.6471 -0.4935 -1.0000. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16. 0.9875 1.0000 0.8893 0.9448 1.0000 0.9747 0.5095 -1.0000. 図 4.5 正規化. 図 4.6. FANN の様子.

(27) 21. 第5章. 指値の執行確率本章では、指値の執行確率について述べる。指値をどこに何分間指しておけば、どのくらいの確率で約定するかの意思決定を与えるための基礎的な理論を提案する。. 5.1 指値とは指値とは、株などの売買注文方法の一つであり、発注する際に希望する値段を指定する形の注文である。例えば、株の買付注文を出すときに、「500 円以下で買いたい」のような希望値段を指定する注文方法が指値注文である。一方、成行注文とは、「いくらでも良いからすぐに買いたい」という注文であり、指値注文よりも時間的に優先的に約定する。. 5.2 アルゴリズムトレーディング近年、アルゴリズムトレーディングが流行しつつある。アルゴリズムトレーディングとは、コンピュータシステムが株価や出来高、時間などに応じて、自動的に株式等の売買の時間や数量を決めて注文を執行することである。証券市場が電子化されるにつれて、アルゴリズムトレーディングの需要は急速に高まっている。執行の分野にとどまらず、投資銀行やヘッジファンドなどの自己売買部門などにおいて、収益を上げるためのトレーディングにアルゴリズムを用いるということも盛んになっている。本研究の、どこに指値を出せばよいかというモデルは、アルゴリズムトレーディングに応用することが可能であり、約定する確率を計算することで、確度の高い執行の処理が出.

(28) 22 来ると考えられる。. 5.3 ブラウン運動の初到達時刻分布 5.3.1 ブラウン運動と株価モデル株価の変動を数理モデルとして表現するのに、ブラウン運動をベースに用いることは、現代の数理ファイナンスにおいても主流となっている。オプションの価格の決定において最も有名なブラック・ショールズモデル [21] などにおいても、ブラウン運動をベースに確率微分方程式によって記述されている。. 5.3.2 ブラウン運動の定義ブラウン運動は、(Ω, F, P ) を確率空間とし、各 w ∈ Ω に対して W (0) = 0 を満たし、. w に依存する連続関数 W (t), t ≥ 0 が存在すると仮定する。このとき、W (t), t ≥ 0 がブラウン運動であるとは、全ての 0 = t0 < t1 < ... < tm に対して、増分. W (t1 ) = W (t1 ) − W (t0 ), ..., W (tm ) − W (tm−1 ). (5.1). が独立で、これらの増分それぞれが正規分布で、以下の条件を満たす場合に言う。. E[W (ti+1 ) − W (ti )] = 0. (5.2). V ar[W (ti+1 ) − W (ti )] = ti+1 − ti. (5.3). ブラウン運動の様子を示す。. 5.3.3 ブラウン運動の鏡像原理ブラウン運動の鏡像原理と呼ばれる性質を利用する。時刻 t 以前にレベル m に到達するが、時刻 t では m より下のレベル w に位置する各ブラウン運動の経路に対し、時刻 t でレベル 2m − w に位置する「鏡像経路」が存在する。この鏡像経路は時刻 τm 以降、ブラウン運動の上昇と下降の動きが入れ替えることにより構成される。鏡像等式 (reflection equality) とは、. P {τm ≤ t, W (t) ≤ w} = P {W (t) ≥ 2m − w}, w ≤ m, m > 0. (5.4).

(29) 23 ブラウン運動のサンプルパス 40 30 20 10 0 -10. 0. 200. 400. 600. 800. 1000. -20 -30 図 5.1. ブラウン運動のサンプルパス. が成立することである。この性質を利用して、エキゾチックオプションのような経路依存型のデリバティブ商品のプライシングに利用される。. 図 5.2 ブラウン運動の経路と鏡像経路.

(30) 24. 5.3.4 ブラウン運動の到達時刻時刻 t の株価を S(t) とする。ブラウン運動に基づく確率過程. S(t) − S(0) = σW (t)(σ はボラティリティ). (5.5). とする。正のレベル (株価の変動で達するバリアの量) を m と時刻 t を考える。時刻 t 以前にレベル m に到達するブラウン運動の経路 (すなわち、レベル m への到達時刻 τm が t 以下である経路) を考える。これは、ブラウン運動の鏡像原理 [22] を用いると、確率変数 τm は累積分布関数. P {τm ≤ t} = P {τm ≤ t, S(t) ≤ m} +P {τm ≤ t, S(t) ≥ m} = 2P {S(t) ≥ m} ∫ ∞ x2 2 =√ e− 2 dx 2π σm √ t. (5.6). に従い、確率密度関数は. d P {τm ≤ t} dt m2 |m| e− 2σ2 t = √ σt 2πt. fτm (t) =. (5.7) (5.8). となる。この性質を利用して、指値が約定するという現象を、t 分間における株価の変化. S(t) として、レベル m に達するまでの確率として捉えることが本研究の手法であり、この確率は. m σ. を与えれば一意に決定されるので、このパラメータを実測の株価データから. 推定することで求められる。. 5.3.5 理論曲線上述のように、株価をブラウン運動と仮定して、約定にかかるまでの時間と執行確率の横軸に約定にかかるまでの時間、縦軸に理論曲線のパラメータである、m/σ に関しての図を以下に示す。分かりやすいイメージとしては、m は基準となる点から指値までの距離を表しており、σ は単位当たり (ここでは 1 分) のボラティリティを表している（図 5.4）。.

(31) 25. 5.3.6 実測曲線実際の板のデータを用いて、約定にかかる時間の分布を計測した。データは 2008 年 6 月から 2008 年 8 月までの毎日の 9:00 と 10:00 からスタートして、200 枚の板が食われるまでの時間を計測した。板は各気配ごと (買い気配 1,2,3,4,...) のように売り買い両方それぞれの板について計測している。図 5.9 は買い気配 3 における確率密度関数のグラフを、図 5.17 には、買い気配 1,2,3,4,5 の各注文が約定する確率の累積分布関数を与えたものである。330 分以降が非連続的なのは、一日のザラ場の時間が限られているからである。. 5.3.7 理論と実測の比較結果のグラフを見ると、形状はおおむね理論曲線と実際の曲線が似ていることが分かる。m/σ の値をどのように推測するかということが、課題ではあるが、このデータを元に、ユーザは 80 ％の確率で約定させるには何円のところに指値を何分間置けばよいかという意思決定が出来ると考えられる。ブラウン運動のパス. 1000. 900. 800. 700. 時間. 600. 500. 400. 300. 200. 100. 株価. 図 5.3. また、累積分布関数を以下に示す。. ブラウン運動のパス. 244. 235. 226. 217. 208. 199. 190. 181. 172. 163. 154. 145. 136. 127. 118. 109. 91. 100. 82. 73. 64. 55. 46. 37. 28. 19. 1. 10. 0.

(32) 26. 図 5.4. パラメータの簡単な説明. ブラウン運動によるシミュレーション 0.12. 0.1. 確率密度. 0.08 m/σ=2 m/σ=3 m/σ=4 m/σ=5. 0.06. 0.04. 0.02. 0 1 13 25 37 49 61 73 85 97 109 121 133 145 157 169 181 193 205 217 229 241 253 265 277 289 301 313 325 約定までにかかる時間(分). 図 5.5 ブラウン運動の初到達時刻分布、確率密度関数.

(33) 27. ブラウン運動によるシミュレーション 1 0.9 0.8. 0.6. m/σ=2 m/σ=3 m/σ=4 m/σ=5. 0.5 0.4 0.3 0.2 0.1 0 1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209 222 235 248 261 274 287 300 313 326 約定までにかかる時間(分). 図 5.6 ブラウン運動の初到達時刻分布、累積密度関数. 買い気配1 120 100 80 60 40 20 0 約定までの時間(分) 図 5.7 買い気配 1. 335. 305. 275. 245. 215. 185. 155. 125. 95. 65. 35. 頻度. 5. 頻度. 約定する確率. 0.7.

(34) 28. 買い気配2 60 50 頻度. 40 30. 頻度. 20 10 335. 305. 275. 245. 215. 185. 155. 125. 95. 65. 35. 5. 0 データ区間. 図 5.8 買い気配 2. 買い気配3 50. 30 頻度 20 10. データ区間. 図 5.9 買い気配 3. 330. 280 305. 55 80 105 130 155 180 205 230 255. 0 5 30. 頻度. 40.

(35) 29. 買い気配4 70 60. 頻度. 50 40. 頻度. 30 20 10 330. 205 230 255 280 305. 155 180. 55 80 105 130. 5 30. 0 約定までの時間(分). 図 5.10. 買い気配 4. 80 70 60 50 40 30 20 10 0 約定までの時間(分). 図 5.11. 買い気配 5. 335. 305. 275. 245. 215. 185. 155. 125. 95. 65. 35. 頻度. 5. 頻度. 買い気配5.

(36) 30. 120 100 80 60 40 20 0 335. 305. 275. 245. 215. 185. 155. 125. 95. 65. 35. 頻度. 5. 頻度. 売り気配1. 約定までの時間(分) 図 5.12. 売り気配 1. 60 50 40 30 20 10 0 255 280 305 330. 180 205 230. 105 130 155. 55 80. 頻度. 5 30. 頻度. 売り気配2. 約定までの時間(分) 図 5.13. 売り気配 2.

(37) 31. 70 60 50 40 30 20 10 0 335. 305. 275. 245. 215. 185. 155. 125. 95. 65. 35. 頻度. 5. 頻度. 売り気配3. 約定までの時間(分) 図 5.14. 売り気配 3. 売り気配4 80. 頻度. 40 20. 約定までの時間(分) 図 5.15. 売り気配 4. 305 330. 255 280. 180 205 230. 105 130 155. 5. 0 30 55 80. 頻度. 60.

(38) 約定までの時間(分). 図 5.17 買い気配の累積分布関数. 321. 301 311. 291. 281. 271. 251 261. 241. 231. 221. 201 211. 191. 181. 執行する確率. 図 5.16. 171. 151 161. 141. 131. 121. 111. 91 101. 81. 71. 61. 41 51. 31. 21. 11. 1. 335. 305. 275. 245. 215. 185. 155. 125. 95. 65. 35. 5. 頻度. 32. 売り気配5. 100. 80. 60. 40 頻度. 20. 0 約定までの時間(分). 売り気配 5. 0.9 1. 0.8. 0.7. 0.6. 0.5. 0.4. 0.3 買い気配1 買い気配2 買い気配3 買い気配4 買い気配5. 0.2. 0.1. 0.

(39) 約定までの時間(分). 図 5.18 売り気配の累積分布関数 321. 311. 301. 281 291. 271. 261. 251. 241. 221 231. 201 211. 191. 181. 171. 161. 141 151. 121 131. 111. 101. 91. 71 81. 61. 51. 41. 31. 11 21. 1. 執行する確率. 33. 0.9 1. 0.8. 0.7. 0.6. 0.5. 0.4. 0.3 売り気配1 売り気配2 売り気配3 売り気配4 売り気配5. 0.2. 0.1. 0.

(40) 34. 第6章. 評価と考察本章では、本システムの評価と考察を行う。. 6.1 ニューラルネットワークの評価ニューラルネットワークを用いた本研究のモデルを評価する。第 4 章で述べたような入力データに基づいて、実際の日経 225 先物データを使用し、過去データにおけるトレーニングはニューラルネットワークにおける出力信号と、正解データである教師信号を比べることでその正答率等を評価する。未知データに対しては、過去データでトレーニングした場合のニューラルネットワークの構造を用い、学習していないデータに対して同様に出力信号と教師信号を比べることで評価している。. 6.2 ニューラルネットワークモデル y を 5 分後の株価として、 y = f (x1 , x2 , ..). (6.1). としている。各 x は第 4 章で述べた各係数である。f はニューラルネットワークの内部構造を表しており、中間層 1 層であり、ニューロン数が 50 個であるニューラルネットワークのシステムを表している。.

(41) 35. 6.2.1 トレーニング期間この入力に対して、正解である教師信号を過去のヒストリカルデータから求める。データは 2008 年の 7 月〜9 月の 3 ヶ月間をトレーニングの 3717 サンプルを用い、2008 年. 10 月の 1 ヶ月間 (1298 データ) に対して評価を行った。上記の 14 個のパラメータを入力に、y を株価が上がる、下がる、変わらないの 3 通りに分類している。5 分後に株価が 2 ティック以上上昇すれば、+1 を 2 ティック以上下降すれば −1 を、それ以外の場合には. 0 としている。2 ティックとしているのは、1 ティックの上下は、直前に約定した値段によって生じてしまう可能性があるためである。表 6.1. トレーニング結果. 教師信号. 予測. 全パターン総数. 全パターン正解数. 3717. 3326(89.5%). 上がる. 上がる正解数. 479. 264(55.1%). 変化なし. 変化なし正解数. 3067. 3005(98.0%). 下がる. 下がる正解数. 171. 57(33.3%). 6.2.2 テスト期間 2008 年の 10 月のデータ 1298 件に関して (未学習) テストを行った。結果を表 6.2 に示す。.

(42) 36 表 6.2 テスト結果. 教師信号. 予測. 未知テストデータ総数. 未知テストデータ正解数. 1298. 620(47.8%). 上がる. 上がる正解数. 378. 47(12.4%). 変化なし. 変化なし正解数. 677. 562(83.0%). 下がる. 下がる正解数. 172. 13(7.6%). 教師信号. 予測した個数 (不正解のものを含む). 上がる. 個数. 378. 168. 変化なし. 変化なし正解数. 677. 1088. 下がる. 下がる正解数. 172. 43. 6.3 結果の解釈この結果から、ニューラルネットワークの予想は「変化なし」という予想を多く出したことが分かる。ニューラルネットワークモデルが割と保守的に相場判定を見積もっていることになる。そこで、実際にこのシグナルを用いて売買を行ったときに有益な結果となっているのかを調べるために、簡単なテストを行ってみた。シミュレーションとして、ニューラルネットワークが「上がる」と予想した場合に、実際に上がれば +1 点を、変化なしならば 0 点を、下がってしまった場合には −1 点とする。また、ニューラルネットワークが「変化なし」と予想した場合に、実際に上がった場合、変化なしの場合、下がってしまった場合全てに関して 0 点を、ニューラルネットワークが「下がる」と予想した場合に、実際に下がれば +1 点を、変化なしならば 0 点を、上がっ.

(43) 37 てしまった場合には −1 点とする。この得点を時系列で累積させれば、ある程度、実際にこのシステムを使った場合に収益が上がりやすいかの目安になる、と考えている。この方法に基づき、時間と点数の関係をプロットした結果が図 6.1 である。割と安定して得点がプラス方向に進んでいることから、一定以上の予測能力があると考えられる。 25 20 得点. 15 10 5 0 -5 1 89 177 265 353 441 529 617 705 793 881 969 1057 1145 1233 時刻(5分毎). 図 6.1 ニューラルネットワークの評価. 6.4 指値約定確率の評価第 5 章の図から、指値執行確率の累積分布関数の理論形状と実測の形状は似ていることが分かり、遠い指値ほど約定しにくい様子をうまく表していると考えられる。このような状況を評価するのに、株価変動が正規分布をしているかどうかを統計的な検定を行うことで、本研究のモデルを評価する。1 分足の株価変化と 5 分足の株価変化に対して、D’Agostino-Pearson 検定と、Jarque-Bera 検定の 2 種類の検定を行った。. 6.4.1 尖度と歪度 2 つの検定の基礎となる、尖度と歪度について説明する。N 個のデータ x1 , x2 , x3 , ..., xN に対する統計量を考える。平均値 µ と、平均値周りの m 次中央モーメント µm を N 1 ∑ µ= xi N i=1. (6.2).

(44) 38. µm =. N 1 ∑ (xi − µ)m N i=1. (6.3). と定義すると、歪度は、. γ1 = µ3 /σ 3. (6.4). γ2 = µ4 /σ 4 − 3. (6.5). と表せる。尖度も同様に、. として表現できる。歪度は分布の左右非対称の度合いを表しており、尖度は分布の裾野の広さを表す。. 6.4.2 D’Agostino-Pearson 検定 D’Agostino-Pearson 検定とは、分布の 3 次モーメントである歪度と 4 次モーメントである尖度を利用して、正規分布であるかどうかを検定する手法である。. √ K 2 = Z 2 ( b1 ) + Z 2 (b2 ). (6.6). √. であり、 b1 が歪度で、b2 が尖度である。データが正規分布ならば、K 2 が自由度 2 のカイ二乗分布に従うことから、正規分布かどうかの検定が出来る。. 6.4.3 Jarque-Bera 検定 Jarque-Bera 検定も同様に、歪度と尖度を用いる。 T = n(. b1 (b2 − 3)2 )+ ) 6 24. (6.7). とした場合に、データが正規分布ならば、T が自由度 2 のカイ二乗分布に従うことから、正規分布かどうかの検定が出来る。. 6.4.4 検定の結果上記の手法を用いて、2008 年 6 月 2 日から 6 月 13 日までの 10 営業日の日経平均先物の 1 分足と 5 分足のデータを用いて、正規分布かどうかの検定を行った。結果を表 6.3,6.4 に示す。.

(45) 39 この結果から、1 分足の分布はおおむね正規分布ではないことが確認できる。しかし、. 5 分足の分布を見ると、ほとんどの場合で正規分布に従っている可能性があることが分かる。結果の解釈としては、1 分足の場合はノイズが多く、この程度の粒度であると、呼値の影響を強く受けるので、正規分布に従わないのであると考えられる。5 分足の粒度になると、その影響が小さくなるのではないかと考える。表 6.3. 正規分布の検定結果 (1 分足). 日付. K2. p-value. 検定結果. T. p-value. 検定結果. 2008/06/02. 60.2054. 0. 正規分布ではない. 400.278. 0. 正規分布ではない. 2008/06/03. 16.3668. 0.0002. 正規分布ではない. 20.0791. 0. 正規分布ではない. 2008/06/04. 159.6668. 0. 正規分布ではない. 3333.3769. 0. 正規分布ではない. 2008/06/05. 267.9248. 0. 正規分布ではない. 18059.725. 0. 正規分布ではない. 2008/06/06. 1.6265. 0.4434. 正規分布である. 0.5096. 0. 正規分布である. 2008/06/09. 38.342. 0. 正規分布ではない. 94.2788. 0. 正規分布ではない. 2008/06/10. 120.6949. 0. 正規分布ではない. 4099.6844. 0. 正規分布ではない. 2008/06/11. 445.1865. 0. 正規分布ではない. 114574. 0. 正規分布ではない. 2008/06/12. 19.0496. 0. 正規分布ではない. 42.3801. 0. 正規分布ではない. 2008/06/13. 2.1197. 0.3464. 正規分布である. 1.9011. 0.3865. 正規分布である.

(46) 40. 表 6.4. 正規分布の検定結果 (5 分足). 日付. K2. p-value. 検定結果. T. p-value. 検定結果. 2008/06/02. 17.8262. 0.0001. 正規分布ではない. 52.04. 0. 正規分布ではない. 2008/06/03. 2.1792. 0.3363. 正規分布である. 1.8743. 0.3917. 正規分布である. 2008/06/04. 1.4365. 0.4875. 正規分布である. 1.2428. 0.5371. 正規分布である. 2008/06/05. 13.486. 0.0011. 正規分布ではない. 15.9274. 0.0003. 正規分布ではない. 2008/06/06. 0.8227. 0.6627. 正規分布である. 0.6527. 0.7215. 正規分布である. 2008/06/09. 2.7816. 0.2488. 正規分布である. 2.1337. 0.344. 正規分布である. 2008/06/10. 49.5871. 0. 正規分布ではない. 283.1961. 0. 正規分布ではない. 2008/06/11. 37.8896. 0. 正規分布ではない. 142.7311. 0. 正規分布ではない. 2008/06/12. 1.6006. 0.4491. 正規分布である. 0.8694. 0.6474. 正規分布である. 2008/06/13. 1.2486. 0.5356. 正規分布である. 1.0328. 0.5966. 正規分布である.

(47) 41. 第7章. 結論本章では、本論文の結論とまとめを述べる。. 7.1 結論とまとめ本研究においては、ニューラルネットワークによる相場予測、ならびに指値の執行確率についての分析を行った。ニューラルネットワークによる相場予測に関して、ある程度予測力があるという結果が得られ、指値の執行確率を「何分でどれだけの確率で約定するか」という視点で数理モデルで表現した。ニューラルネットワークの予測に関しても、ある程度相場の予測能力があると考えられる。具体的に何のファクターが効いたか、という部分は見えづらい部分もあるが、ニューラルネットワークのような機械学習によるアプローチが、株価の予測やマーケットの性質を解明するのに役に立っていると考えられるだろう。指値の約定確率に関して、パラメータをうまく推定できれば、実測のデータと理論曲線は非常に近いものになると考えられる。株価がブラウン運動のような性質を持っているということが大前提となるが、短い期間における株価変動をどのようにモデリングすべきかという問題は非常に興味深い。数理ファイナンスの世界で、幾何ブラウン運動のような株価モデルがベーシックであったが、短い期間に関してはノイズや非定常的な動きも多く、どんな性質を持っているかは今後の研究課題であろう。そして、大量のデータから、パラメトリックな分布にフィットするようなモデルの構築は今後も求められていくであろうと考えられる。この 2 つをアイディアを組み合わせることで、より効率的に安い値段で買い、高い値段.

(48) 42 で売れるような執行が出来るのではないかと考えられる。予測精度は万全とは言えないが、このような研究は今後も市場の環境の変化と共に多くなるだろうと考えられる。近年のようなマーケット環境がより高速になっている中で、指値をどこに何分指せば良いかという問題には関心が高まりつつあると考えられ、さらなる研究が求められている。.

(49) 43. 第8章. 付録アルゴリズムトレーディングの世界アルゴリズムトレーディングとは、主に機関投資家が利用しており、与えられた株数を指定時間内に良い値段で執行させるための手法であり、大きな注文を分割することでマーケットインパクトを抑えることや、注文の手口を読まれないようにするなどといった目的のために使用される場合もある。近年においては、高頻度売買 (High Frequency Trading) のような手法をヘッジファンドや投資銀行の自己売買部門などが使用するようになり、物理的に速く取引所に接続させる、コロケーションシステムやプロキシミティホスティングなどと呼ばれるシステムも需要が高まっている。アメリカの株式 42 ％のボリュームは HFT の注文であり、2010 年までに 54 ％ほどになると推測されており、非常に大きな市場規模となっている [23]。. 8.1 代表的な執行アルゴリズム執行のためのアルゴリズム取引の例を、簡単に紹介する。図 8.1 は、Interactive. Brokers[24] におけるアルゴリズム取引の注文の例である。.

(50) 44. 図 8.1. 多様なアルゴリズム取引. 8.1.1 VWAP VWAP とは、Volume. Weighted. Average. Price の略称で、当日の市場で成立. した価格を価格毎の売買高で加重平均した価格のことである。出来高のような、実際の取引を反映した上での平均的な約定値段を表しており、機関投資家の執行価格の目標として用いられる。売買代金を出来高で割れば計算できる。. 8.1.2 TWAP TWAP とは、Time Weighted Average Price の略称で、注文を時間間隔でスライスして約定させるストラテジーであり、ベンチマークとしても用いられる。しばしば観測されるパターンとしては、VWAP は前場で 40 ％の売買、後場で 60 ％の売買のように、時間によって偏りがある場合が多いが、TWAP を用いると、前場で 50 ％の売買、後場で 50 ％の売買のように、時間に対して分散しているという傾向がある。.

(51) 45. 8.1.3 Market-on-Close (MOC) MOC とは、出来るだけマーケットの終値 (引け) の値段に近づけて約定させる注文である。一日のポジションを評価するのに終値が用いられることも多いため、このような注文方法のニーズは多い。. 8.1.4 Arrival Price Arrival Price とは、Ask(売り) と bid(買い) の中間の値段付近で約定させようとするアルゴリズムであり、全体として、株価の時間平均に近い約定を目指す執行方法である。. 8.1.5 Percent of Volume Percent of Volume とは、注文量と 1 日の出来高分布を決定すれば、出来高の一定比率をターゲットに約定をさせることを目標とするアルゴリズムである。. 8.1.6 Iceberg Iceberg とは、大きな注文を出す場合に、自分の手口が読まれないように、少しずつ注文を出す手法である。また、板にも大きな注文は見せないようにする。. 8.2 Statistical Arbitrage Statistical Arbitrage(統計的裁定) とは、主に、マーケットで生じる価格の歪みを収益源とする戦略のことで、例えば、同じ業種の似たような 2 銘柄の価格差が広がったときに、片方のポジションをロングし、もう片方をショートするようなペアトレードが伝統的な手法である。近年の Statistical Arbitrage として、高頻度売買 (High Frequency Trading) が広がる中、短い期間のトレードの優位性について着目されている。単純なモデルを考えると、以下のような手順で、短い期間のトレードの優位性を示すことが出来る。株 i の株価を xi とすると、時間 dt の間にはリターンは dXi /Xi となり、対数リターンは d log Xi となる。株を組み合わせるポートフォリオを考え、ポート.

(52) 46 フォリオの価値を P とする。各ポートフォリオのウェイトをそれぞれ p1 , ..., pn とする。. p1 + ... + pn = 1 である。Xi に投資されたポートフォリオの価値は pi P となる。ウェイトは独立な確率過程とすると、この関係を. ∑ dXi dP = pi P Xi i=1 n. (8.1). と表現できる。これが対数リターンになると、. d log P =. n ∑. pi d log Xi + γp∗ dt. (8.2). i=1. となり、γp∗ は. 1∑ 2 = pi σip 2 i=1 n. γp∗. (8.3). 2 はポートフォリオに対する Xi の分散 (σip は P に対する Xi のトとなる。ここで、σip. ラッキングエラーと考えられる) である。γp∗ は P の超過成長率である。この式から、ロングオンリーのポートフォリオを構築すると、ポートフォリオの対数リターンは、それぞれの構成要素の銘柄の対数リターンの平均を上回り、その差が超過成長率である γp∗ となる。理論的には短い期間では、このリターンは非常に小さく、捉えることは非常に難しいが、近年のトレード環境の変化や、取引所やブローカーの執行コストが小さくなりつつあるので、このようなポートフォリオを細かくリバランスするストラテジーが機能する可能性が示唆されている [25]。.

(53) 47. 参考文献 [1] Why BATS? BATS Exchange, http://batstrading.com/resources/features/bats exchange why bats.pdf [2] Fama, Eugene. Efficient Capital Markets: A Review of Theory and Empirical Work, The Journal of Finance, v. 25 (2), pp. 383-417. 1970 [3] 東京証券取引所, Arrowhead, http://www.tse.or.jp/rules/stock/arrowhead/pamphlet.html [4] Wu, Shaun-Inn and Lu, Ruey-Pyng, Combining artificial neural networks and statistics for stock-market forecasting, CSC ’93: Proceedings of the 1993 ACM conference on Computer science [5] Skabar, Andrew and Cloete, Ian, Neural networks, financial trading and the efficient markets hypothesis, ACSC ’02: Proceedings of the twenty-fifth Australasian conference on Computer science, p241-249, 2002 [6] 高穂洋荒井隆行大竹敢田中衛, ニューラルネットワークによる次期の株価予測 : 株価予測におけるフィルタリングによる特徴量抽出, 電子情報通信学会技術研究報告.. NLP, 非線形問題, vol102, p13-16, 2002 [7] 水田孝信小林悟加藤徳史, 株式クオンツモデルでの過適合, 情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告, vol2008 p35-38, 2008 [8] Yacine Ait-Sahalia, Per A. Mykland, Lan Zhang, Ultra High Frequency Volatility Estimation with Dependent Microstructure Noise. Working Paper, Princeton University, University of Chicago, and University of Illinois. (2006). [9] Murat Ahmed, Anwei Chai, Xiaowei Ding, Yunjiang Jiang, Yunting Sun, Statistical Arbitrage in High Frequency Trading Based on Limit Order Book Dynamics, Working paper, 2009 [10] Andrew Pole, Statistical Arbitrage: Algorithmic Trading Insights and Tech-.

(54) 48 niques, Wiley Finance, 2007 [11] Zovko, I., J. D. Farmer. The power of patience; A behavioral regularity in limit order placement. Quantitative Finance 2 387-392. (2002) [12] Bessembinder, Hendrik. Trade Execution Costs and Market Quality after Decimalization. Journal of Financial and Quantitative Analysis 38, 747–778. (2003) [13] 宇野淳, 価格はなぜ動くのか, 金融マーケットの謎を解き明かす, 日経 BP 社 (2008) [14] Rama Cont, Sasha Stoikov, Rishi Talreja, A Stochastic Model for Order Book Dynamics, Working Paper, SSRN, (2008) [15] 見並良治, 久米川昌弘, 尹煕元株式市場における売買注文状況と日中価格変動の解析, The 22nd Annual Conference of the Japanese Society for Artificial. Intelligence, 2008 [16] Foucault, T., O. Kadan, E. Kandel. 2005. Limit order book as a market for liquidity. Review of Financial Studies 18(4) 1171-1217 [17] ニ. ュ. ー. ラ. ル. ネ. ッ. ト. ワ. ー. ク,. http://www.gifu-. nct.ac.jp/elec/deguchi/sotsuron/niwa/ [18] 岩田彰・松原俊之. :. ニューラルネットワーク入門,. http://mars.elcom.nitech.ac.jp/java-cai/neuro/menu.html (1996). [19] Ryan Garvey, Fei Wu, Intraday time and order execution quality dimensions, Volume 12, Issue 2, Pages 203-228 , 2009 [20] Fast Artificial Neural Network Library(FANN) http://leenissen.dk/fann/ [21] Black, Fischer and Myron Scholes, The Pricing of Options and Corporate Liabilities, Journal of Political Economy, Vol. 81, No. 3, (May/June 1973), pp. 637-654. [22] S.E. シュリーヴ (著), 今井達也 (翻訳), 河野祐一 (翻訳), 田中久充 (翻訳), 長山いづみ (翻訳) , ファイナンスのための確率解析, シュプリンガー. [23] Celent’s David Easthope , Chermaine Lee , High Frequency Equities Trading: From the U.S. to Asia?, Advanced Trading http://www.advancedtrading.com/algorithms/showArticle.jhtml?articleID=22260007 [24] Interactive Brokers, http://www.interactivebrokers.com/en/p.php?f=orderTypes [25] Robert Fernholz and Cary Maguire, Jr. The Statistics of StatisticalArbitrage, Financial Analyst Journal vol.63, number5, CFA Institute, 2007.

(55) 49. 謝辞本修士論文の作成にあたって、日頃より御指導・御助言を頂いている村岡洋一教授に深く感謝致します。また、本研究のためのデータを提供して下さった、トレード・サイエンスの方々にはお世話になりました。さらに、数々の御助言・御意見を下さった秋岡さやか先生をはじめとする村岡研究室のみなさんに感謝致します。どうもありがとうございました。.

(56) 50. 付録. 外部発表. 本研究に関しましては、下記にて、外部発表を行いました。. • 学会名：第 4 回人工知能学会ファイナンスにおける人工知能応用研究会（SIGFIN）, 産業技術総合研究所臨海副都心センター • 発表論文タイトル：板情報を利用した指値執行システムの提案 • 著者：大矢倫靖，村岡洋一 • 開催日時：2010 年 1 月 23 日 • 雑誌:人工知能学会研究会資料. SIG-FIN-004-01 page 34-39.

(57)

板情報を利用した 指値執行システムの提案

板情報を利用した指値執行システムの提案