金融関連会社に関する日経NEEDS 財務データにもとづくデータベースの構築
37
0
0
全文
(2) 35. 金融関連会社に関する日経 NEEDS 財務データに もとづくデータベースの構築. 地. . 道. 正. 行. はじめに. 本稿で扱うテーマは, 拙稿 (地道 (2010 a, b)) で扱った 「一般事業会社」 の学内向けの財務データ抽出システム KGUSBADES1) を 「金融関連会社」 を含めたものに拡張することにある2). 具体的には, 2010年版 「日経 NEEDS 財務データ」 MT 3) 版で提供されている 「銀行」, 「証券 (会社)」, 「保険 (会 社)」 の財務データを利用したデータベースと抽出システムを構築する. 本稿の構成は以下のようなものである. まず, Ⅱ節では 「銀行」 を例とし たデータベースの構築に関して述べる. 次に, Ⅲ節において, Web サーバ Apache4) と MySQL5) を PHP 6) を用いて連携させることによって Web ブラウ ザを使ってデータ抽出を可能とするシステムについて述べるとともに, Ⅳ節 において, このデータ抽出サービスを実際に利用する例を与える. 特に, デー タ解析環境 7) からデータベースに ODBC8) を使ってアクセスし, データ抽 1) 2). 3) 4) 5) 6) 7). Kwansei Gakuin University, School of Business Administration, Data Extraction System の略. なお, 詳細は割愛するけれども, 今回の構築に際して地道 (2010a, b) で扱われた 「一般事業会社」に関するデータもまた2010年版のものにバージョンアップしている ことに注意しよう. Magnetic Tape の略.
(3)
(4)
(5)
(6) . − 35 −.
(7) 36. 地. 道. 正. 行. 出を行うことに言及する. 最後に, Ⅴ節においてまとめと今後の展望につい て述べる. なお, 付録には日経 NEEDS 財務データ MT 版の解説とそれにも とづいて構築されたデータベースの構造や構築に利用される各種のスクリプ トのソースコードのリスト等が与えられる.. . データベースの構築. 今回構築するデータベースは, 「銀行」, 「証券 (会社)」, 「保険 (会社)」 に関する3種類のデータと, それらの 「連結本決算」 と 「単独本決算」 に関 するもの, さらに, 開発プラットフォームとして, Mac OS X Server 10.5, Ubuntu9) 11.04, Windows 7 の3種類のものが存在するけれども, 簡単のため 「銀行」 に関する連結本決算にもとづくベータベースの構築をプラットフォー ムに共通した手順のみに限定して述べることにする. なお, LAMP 10) 環境が 設定済みであることを前提としていることに注意しよう. (LAMP 環境の構 a, b) を参照のこと.) 築に関しては, たとえば, 地道 (2010 まず, データベースの設計に関して以下のことに注意する. 「銀行」 に関する連結本決算のデータベースの設計項目 (設計項目1) 連結本決算データ (日経によるコード:) に対するデー タベース (
(8) ) の構造として, レコード種別 (,..., ) に対応するテーブル ( ,..., ) を持つものを作成する. (設計項目2) 社名から日経会社コードなどを検索可能にするために社名リストのテー ブル (
(9) ) を作成する.. ここで日経 NEEDS のデータに関するコードの詳細等については付録Aを, またデータベースに関するテーブルのコードなどの情報を含む詳細な構造に ついては付録Bを参照されたい. 8) Open DataBase Connectivity の略. 9) 10) Linux, Apache, MySQL, PHP の略.正確には OS が Windows であれば WAMP, MacOS X のときは, MAMP となるけれども, 統一的な表記として LAMP を採用することに 注意しよう..
(10) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 37. 各手順で利用されるスクリプトファイルは表1のようなものである. なお, これらのファイルのソースコードの一部については, 付録Dで与えられてい るので参照されたい. 表1:データベース構築のためのスクリプトファイル ファイル名. 説明. . データファイルの前処理を行うシェルスクリプトから なるファイル. . ファイルにおける適切な箇所にフィールドを区切るセ パレータを挿入するための Perl スクリプトファイル.
(11) !. データベースとテーブルを作成し, によっ て作成されたテーブル単位のデータファイルを MySQL にロードするための SQL スクリプトファイル. "#
(12) ! 社名リストファイル "#$%&を MySQL へロードするための SQL スクリプトファイル. 以下に, 「銀行」 を例としてデータベース構築の手順を簡潔に与える11). (手順 1) ファイルの前処理 シェルスクリプト・ファイル と圧縮された連結本決算 のデータファイル.
(13) .
(14) を適当なディレクトリに保存後, ターミナルを起動し, そのディレ クトリに移動した後, 以下のように を実行する. (な お, はシェルプロンプトである.) '$'. このスクリプトは, 以下の操作を行う. . コマンドでデータファイルを展開した後, リダイレク. a, b) に関するものとほぼ同様であることに注意し 11) ここで与える手順は地道 (2010 よう..
(15) 38. 地. 道. 正. 行. ション (, ) を使ってこれらを1つのファイル . にまとめる. grep, sed, Perl 等のコマンドやインタプリタを使って, このファ イルから
(16) ,...,
(17) という文字列を含む行を個別に抜き出 す. . Perl スクリプトファイル を読み込んで, 各ファ イルのフィールド間に tab (‘’) をセパレータとして挿入し たファイル
(18) ,...,
(19) を作成する. (図1も参照.). 図1:データファイルの前処理. なお, Mac OS X Server と Ubuntu においてファイル
(20) ,...,
(21) を作成する最終段階で文字コードを UTF8 に変換しておく必要があることに注意しよう. なお, 詳細は地道 (2010a, b) を参照されたい..
(22) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 39. (手順 2) ファイルの移動 (手順1)で作成したファイル ,..., を MySQL のルートディレクトリに移動 (またはコピー) する. なお, OS 毎の MySQL のルートディレクトリはデフォルトで以下 のようなものである. OS. MySQL のルートディレクトリの場所. Mac OS X Server. #$# . Ubuntu. #$# %# . Windows. &'()%! )$'
(23) '. (手順 3) データベースとテーブルの作成 ターミナルで
(24) が存在するディレクトリに移動 し, コマンドを使って, MySQL モニタを 権限で起動 後, コマンドを以下のように実行する.
(25) . ここで, は MySQL のプロンプトである.
(26) は以下の操作を行うスクリプトである. . コ マ ン ド で デ ー タ ベ ー ス と テ ー ブ ル ,..., !を作成する.. . "コマンドを使って, (手順1) で作成したデータファイ ル ,..., を テ ー ブ ル ,..., ! に読み込む. (図2も参照.).
(27) 40. 地. 道. 正. 行. 図2:データファイルのロード. (手順 4) 社名リストのテーブルの作成 a, b) で行ったように社名リストのテーブル作成は 地道 (2010 Windows 上で行い, 作成されたファイルを個々のプラットフォー ムのデータベースに読み込む手順で行う. なお, 以下の手順におい a, b) で与えられた方法と て による処理については地道 (2010 全く同じであるため割愛する. (L1)会社情報のファイルへの出力 一旦作成したデータベース のテーブル か ら, 銀行の日経会社コード (
(28) ), 株価コード (), 日経 業種コード ( ), 社名 (銀行名) に関する情報 ( ,..., ) を抽出しファイルへ書き出す. 実際の作業は, MySQL モニタで以下のコマンドを実行する. (紙面の都合上, スクリ プトの途中で改行していることに注意.).
(29) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 41. !" #$# #%& #$& ''&#()&#('&#(*&#(%&#($& #(+&#((&#(,&#(-&#,#./. 01
(30) 0 /.2.234050//))6. (L2)によるファイル処理 a, b) で与えられた方法を使って, を用いた処 地道 (2010 理を行い, 社名リストのファイル
(31) を生 成する. (L3)社名リストファイルのデータベースへの読み込み ファイル
(32) を MySQL のフォルダへコピー 後, MySQL モニタから コマンドを用いてスクリプト ファイル
(33) を実行する.
(34) . (図3も参照.). 図3:社名リストファイルのロード. (手順 5) データ抽出専用ユーザ の登録 セキュリティの観点から, 多くのユーザがデータベースを利用する ことを考え, データ抽出専用のユーザ を登録する. MySQL モニタを起動し, , コマンドを用いて以下のように 行う..
(35) 42. 地. 道. 正. 行.
(36)
(37)
(38) !"#"$% & ! &'. ここで, は, ユーザ のパスワードを与える.. . データ抽出システム. Ⅱ節で構築されたデータベースから Web 経由でデータを抽出するための システムにおいてサービス手順とその仕様は地道 (2010a, b) で与えられ たものとほぼ同様であるので概要を表す図4と各仕様で利用される主要なファ イルの説明を表2に与えるにとどめる.. SELECT.... submit. Reset. 図4:データ抽出システムの概要.
(39) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 43. 表2:データ抽出システムのためのスクリプト ファイル名. 説明. SQL 問合せのスクリプトをサーバへ送信するための HTML .
(40)
(41) ファイル の機能を使って PHP スクリプト .
(42) へ SQL 問合せを送信 () する.
(43)
(44) 以下の役割を果たす PHP スクリプトファイル 1.
(45)
(46) によって送信された.
(47) SQL 問合せの受け取り 2. SQL 問合せの内容をシェルのプロセス ID 付きで SQL スクリプトファイル
(48) に出力 3. ファイル
(49) の内 容を引数として を実行することによって抽出 結果を
(50)
(51) に出力 ここで, にはシェルのプロセス ID が与えられる.
(52)
(53)
(54) によって出力される SQL.
(55) スクリプトファイル.
(56)
(57)
(58) に よ っ て 出 力 さ れ る.
(59)
(60) HTML ファイル.. . データベースの利用. この節では, データベースを Web 経由で利用する場合と, から ODBC 経由で利用する場合について述べる. なお, 両方ともデータの抽出には SQL 問合せ (SQL query) を記述することによって利用する方式をとることに注 意しよう. また, SQL 問合せの例を付録Cに与えているので参照されたい.. .1. Web による利用. サーバへのアクセスは, 学内から Internet Explorer (以下 IE と略.) など の Web ブラウザで適切な URL にアクセスすればよい12). 図5は, IE を使っ てデータ抽出システムのトップページにアクセスしたときのイメージであ 12) 現時点では以下の URL が利用可能である:
(61)
(62) !""
(63) # $ #%&"'()*+",)
(64)
(65)
(66) !"" $ #%&"'()*+",%. / -.
(67) 44. 地. 道. 正. 行. 図5:IE でデータ抽出システム KGUSBADES にアクセスしたときのイメージ. る13). 現時点で行われているサービスとしては日経 NEEDS 財務データにもと づく以下のようなデータ抽出であり, トップページにリンクが用意されてい る. ●. 一般事業会社 (連結本決算, 単独本決算). ●. 銀行 (連結本決算, 単独本決算). ●. 証券 (会社) (連結本決算, 単独本決算). 13) 日々開発が進められているため, 意匠は適宜変更される可能性があることに注意しよ う..
(68) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築 ●. 45. 保険 (会社) (連結本決算, 単独本決算). また, データベースからデータを抽出する際に必要となる情報である各種 のテーブルのファイルが HTML, PDF 形式でそれぞれ以下のように用意さ れているので, 適宜参照されたい. ●. ヘッダー詳細 (連結, 単独, FA∼FG 共通). ●. データレイアウト (連結, 単独共通). ●. 日経業種コードテーブル. なお, 付録Bにデータベースの構造と各種のテーブルと同等の表を与えてい るのであわせて参照されたい. データ抽出システム KGUSBADES のトップページから, たとえば 「銀行」 という行の 「連結本決算」 というリンクをクリックすることによって, 銀行 に関する連結本決算のデータを抽出するためのページにアクセスすることが できる. 図6は, IE を使ってページにアクセスしたときのイメージとその 説明である.. 図6:IE で銀行 (連結本決算) に関するデータ抽出システムのページに アクセスしたときのイメージとその説明. 実際にデータ抽出を行うには, スクリプト入力ボックス に SQL 問合せの スクリプトを入力し, ボタンをクリックすることによって結果が画.
(69) 46. 地. 道. 正. 行. 面に表示される. ここでは, 収録されている全銀行の日経会社コード, 社名等のデータを全 て抽出することを例として, データ抽出システムの例を以下に与える. IE 等の Web ブラウザを使って銀行の連結本決算データを抽出するシステムの トップページにアクセスした後, SQL スクリプトの例1をスクリプト入力 ボックスへコピー&ペーストし, ボタンをクリックする. 図7も参 照せよ.. 図7:データ抽出の例:収録されている全銀行の日経会社コード, 社名等の抽出. 以上のような手順によって, ブラウザ上に図8のような結果が表示される..
(70) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 47. 図8:データ抽出の結果:収録されている全行の日経会社コード, 社名等の抽出結果. 次に, 2010年3月31日決算の東京証券取引所1部上場銀行の 「決算年月日」 と 「経常収益合計」, 「経常利益」 を日経会社コード順に抽出し, MS Excel を用いて散布図の描画を行う例を以下に与える. なお, SQL 問合せの詳細に ついては付録Cを参照されたい. まず, 先の例と同様に, SQL 問合せ ( SQL Scripts: の3番目の例) を スクリプト入力ボックス に入力し, Submit ボタンをクリックする. すると, 抽出結果が表示されるので, [編集] メニューから [すべてを選択] を選び, さらに [コピー] を選ぶ..
(71) 48. 地. 道. 正. 行. 図9:2010年3月31日決算の東京証券取引所1部上場銀行の「決算年月日」, 「経常収益合計」,「経常利益」の抽出とコピー. 次に, MS Excel を起動後, 適切な箇所にペーストし, 列名を適切に変更 後, 「経常収益合計」, 「経常利益」 の列を選択し散布図を描く.. 図10:2010年3月31日決算の東京証券取引所1部上場銀行の「経常収益合計」と 「経常利益」の散布図 (列名を適切に修正していることに注意). .2. による利用. ここでは, データベースとの連携を行う仕組みであるオープン・データベー ス・コネクティビティ (Open Database Connectivity; ODBC) を に実装し たパッケージ を利用して銀行に関する連結本決算のデータベース.
(72) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 49. からデータを抽出する例を与える. なお, ODBC と
(73) パッ ケージの説明に関しては, たとえば, スペクター (2008), 地道 (2010a, b) を参照されたい. データの抽出に関しては, 以下のような入力を行ってパッケージの読み込 みとコネクションの確立を行っておく必要があることに注意しよう. 具体的 には, を起動し, [R Console] において 関数を使って
(74) パ ッ ケ ー ジ を 読 み 込 み , 関 数 を 利 用 し て デ ー タ ベ ー ス とコネクションを確立する. (
(75) ) # ($ $). ここで, は のプロンプトであり, は ODBC ドライバのインストール時に登録した DSN14) の名称である. なお, 各種の データベースに対応した DSN は以下の表のように与えられる. 表3:データベースコードと DSN 名の対応 業 種. DB コード (連結). DSN. 一般事業会社 %. DB コード (単独). DSN. %. 銀行. . . 証券会社. . . 保険会社. . この入力によって, オブジェクトに と銀行に関 する連結本決算のデータベース との間に確立したコネクショ ンに関する情報が格納される. この後の操作は, オブジェク ト の情報をもとに の関数 !"を利用し, SQL 問合せをデー タベースに送信することによってデータ抽出が行われることに注意しよう. 14) Data Source Name の略.ODBC において, データ (ベース) へのアクセスに必要な 情報の照会に使用される論理名のこと..
(76) 50. 地. 道. 正. 行. みずほ銀行の預金合計の抽出 (年月日順抽出) みずほ銀行の 「預金合計」 を収録されている年度すべてに関して抽出する ことを例として与える. (みずほ銀行の日経会社コードが である ことに注意しよう. なお, 誌面の都合上, 行の途中で折り返している.)
(77) (
(78) , , , !"#$$%& '((! ) *+). ここでは, SQL 問合せをデータベースに送信し, 結果をオブジェクト に 代入している. なお, は 「決算年月日」, 「決算期間」, 「預金合計」 を列に 持つ以下のようなオブジェクトである. $ ,,$ $-$-. $,,$ $,$-,-$ , ,,$ $,/-,,$ ,,,$ $0-,. . ,,$ $..0 / .,,$ $.-,. /,,$ $.,0 0 ,,$ $.,.,/ - 0,,$ $.,.- $ -,,$ $ ..,$$/$$ $,,$ $ ..$0,.. このように抽出されたデータは以下のように入力することによって時系列プ ロットを描くことができる. 1 () (23$4), 23,431 '( (3 '(年月日(3 '(預金合計() 5 ((みずほ銀行の預金合計(). なお, このような入力によって [R Graphics] ウィンドウに図11のようなプ ロットが描画される..
(79) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 51. 4.5e+07 4.0e+07 3.0e+07. 3.5e+07. 預金合計. 5.0e+07. 5.5e+07. みずほ銀行の預金合計. 2000. 2002. 2004. 2006. 2008. 2010. 年月日. 図11:みずほ銀行の預金合計の時系列プロット. 東証1部上場銀行の経常収益合計と経常利益のパネルデータ抽出 東証1部上場銀行の 「日経会社コード」, 「銀行名」, 「決算年月日」, 「経常 収益合計」, 「経常利益」 のパネルデータを 「日経会社コード」 と 「決算年月 日」 順に抽出し, オブジェクト に代入する例を以下に与える.
(80) ( , !"#"$%&
(81) &&&'()* +),-
(82) )-.
(83) /01"("2.33)(4"(56& ). ここで, オブジェクト は, 「日経会社コード」 () と 「銀行名」 の漢字略称(
(84) ), 「決算年月日」 (), 「経常 収益合計」 (), 「経常利益」 () を列としてもつオブ.
(85) 52. 地. 道. 正. 行. ジェクトであり, 時間的な推移をもつ特定の個体群のパネルデータ (panel data) であることに注意しよう. オブジェクト は, 850行, 5列のデータフレーム・オブジェクトであり, 列名を関数 を使って与え, 関数 を使って先頭の6行を表 示すると以下のようになる.. ()(日経会社コード銀行名決算年月日経常収益合計 経常利益) () 日経会社コード 銀行名 決算年月日 経常収益合計 経常利益 八千代銀行 八千代銀行 八千代銀行 八千代銀行 八千代銀行 八千代銀行 . 地道 (2010b) にならって, このオブジェクトに対して, 東証1部上場の 銀行に関する財務指標の時間的な推移を 「母集団」 と 「個体」 の観点から考 察するために以下のようなプロットを行う. 「経常収益合計」 と 「経常利益」 に関する散布図を単年度毎にプロット 収録されている個々の銀行に対する 「経常利益」 の時系列プロット これらのプロットを行うためには, アドオン・パッケージ
(86)
(87) 15) を利 用することが効果的である. パッケージのロードは以下のように行う. (
(88)
(89) ). このパッケージには高機能の散布図を描くための関数
(90) が用意され ている.. 15) 多変量データに関する様々なグラフを作成するためのツールを備えたパッケージ, ショー カー (2009) 参照..
(91) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 53. 単年度毎の散布図のプロット:単年度毎の 「経常収益合計」 に対する 「経常 利益」 の散布図を描くためには以下のように入力する. (経常利益
(92) 経常収益合計 (決算年月日 ) ( )). ここでは, 関数によってデータフレーム の属性の一つである 「決算年月日」 を 「年」 ( )に変換したものを条件として与える ( ) こと によって各年毎の 「経常収益合計」 に対する 「経常利益」 を対応させる (経 常利益
(93) 経常収益合計) 散布図を描くことを行っている. その際, プロット に利用される点の種類 (20番が “ ● ” に対応) を で与え, プロット のタイプ ( ) として点 ( ) と基準グリッド () を与える指定を 行っていることに注意しよう.. 図12:2000年∼2010年における東証1部上場銀行の単年度毎の「経常収益合計」 と「経常利益」に関する散布図(時系列順プロット).
(94) 54. 地. 道. 正. 行. 銀行毎に対する経常利益の時系列プロット:「経常収益」 の時系列プロット を銀行毎に描画することを考える. パネルデータ における個々の銀行の 「経常利益」 の時系列プロットを行うためには以下のように入力する.
(95) (経常利益決算年月日 銀行名
(96) (
(97) )). ここで, 「銀行名」 で条件付けを行い, プロットのタイプ () が直線 と点の両方 (both) () を指定していることに注意しよう. また, .
(98) (
(99) ) というオプションを与えることによってス. 図13:東証1部上場銀行 (83行) を対象とした「経常利益」の時系列プロット.
(100) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 55. トリップ16) に表示されるテキストの大きさを 0.4 倍していることにも注意し よう.. . おわりに. 本稿は, 日経 NEEDS 財務データ MT 版にもとづいて金融関連会社に関 するデータベースの構築を行い, その利用法に関して述べてきた. 今回の構 a) で課題として指摘されていた金融関連会社の財 築によって, 地道 (2010 務データ等の抽出サービスを充実させることがある意味で実現したことにな る. 一方, 今後データベースを迅速かつ正確に構築したり, サービスの拡大 を行うのであれば, 構築過程を自動化するスクリプトを開発する必要性が新 たな課題として認識されたことも付記しておきたい. この課題の実現のため には Unix 系 OS で標準的なツールである を利用したものがその候補 として考えられる. なお, データ抽出環境はある程度整ってきたと考えてよ いので, これらのデータベースを利用した非線形モデルにもとづく実証分析 等が今後のメインの課題となるであろう. (筆者は関西学院大学商学部教授). 謝辞 a, b) における環境が 本稿で扱ったデータベースの構築は, 地道 (2010 なければ実現できなかったことから, そのシステムの構築に際して得た関西 学院大学・商学部・産業研究所からの資金面での援助, およびシステム構築 に関する有益なコメントをいただいた関西学院大学経済学部豊原法彦教授に 対して心から感謝の意を表したい.. 16) パッケージに付属のプロット関数は複数の矩形パネルが格子状に配列され た形状をもち, 各パネルにはそこにプロットされる変数名などを表示する「帯」状の 領域があり, ストリップ (strip) とよばれる..
(101) 56. 地. 道. 正. 行. 参考文献 [ 1 ] P. デュボワ (赤井誠他訳) (2003). MySQL クックブック VOLUME 1, 2 , オラ. イリー・ジャパン. 地道正行 (2010a) 日経 NEEDS 財務データにもとづくデータベースサーバの構 築 , 商学論究, 第57巻, 第4号, pp. 2380.. [2]. 地道正行 (2010 b) 財務データベースサーバの構築 , 関西学院大学レポジトリ,
(102)
(103)
(104)
(105) ,. [3]. ISBN:9784990553005. [4]. 増永良文 (2003). [5]. 日本経済新聞社デジタルメディア編 (2010). リレーショナルデータベース入門 [新訂版] , サイエンス社. NEEDS 財務データ一般事業会社レ. イアウト Ver. 4. 19 , 日経メディアマーケティング株式会社. [6]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ一般事業会社項. 目定義書 Ver. 4. 31 , 日経メディアマーケティング株式会社. [7]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ銀行レイアウト. Ver. 4. 19 , 日経メディアマーケティング株式会社. [8]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ銀行項目定義書. Ver. 4. 17 , 日経メディアマーケティング株式会社. [9]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ証券レイアウト. Ver. 4. 15 , 日経メディアマーケティング株式会社. [10]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ証券項目定義書. Ver. 4. 14 , 日経メディアマーケティング株式会社. [11]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ保険レイアウト. Ver. 4. 14 , 日経メディアマーケティング株式会社. [12]. 日本経済新聞社デジタルメディア編 (2010). NEEDS 財務データ保険項目定義書. Ver. 4. 14 , 日経メディアマーケティング株式会社. [13]. 西沢夢路 (2007). 基礎からの MySQL , SoftBank Creative.. [14] D. ショーカー (石田基広, 石田和枝共訳) (2009). R グラフィックス自由自在 ,. シュプリンガー・ジャパン. [15] P. スペクター (石田基広, 石田和枝 共訳) (2008). R データ自由自在 , シュプリ. ンガー・ジャパン. [16] R Development Core Team (2011) R Data Import / Export, URL , R Foundataion for Statistical Computing, Vienna, Austria, ISBN 3 90005110 0. [17]. 豊原法彦 (2004). 地域総合データ読出しシステムの構築 , 経済学論究, 第58巻3. 号, pp 159175. [18]. 豊原法彦 (2009). SQL を用いた日経総合経済ファイル読出しシステムの開発 ,. 経済学論究, 第63巻第3号, pp 165177..
(106) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 57. 付録. A. 日経 NEEDS 財務データ MT 版に関する解説. A. 1. 提供データ. 本稿で利用したデータセットは, 日経メディアマーケティング株式会社か ら提供されている 「日経 NEEDS 財務データ MT 版」 である. 収録されてい るデータは 「財務確報」 に関する 「決算期データ」 であり, 全国上場会社 (ヘラクレス, マザーズ含む, 外国部除く), ジャスダック上場会社, 非上場 有価証券報告書提出会社等の財務関連の情報が表4∼7に与えれているファ イル (gzip 形式) に納められている. 表4:日経 NEEDS データ MT 版ファイル一覧:一般事業会社 ファイル名. 決算種別. 説明.
(107) . 連結本決算.
(108) 年代のデータファイル (圧縮済).
(109) . 連結本決算.
(110) 年代のデータファイル (圧縮済).
(111)
(112) . 連結本決算.
(113)
(114) 年代のデータファイル (圧縮済). . 連結本決算. 年代のデータファイル (圧縮済). . 連結本決算. 年代のデータファイル (圧縮済).
(115) . 単独本決算.
(116) 年代のデータファイル (圧縮済).
(117) . 単独本決算.
(118) 年代のデータファイル (圧縮済).
(119) . 単独本決算.
(120) 年代のデータファイル (圧縮済).
(121)
(122) . 単独本決算.
(123)
(124) 年代のデータファイル (圧縮済). . 単独本決算. 年代のデータファイル (圧縮済). . 単独本決算. 年代のデータファイル (圧縮済).
(125) 58. 地. 道. 正. 行. 表5:日経 NEEDS データ MT 版ファイル一覧:銀行 ファイル名. 決算種別. 説明.
(126) . 連結本決算. 年代のデータファイル (圧縮済).
(127) . 連結本決算. 年代のデータファイル (圧縮済).
(128) . 単独本決算. 年代のデータファイル (圧縮済).
(129) . 単独本決算. 年代のデータファイル (圧縮済).
(130) . 単独本決算. 年代のデータファイル (圧縮済).
(131) . 単独本決算. 年代のデータファイル (圧縮済).
(132) . 単独本決算. 年代のデータファイル (圧縮済). 表6:日経 NEEDS データ MT 版ファイル一覧:証券 ファイル名. 決算種別. 説明.
(133) . 連結本決算. 年代のデータファイル (圧縮済).
(134) . 連結本決算. 年代のデータファイル (圧縮済).
(135) . 単独本決算. 年代のデータファイル (圧縮済).
(136) . 単独本決算. 年代のデータファイル (圧縮済).
(137) . 単独本決算. 年代のデータファイル (圧縮済).
(138) . 単独本決算. 年代のデータファイル (圧縮済). 表7:日経 NEEDS データ MT 版ファイル一覧:保険 ファイル名. 決算種別. 説明.
(139) . 連結本決算. 年代のデータファイル (圧縮済).
(140) . 連結本決算. 年代のデータファイル (圧縮済).
(141) . 単独本決算. 年代のデータファイル (圧縮済).
(142) . 単独本決算. 年代のデータファイル (圧縮済).
(143) . 単独本決算. 年代のデータファイル (圧縮済).
(144) . 単独本決算. 年代のデータファイル (圧縮済). これらのファイルを展開するとデータが格納されたテキストファイルが 得られる. たとえば, 2010年代の銀行に関する連結決算データに関する 圧縮ファイル
(145) を展開することによって,ファイル が得られ, その先頭の1行には, 以下よ うに2010年3月31日決算の 「商工組合中央金庫」 のデータが納められている..
(146) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 59. □□□□□□□□□□□□□□□□□□□□□□□□□□□ □□□□
(147)
(148) □□ □□商工組合中央金庫 シヨウコウクミアイチユウオウキンコ . ここで, 1行は3040バイトであり, 各行の先頭の4文字 (たとえば FA11) は以下のことを意味する: 表8:レコード種別に関するコード表 コード例 意味. 種類. . 財務. 財務, 財務速報. . 属性 属性, 貸借対照表, 損益計算書, キャッシュフロー (レコード種別) 計算書, その他, その他 , 株主資本等変動計算書. . 銀行(大分類). . セグメント情報 通常は . 一般事業会社, 銀行, 証券, 損保.
(149) 60. 地. 道. 正. 行. なお, は 「欠損値」 を表すことに注意しよう. これら のデータの配列等の詳細は, 日経 NEEDS 財務データ MT 版に付属のマニュ アル [ 5 ]∼[12] を参照されたい.. B. データベースの構造 構築された日経 NEEDS 財務データベースは以下のようなものである: 表9:データベースとテーブルに関するコード 業種. 連結本決算. 単独本決算. テーブルコード. 一般事業会社. . .
(150) ∼
(151). 銀行. . .
(152)
(153) ∼
(154)
(155). 証券会社. . .
(156) ∼
(157). 保険会社. . .
(158) ∼
(159). ここで, 各データベースには共通のテーブル があり, 各テー ブルコードは以下のようなことを意味する. 表10:テーブル一覧 テーブル名. 内容.
(160). 属性.
(161). 貸借対照表.
(162). 損益計算書.
(163). キャッシュフロー計算書.
(164). その他.
(165). その他 .
(166). 株主資本等変動計算書. 収録企業リスト. テーブル
(167) ( ,
(168) ) のカラム (列) は以下の ような共通の構造を持っていることに注意しよう: テーブル
(169). = ヘッダー部 =. +.
(170) ∼ +. データ部
(171) ∼
(172) .
(173) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 61. ここで, ヘッダー部は, テーブル に関して共通であり, カラムの詳 細は表12で与えられる. また, 各テーブル に関するデータ部の詳細 は表13∼19を参照されたい17). さらに, テーブル は, 表11で与 えられるようなカラムを持つ収録企業のリストである. 表11:テーブル
(174)
(175) のカラム カラム名. 内容. データ型. . 日経会社コード. (). . 株式コード. (). ! !. 日経業種コード. ("). #$ . 社名 (英文表記). (%). #$ &'. 社名 (和文表記). (%). #$ &'. 社名 (カタカナ表記). (("). 表12:ヘッダー詳細 (単独,連結, )**∼ +**共通) 項番. 位置. 桁数. カラム名 データ型. 項目名. . . . $,. (). % 2 (. ( 2 %. 6 . $,% $,2 $, $,(. 47/ () () (). ". %(. (. $,". ((). . 2,. %. $,. (%). レコード種別 -. /.財務速報0 -.属性 1.確報 -3.貸借対照表 . 一般事業会社.,0 -.損益計算書 銀行.0 -4.キャッシュフロー表 証券.%0 -/.注記・明細 (有価証券注 保険.20 記,退職給付会計等) 信用金庫. -1.注記・明細 %(リース会計, デリバティブ注記等) -5.株主資本等変動計算書 決算年月日 88889944 識別フラグ 新規・修正.0削除.: 日経会社コード 日経が定める会社コード 株式コード 証券コード協議会が定める 桁 の会社コード 予備 新株式コードのための予備 (ス ペース) 決算月数 決算月数. 内容. 17) 紙面の都合上, これらの表の項目の一部を省略していることに注意されたい. なお, すべての項目を含むリストのファイル (PDF, HTML 形式) は, データ抽出システム KGUSBADES のトップページからダウンロード可能であることに注意しよう. また, すべての項目とその詳細は, 日経 NEEDS 財務データ MT 版に付属のマニュアル[5] ∼[12]を参照されたい..
(176) 62. 地. 道. 正. 項番. 位置. 桁数. カラム名 データ型. 項目名. . . . . () (). . . . . (). . . . . (). . . . . () (). . . . . () (). . . . . (). . . . . (). . . . . (). . . . . (). 行 内容. . . . . (). 連結・単独フラグ 単独
(177) 連結
(178) 本・中間決算フラグ 本決算
(179) 中間決算
(180) ヶ月累計四半期
(181) 第 四半期
(182) 第 四半期
(183) 第 四半期
(184) 第 四半期
(185) 決算期フラグ 新規収録分
(186) 次期における修 正分
(187) 発表決算期 このデータが発表された決算期 予備 スペース 連結基準フラグ 日本基準
(188) 基準
(189) (単 独時は ) 上場フラグ 上場中
(190) 未上場・上場廃止
(191) 上場場部 東証 部
(192) 東証マザース
(193) 東証 部
(194) ヘラクレス 大証 部
(195) スタンダード
(196) 大証 部
(197) グロース
(198) 名証 部
(199) 名証 部
(200) 京都
(201) 広島
(202) 福岡
(203) 新潟
(204) 札幌
(205) 未上場
(206) ※上場廃止会社は,廃止時の場部 ジャスダックフラグ ジャスダック上場
(207) ジャスダッ ク未上場
(208) ジャスダック市場 ジャスダック上場
(209) ジャスダッ ク未上場
(210) ※上場廃止会社は, 廃止時のジャスダック市場 有報フラグ 有報提出会社
(211) 非有報提出会 社
(212) 未上場収録フラグ 未上場会社として収録を継続して いる
(213) 収録廃止会社,上場会社
(214) 予備 スペース. . . . . (). データ作成日 日経業種コード. . . . . (). 上場情報:東京. . . . . (). 〃. :大阪. . . . . (). 〃. :名古屋. . . . . () () (). 〃 〃 〃. :京都 :広島 :福岡. . …製造業
(215) 非製造業
(216) …日経業種中分類コード … 日経業種小分類コード 部上場
(217) 部上場
(218) マザー ス
(219) 未上場
(220) 部上場
(221) 部上場
(222) 未上 場
(223) 部上場
(224) 部上場
(225) 未上 場
(226) 部上場
(227) 未上場
(228) 部上場
(229) 未上場
(230) 部上場
(231) 未上場
(232) .
(233) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築 項番. 位置. 桁数. . . . カラム名 データ型. 項目名. . 〃 〃 〃 予備. () () () (). 内容 :新潟 部上場
(234) 未上場 :札幌 部上場
(235) 未上場 :ヘラクレス スダンダード
(236) グロース スペース. 表13:属性 ()データ部 (単独,連結 共通) 項番. 桁数. カラム名. データ型. 項目名. (中略) . . . . . () () () () () () () () () (). (). レコード 収録フラグ レコード 収録フラグ レコード 収録フラグ レコード 収録フラグ レコード 収録フラグ レコード 収録フラグ レコード 収録フラグ 予備 予備 予備. 予備. 表14:貸借対照表 ():データ部 (単独, 連結 共通) 項番. 桁数. カラム名. データ型. 項目名. (中略) . . . . . () () () () () () () () () (). (). 現金預け金合計 現金 (うち切手手形) 預け金 (うち日銀への預け金) コールローン及び買入手形 コールローン 買入手形 買現先勘定 買入金銭債権. 予備. 63.
(237) 64. 地. 道. 正. 行. 表15:損益計算書 ():データ部 (単独, 連結 共通) 項番. 桁数. カラム名. データ型. 項目名. . (中略) . . .
(238) ()
(239) ()
(240) ()
(241) ()
(242) ()
(243) ()
(244) ()
(245) ()
(246) ()
(247) ()
(248) (). 経常収益合計 資金運用収益合計 貸出金利息 (うち貸付金利息) (うち手形割引料) 有価証券利息配当金 (うち株式配当金) コールローン利息及び買入手形利息 コールローン利息 買入手形利息 予備. 表16:キャッシュフロー計算書 ():データ部 (単独, 連結 共通) 項番. 桁数. . (中略) . カラム名. データ型. .
(249) ()
(250) ()
(251) ()
(252) ()
(253) ()
(254) ()
(255) ()
(256) ()
(257) ()
(258) ()
(259) ()
(260) (). 項目名 税金等調整前当期純利益 繰延税金 減価償却費 連結調整勘定償却額 持分法による投資損益(△益) 貸倒引当金の増加額(△減少額) 投資損失引当金の増加額(△減少額) 債権売却損失引当金の増加額(△減少額) 退職給付引当金の増加額(△減少額) その他の引当金増加額 買入手形利息 予備. 表17:その他 ():データ部 (単独, 連結 共通) 項番. 桁数. . (中略) . カラム名. データ型. 項目名. .
(261) ()
(262) ()
(263) ()
(264) ()
(265) ()
(266) ()
(267) ()
(268) ()
(269) ()
(270) ()
(271) (). 国際業務経常収益 共同債権買取機構向け債権売却損 累積債務国向け債権売却損失 有証評価方法フラグ(低:, 原: ) 減価償却方法フラグ(率:, 額: ) 有形固定資産減価償却累計額 動産・不動産の減価償却実施額 有形固定資産の圧縮記帳額 自己株式 担保に供している資産合計 うちオペレーショナルリスク相当額(国内基準).
(272) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 65. 表18:その他2 (11):データ部 (単独, 連結 共通) 項番. 桁数. カラム名. データ型. 項目名. (中略) . . .
(273) ()
(274) ()
(275) ()
(276) ()
(277) ()
(278) ()
(279) ()
(280) ()
(281) ()
(282) ()
(283) (). 破綻先債権額 延滞債権額 金利減免等債権額 経営支援先債権額 ヶ月以上延滞債権額 貸出条件緩和債権額 破綻先債権額 延滞債権額 ヶ月以上延滞債権額 貸出条件緩和債権額 予備. (銀行勘定) (銀行勘定) (銀行勘定) (銀行勘定) (銀行勘定) (銀行勘定) (信託勘定) (信託勘定) (信託勘定) (信託勘定). 表19:株主資本等変動計算書 ( ):データ部 (単独, 連結 共通). C. 項番. 桁数. カラム名. データ型. 項目名. (中略) . . .
(284) ()
(285) ()
(286) ()
(287) ()
(288) ()
(289) ()
(290) ()
(291) ()
(292) ()
(293) ()
(294) (). 資本金:前期末残高 資本金:新株の発行 予備 予備 予備 予備 予備 資本金:資本金から準備金または剰余金への振替 資本金:準備金から資本金または剰余金への振替 資本金:剰余金から資本金または準備金への振替 予備. SQL 問合せの例 典型的な SQL 問合せの例を以下に与える.. (SQL 1) 収録されている全銀行リストを抽出.
(295) !"# $ [解説] 社名や日経会社コードが納められているテーブル からすべてのカラム () を抽出する (.
(296) ) ことを 意味する. 2) みずほ銀行の 「決算年月日」, 「決算月数」, 「預金合計」 を抽出 (決 (SQL.
(297) 66. 地. 道. 正. 行. 算年月日順)
(298)
(299)
(300)
(301)
(302) . [解説] 貸借対照表のテーブル におけるカラム (日経会 社コード) において (みずほ銀行の日経会社コード) と いう文字列を含むフィールドを (決算年月日), (決算月 数), (預金合計) に対して, 決算年月日順 (
(303) ) に抽出する (
(304)
(305) ) ことを意味する. (SQL 3) 2010年3月31日決算の東京証券取引所1部上場銀行の 「日経会社コー ド」 と 「経常収益合計」, 「経常利益」 の抽出 (日経会社コード順)
(306)
(307)
(308)
(309)
(310) . [解説] 損益計算書のテーブル におけるカラム (決算年 月日) において (2010年3月31日) であり, かつカ ラム (上場情報:東京) において (1部上場) であるフィー ルドを (日経会社コード), (経常収益合計), (経 常利益) に対して, 日経会社コード順 (
(311) ) に抽出す る (
(312)
(313) ) ことを意味する. (SQL 4) 2010年3月31日決算の東京証券取引所1部上場銀行の 「日経会社コー ド」, 「銀行名」, 「経常収益合計」, 「経常利益」 の抽出 (日経会社コー ド順)
(314)
(315) !"#$%"&'!&($)"*+,!! - . "#$%"&' !"#$%"&'!/"00)"12)
(316)
(317)
(318) . [解説] 損益計算書のテーブル におけるカラム (決算年 月日) において (2010年3月31日) であり, かつカ ラム (上場情報:東京) において (1部上場) であるレコー.
(319) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. 67. ドに対して損益計算書のテーブルにおける日経会社コードのカラム () と企業 (銀行) リストのテーブルにおける日経会社 コードのカラム (
(320) ) とを結合 () し た結果から, (損益計算書のテーブルにおける日経会社 コードのカラム),
(321)
(322) (企業リストのテーブ ルにおける日本語の銀行名), (損益計算書のテーブル における経常収益合計) と (損益計算書のテーブルに おける経常利益) に対して日経会社コード順 ( !) に 抽出する ("#$%) ことを意味する. (SQL 5) 東京証券取引所1部上場銀行の 「日経会社コード」, 「銀行名」, 「決 算年月日」, 「経常収益合計」, 「経常利益」 のパネルデータ抽出 (日 経会社コード, 決算年月日順) "#$%)
(323)
(324) )&)) *+
(325) ,
(326) -.&',// !)&0. [解説] 損益計算書のテーブル におけるカラム &' (上場情 報:東京) において (1部上場) であるレコードに対して損益計 算書のテーブルにおける日経会社コードのカラム()と銀 行リストのテーブルにおける日経会社コードのカラム(
(327) ) とを結合 () した結果から, (損益 計算書のテーブルにおける日経会社コードのカラム),
(328)
(329) (銀行リストのテーブルにおける日本語の銀行名), (損益計算書のテーブルにおける経常収益合計) と ( (損益計算書のテーブルにおける経常利益) に対して 日経会社コードと決算年月日順 ( ! , &) に抽出す る ("#$%) ことを意味する..
(330) 68. D D. 1. 地. 道. 正. 行. データベース構築に関するスクリプトファイル OS 共通スクリプトファイル. ファイル
(331)
(332)
(333) !
(334) "" "" "" "" #"" "" $"" ""( ""% &(')( )( *% &(")( (中略) *)% &(')( ""% &("')( )% &("')( *% &("')( (中略) )"% &("') ) "" +"" "" +"" "" +"" #"" +"" "" +"" $"" +"". , - ."" -, "" ,/-0-. , - ."" -, "" ,/-0-. , - . "" -, "" ,/-0-. , - ."" -, "" ,/-0-. , - ."" -, #"" ,/-0-. , - ."" -, "" ,/-0-. , - .1"" -, $"" ,/-0-. ファイル 2342
(335)
(336) !
(337) 2342
(338) 2342
(339) ( 5266#2#% &(7)(
(340) 6#% &(')( 5266#2$8
(341) 8#% &(9)(
(342) 4#2:#5% &('))(
(343) 4#2:;<% &('))(
(344) 4#2:;<6% &(9) ). , - .2342
(345) 56 =-, 2342
(346) ,/-0-.
(347) 金融関連会社に関する日経 NEEDS 財務データにもとづくデータベースの構築. D. 2. Mac OS X Server, Ubuntu 用スクリプトファイル. ファイル
(348)
(349) !
(350) " !!
(351) # $%&'(&$%$
(352)
(353) !!
(354) # $%&'(&$% $
(355)
(356) !!
(357) # $%&'(&$%$
(358)
(359) )!!
(360) # $%&'(&$%)$
(361)
(362) *!!
(363) # $%&'(&$%*$
(364)
(365) !!
(366) # $%&'(&$%$
(367)
(368) +!!
(369) # $%&'(&$%+$
(370)
(371) "
(372)
(373)
(374)
(375) $
(376)
(377) , $%&'(&$% "#- -.
(378) /$
(379)
(380) ," ",
(381)
(382) $
(383)
(384) , $%&'(&$% "#- -.
(385) /$
(386)
(387) ," ",
(388)
(389) $
(390)
(391) , $%&'(&$% "#- -.
(392) /$
(393)
(394) ," ",
(395)
(396) )$
(397)
(398) , $%&'(&$% "#- -.)
(399) /$
(400)
(401) ," ",
(402)
(403) *$
(404)
(405) , $%&'(&$% "#- -.*
(406) /$
(407)
(408) ," ",
(409)
(410) $
(411)
(412) , $%&'(&$% "#- -.
(413) /$
(414)
(415) ," ",
(416)
(417) +$
関連したドキュメント
① 新株予約権行使時にお いて、当社または当社 子会社の取締役または 従業員その他これに準 ずる地位にあることを
弊社または関係会社は本製品および関連情報につき、明示または黙示を問わず、いかなる権利を許諾するものでもなく、またそれらの市場適応性
FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの
関係会社の投融資の評価の際には、会社は業績が悪化
当社の連結子会社である株式会社 GSユアサは、トルコ共和国にある持分法適用関連会社である Inci GS Yuasa Aku Sanayi ve Ticaret
と発話行為(バロール)の関係が,社会構造(システム)とその実践(行
むしろ会社経営に密接
意思決定支援とは、自 ら意思を 決定 すること に困難を抱える障害者が、日常生活や 社会生活に関して自