• 検索結果がありません。

経済分析とコンピュータ(2)--NEEDSデータベースを中心としたシステム---香川大学学術情報リポジトリ

N/A
N/A
Protected

Academic year: 2021

シェア "経済分析とコンピュータ(2)--NEEDSデータベースを中心としたシステム---香川大学学術情報リポジトリ"

Copied!
36
0
0

読み込み中.... (全文を見る)

全文

(1)

香 川 大 学 経 済 論 議

6

8

巻 第

2・3

1

9

9

5

1

1

1

5

1

-

1

8

6

経済分析とコンビュータ(

2

)

一一一

NEEDS

データベースを中心としたシステム一一一

I

はじめに

大 野

(

1

9

9

5

)

においては,

RATS

を 中 心 と し た 教 育 ・ 研 究 用 シ ス テ ム を 紹

介したが,今回は,

NEEDS

データベースを利用するために,著者たちが作成

したシステムについて紹介したい。

日本経済新聞社の

NEEDS(

N

i

k

k

e

i

Economic E

l

e

c

t

r

o

n

i

c

Databank S

y

s

-t

e

m

)は経済・経営関係の統計データベースとしては日本最大のもので,多く

の機関によって利用されているものである。香川大学経済学部においても,

1

9

9

1

年に財務データファイルと総合経済ファイルを酪気テープで購入し,当時の計

算センターの汎用機であった

NEC

ACOS

に導入することにした。しかし,

我々は当時,

NEEDS

のような膨大なデータベースを効率的に利用する知識も

技術も持ち合わせていなかった。そこで,

NEEDS

データベースを中心とした

分析システム

XCAMPUS

を開発されていた神戸商科大学の斎藤清氏に相談し

* 大 野 拓 行 :

o

h

n

o

@

e

c

kagawa-u a

c

j

p

横田幹子:

y

o

k

o

t

a

@

e

c

kagawa -u a

c

j

p

尾崎万枝:

o

z

a

k

i

@ec k

a

g

a

wa -u

.

a

c

j

p

(1) NEEDS

データファイルのコンビュータ(汎用機および UNIXマシン)への導入,

およびプログラムの作成につい

τ

は,多くの方にご協力をいただきました。特に,本学

部の今井慈郎氏には UNIXについて基礎知識からご教授いただきました。また,安藤

博子さんには, FORTRANプログラムについて多くの助言をいただきました。この場

を借り

τ

感謝いたします。もちろん,本稿でのありうべき誤謬は筆者たちの責任である

ことは言うまでもありません。

香 川 大 学 経 済 論 議

6

8

巻 第

2・3

1

9

9

5

1

1

1

5

1

-

1

8

6

経済分析とコンビュータ(

2

)

一一一

NEEDS

データベースを中心としたシステム一一一

I

はじめに

大 野

(

1

9

9

5

)

においては,

RATS

を 中 心 と し た 教 育 ・ 研 究 用 シ ス テ ム を 紹

介したが,今回は,

NEEDS

データベースを利用するために,著者たちが作成

したシステムについて紹介したい。

日本経済新聞社の

NEEDS(

N

i

k

k

e

i

Economic E

l

e

c

t

r

o

n

i

c

Databank S

y

s

-t

e

m

)は経済・経営関係の統計データベースとしては日本最大のもので,多く

の機関によって利用されているものである。香川大学経済学部においても,

1

9

9

1

年に財務データファイルと総合経済ファイルを酪気テープで購入し,当時の計

算センターの汎用機であった

NEC

ACOS

に導入することにした。しかし,

我々は当時,

NEEDS

のような膨大なデータベースを効率的に利用する知識も

技術も持ち合わせていなかった。そこで,

NEEDS

データベースを中心とした

分析システム

XCAMPUSを開発されていた神戸商科大学の斎藤清氏に相談し

* 大 野 拓 行 :

o

h

n

o

@

e

c

kagawa-u a

c

j

p

横田幹子:

y

o

k

o

t

a

@

e

c

kagawa -u a

c

j

p

尾崎万枝:

o

z

a

k

i

@ec k

a

g

a

wa -u

.

a

c

j

p

(1) NEEDS

データファイルのコンビュータ(汎用機および UNIXマシン)への導入,

およびプログラムの作成につい

τ

は,多くの方にご協力をいただきました。特に,本学

部の今井慈郎氏には UNIXについて基礎知識からご教授いただきました。また,安藤

博子さんには, FORTRANプログラムについて多くの助言をいただきました。この場

を借り

τ

感謝いたします。もちろん,本稿でのありうべき誤謬は筆者たちの責任である

ことは言うまでもありません。

(2)

-152

香川大学経済論叢

3

4

8

たところ,心よく

XCAMPUS

の導入を許可していただいた。現在,本学部で

利用している

NEEDS

データベースシステムは斎藤氏が公開された

I

日経ミ

ク ロ 対 話 型 ア ク セ ス

NMICRO

J

お よ び 「 日 経 マ ク ロ 対 話 型 ア ク セ ス

NMACRO

J

を基礎として開発したソフトによるものである。ここに記して,

斎藤氏に感謝したい。

斎藤氏の

XCAMPUS

は多機能なシステムであるが,本学部は以下のような

事情により

I

日経ミクロ対話型アクセス

NMICRO

J

および「日経マクロ対

話型アクセス

NMACRO

J

を基礎として,パソコン上の表計算ソフトでの利

用を前提としたデータ抽出を主眼とするシステムを開発することになった。

(

1

)

本学部では早くからパソコンが各研究室に浸透し,研究教育がパソコン

上で動作する表計算ソフトによって行われており,

XCAMPUS

上で分

析するより,

XCAMPUS

の機能の一部を利用した,表計算ソフト用の

データ抽出が多くなったこと。また,教育用として,データ抽出のため

だけに

XCAMPUS

を使用するにはプログラムが大きすぎること。

(

2

)

当時,

XCAMPUS

は上場企業の財務データファイルと総合経済ファイ

ルを対象としたものであったが,本学部では銀行の財務データに対しで

も需要が存在したこと。

これまでの作業の経緯を簡単に述べておくと,以下のようなものである。

l

.

斎藤氏の「日経ミクロ対話型アクセス

NMICRO

J

および「日経マクロ

対話型アクセス

NMACRO

J

を部分修正したプログラムの作成。

2

.

NMICRO

を参考に銀行財務データファイノレに対するデータベース作成

プログラム

cbank

,および抽出プログラム

bank

の作成。

3

.

本学の情報処理センターのシステムが

UNIX

中心のものに変更された

のを契機に,

NEEDS

関連のデータを

UNIX

に移植。プログラムも新た

に書き直す。

4

.

総合経済ファイルの日本語版(系列名,出典等が日本語)が

8

mm

テープ

で利用可能となったのを受けて,関連プログラムを書き直す。

-152

香川大学経済論叢

3

4

8

たところ,心よく

XCAMPUS

の導入を許可していただいた

O

現在,本学部で

利用している

NEEDS

データベースシステムは斎藤氏が公開された

I

日経ミ

ク ロ 対 話 型 ア ク セ ス

NMICRO

J

お よ び 「 日 経 マ ク ロ 対 話 型 ア ク セ ス

NMACRO

J

を基礎として開発したソフトによるものである。ここに記し、て,

斎藤氏に感謝したい。

斎藤氏の

XCAMPUS

は多機能なシステムであるが,本学部は以下のような

事情により

I

日経ミクロ対話型アクセス

NMICRO

J

および「日経マクロ対

話型アクセス

NMACRO

J

を基礎として,パソコン上の表計算ソフトでの利

用を前提としたデータ抽出を主眼とするシステムを開発することになった。

(

1

)

本学部では早くからパソコンが各研究室に浸透し,研究教育がパソコン

上で動作する表計算ソフトによって行われており,

XCAMPUS

上で分

析するより,

XCAMPUS

の機能の一部を利用した,表計算ソフト用の

データ抽出が多くなったこと。また,教育用として,データ抽出のため

だけに

XCAMPUS

を使用するにはプログラムが大きすぎること。

(

2

)

当時,

XCAMPUS

は上場企業の財務データファイルと総合経済ファイ

ルを対象としたものであったが,本学部では銀行の財務データに対しで

も需要が存在したこと。

これまでの作業の経緯を簡単に述べておくと,以下のようなものである。

l

.

斎藤氏の「日経ミクロ対話型アクセス

NMICRO

J

および「日経マクロ

対話型アクセス

NMACRO

J

を部分修正したプログラムの作成。

2

.

NMICRO

を参考に銀行財務データファイノレに対するデータベース作成

プログラム

cbank

,および抽出プログラム

bank

の作成。

3

.

本学の情報処理センターのシステムが

UNIX

中心のものに変更された

のを契機に,

NEEDS

関連のデータを

UNIX

に移植。プログラムも新た

に書き直す。

4

.

総合経済ファイルの日本語版(系列名,出典等が日本語)が

8

mm

テープ

で利用可能となったのを受けて,関連プログラムを書き直す。

OLIVE 香川大学学術情報リポジトリ

(3)

3

4

9

経済分析とコンピュータ

(

2)

-153-以上の作業を経て,現時点で利用しているプログラムは以下の

6本である。

cmacro 9

5

総合経済ファイル(日本語版)のデータベース作成用

macro 9

5

総合経済ファイル(日本語版)のデータ抽出用

cmicro

上場企業財務データファイルのデータベース作成用

micro

上場企業財務データファイノレのデータ抽出用

cbank

銀行財務データファイノレのデータベース作成用

bank

銀行財務データファイルのデータ抽出用

ここでは,それぞれのデータベースの構造,作成,および抽出プログラムの

特徴等を論じることにする。なお

3

つのデータベースのうち,上場企業と銀

行の財務データファイルは構造が類似しているため,説明は

cmacro9

5,

macro

9

5,

cmicro, microを中心に行い,銀行財務データについては注意すべき点

のみを述べることとしたい。

我々が作成したプログラムは比較的簡単な

FORTRAN

プログラムである

が,これを

NEEDS

統計データファイノレと表計算ソフトに組み合わせること

により,コストパフォーマンスの高いシステムが構築可能になっていることを

示すことが本稿の目的である。

I

I

総合経済ファイノレ(日本語版)のデータペース化

1

.

総合経済ファイノレ(日本語版)の特徴

日経が提供している総合経済ファイ/レ(日本語版)は国民所得統計,生産活

動,企業経営,金融・財政,貿易・国際収支,労働,物価,消費・家計,景気

動向指数など国内の主要経済統計

1

8

千系列以上を収録している。ファイ

ルは系列毎に以下の構造を持つ,シーケンシャノレ・ファイノレ(レコード長

9

6

0

b

y

t

e

) である。

(

2

)

これらのうち,利用者が実際に操作するのは,

m

a

c

r

o

9

5

m

i

c

r

o

b

a

n

k

であり,各々

のプログラムの使用方法および,パソコンでの利用に関しては大野・横田・山口・尾崎

(

1

9

9

5

)

,関(1

9

9

5

)

に詳しい。

(3 )

ただし,日経が

8mm

テープの形で提供しているものを

UNIX

マシンに読み込むと,

各レコードが連続したファイルとなっ引ているの-C,

UNIX

上で

9

6

0

b

y

t

e

ずつに切る作

業が必要であった。

3

4

9

経済分析とコンピュータ

(

2)

-153-以上の作業を経て,現時点で利用しているプログラムは以下の

6

本である。

cmacro

9

5

macro

9

5

C灯

l

l

C!

o

l

l

c

r

o

cbank

bank

総合経済ファイル(日本語版)のデータベース作成用

総合経済ファイル(日本語版)のデータ抽出用

上場企業財務データファイルのデータベース作成用

上場企業財務データファイノレのデータ抽出用

銀行財務データファイノレのデータベース作成用

銀行財務データファイルのデータ抽出用

ここでは,それぞれのデータベースの構造,作成,および抽出プログラムの

特徴等を論じることにする。なお

3

つのデータベースのうち,上場企業と銀

行の財務データファイルは構造が類似しているため,説明は cmacro

9

5

macro

9

5

cmicro,

microを中心に行い,銀行財務データについては注意すべき点

のみを述べることとしたい。

我々が作成したプログラムは比較的簡単な

FORTRAN

プログラムである

が,これを

NEEDS

統計データファイノレと表計算ソフトに組み合わせること

により,コストパフォーマンスの高いシステムが構築可能になっていることを

示すことが本稿の目的である。

I

I

総合経済ファイノレ(日本語版)のデータペース化

1

.

総合経済ファイノレ(日本語版)の特徴

日経が提供している総合経済ファイ/レ(日本語版)は国民所得統計,生産活

動,企業経営,金融・財政,貿易・国際収支,労働,物価,消費・家計,景気

動向指数など国内の主要経済統計

1

8

千系列以上を収録している。ファイ

ルは系列毎に以下の構造を持つ,シーケンシャノレ・ファイノレ(レコード長

9

6

0

b

y

t

e

)

である。

(

2

)

これらのうち,利用者が実際に操作するのは,

m

a

c

r

o

9

5

m

i

c

r

o

b

a

n

k

であり,各々

のプログラムの使用方法および,パソコンでの利用に関しては大野・横田・山口・尾崎

(

1

9

9

5

)

,関(1

9

9

5

)

に詳しい。

(3 )

ただし,日経が

8mm

テープの形で提供しているものを

UNIX

マシンに読み込むと,

各レコードが連続したファイルとなっ

τ

いるの-C,

UNIX

上で

9

6

0b

y

t

e

ずつに切る作

業が必要で

b

あった。

(4)

-154

香川大学経済論叢

3

5

0

ヘッダーレコード:系列に関する情報

(MT

コード,系列名,出典等)が記述

されている。資料

l

を参照。

データレコード

1

レコード当たり

6

0

個の数値データが資料

2

の形式によ

り記述されている

O

系列ごとのデータレコード数はヘッダ

ーレコードに記述されている情報により計算可能ごある。

2

.

データベースの作成

データベースは

l

レコードに系列に関する情報(系列名,出典,単位等)と

数値データを含むランダムアクセス・ファイルとした。ただし,ヘッダーレコ

ードに含まれる情報は重複もあり,総てが必要とは考えられないので,以下の

項目を選択した(括弧内はプログラム

c

m

a

c

r

o

.

.

fにおける変数名)。

M T

コード

(

m

t

c

o

d

e

)

,期種

(

k

i

n

d

)

,収録開始期

(

n

b

g

n

mbgn)

,収録終了期

(

n

e

n

d

mend)

,集計コード

(

a

g

)

,漢字系列名

(

n

a

m

e

)

,漢字出典名

(

s

o

u

s

)

,漢字単位名

(

u

n

i

t

)

また,データベースからのデータ抽出においては系列をその

M T

コードで

指定する方式を採るので,

M T

コードとその系列のデータベースでの位置の

対応を記述したインデックス・ファイルを作成することとした。

プログラム

cmacro9

5

fは総合経済ファイル(プアイ

J

s

o

u

r

c

e

)

から,デ

ータベース

MACRO_DATA

とインデックス・ファイル

MACRO INDEX

作成するためのものである。変数

i

n

d

e

x

がデータベースにおける系列の格納

位置を示す変数である。

2

5

行において,ファイル

s

o

u

r

c

e

のヘッダーレコード

から必要な情報を読込み,

2

7

~

3

3

行で期種,収録開始期,収録終了期から数

値データ数

(

n

d

a

t

a

)

を計算し,

3

8

~

4

7

行で,

n

d

a

t

a

1

データレコードに数

値データが

6

0

個記述されていることを利用して,読み込むべきレコード数を

決定しながら,数値データを読み込んでいる。最後に

4

8

~

5

0

行で,データを

データベース

MACRO_DATA

に格納し,

5

1

行で,

M T

コードを

MACRO-INDEX

に格納している。その後,

i

n

d

e

x

をインクリメントして,次の系列の

ヘッダーレコードを読みに行く。これを,

s

o

u

r

c

e

ファイ

J

レの終わりまで繰り

返すことにより,データベース

MACRO_DATA

とインデックス・ファイノレ

“E・哩圃・田・

-154

香川大学経済論叢

3

5

0

ヘッダーレコード:系列に関する情報

(MT

コード,系列名,出典等)が記述

されている。資料 lを参照。

データレコード

1

レコード当たり

6

0

個の数値データが資料

2

の形式によ

り記述されている

O

系列ごとのデータレコード数はヘッダ

ーレコードに記述されている情報により計算可能ごある。

2

.

データベースの作成

データベースは lレコードに系列に関する情報(系列名,出典,単位等)と

数値データを含むランダムアクセス・ファイルとした。ただし,ヘッダーレコ

ードに含まれる情報は重複もあり,総てが必要とは考えられないので,以下の

項目を選択した(括弧内はプログラム

c

m

a

c

r

o

.

.

fにおける変数名)。

M T

コード

(

m

t

c

o

d

e

)

,期種

(

k

i

n

d

)

,収録開始期

(

n

b

g

n

mbgn)

,収録終了期

(

n

e

n

d

mend)

,集計コード

(

a

g

)

,漢字系列名

(

n

a

m

e

)

,漢字出典名

(

s

o

u

s

)

,漢字単位名

(

u

n

i

t

)

また,データベースからのデータ抽出においては系列をその

M T

コードで

指定する方式を採るので,

M T

コードとその系列のデータベースでの位置の

対応を記述したインデックス・ファイルを作成することとした。

プログラム

cmacro9

5

fは総合経済ファイル(プアイ

J

s

o

u

r

c

e

)

から,デ

ータベース

MACRO_DATA

とインデックス・ファイル

MACRO_INDEX

作成するためのものである。変数

i

n

d

e

x

がデータベースにおける系列の格納

位置を示す変数である。

2

5

行において,ファイル

s

o

u

r

c

e

のヘッダーレコード

から必要な情報を読込み,

2

7

~

3

3

行で期種,収録開始期,収録終了期から数

値データ数

(

n

d

a

t

a

)

を計算し,

3

8

~

4

7

行で,

n

d

a

t

a

1

データレコードに数

値データが

6

0

個記述されていることを利用して,読み込むべきレコード数を

決定しながら,数値データを読み込んで、いる。最後に

4

8

~

5

0

行で,データを

データベース

MACRO_DATA

に格納し,

5

1

行で,

M T

コードを

MACRO-INDEX

に格納している。その後,

i

n

d

e

x

をインクリメントして,次の系列の

ヘッダーレコードを読みに行く。これを,

s

o

u

r

c

e

ファイ

J

レの終わりまで繰り

返すことにより,データベース

MACRO_DATA

とインデックス・ファイノレ

OLIVE 香川大学学術情報リポジトリ

(5)

3

5

1

経済分析とコンビュータ

(

2)

-155

MACRO_INDEXが作成される。

3

.

抽出プログラム

プログラム

macro9

5

.

fはデータベース (MACRO_DAT

A) から希望する

系列を抽出して,ファイル

out

t

x

tに格納するものである。現時点におけるデ

ータベースの収録系列数は

1

9

0

5

0で あ る ( 14行目 k

e

i

r

e

t

u=

1

9

0

5

0

)。プログ

ラムでは,

21~23 行目において,インデックス・ファイノレの情報を読み込ん

でいる。 25~107 行固までがデータ抽出のための情報の入力部分である。ここ

で,入力する情報とは以下の項目である。

f

k

i

n

d

(期種=データの型

28~30 行

:総合経済ファイノレには,暦年

(CA),年度 (FA),暦年半年次 (

C

S

),年

度半年次

(

F

S

),四半期 (

C

Q

),月次 (M),句次 (TD),週次 (W),日次

(

D

)

の系列が含まれる。しかし,我々のシステムは使用頻度を考慮し

て,現時点では句次

(TD),週次 (W),日次 (

D

)の系列の抽出には完

全には対応していない。期種の情報は主にデータの集計(月次→年次

等)に利用されるが,旬次

(TD),週次 (W),日次 (

D

)の系列からの

集計は,現時点では不可能となっている。

nbgn, mbgn, nend, mend (抽出開始年,抽出開始期,抽出終了年,抽出

終了期)

52~55行

:ただし,期種が年次の場合は,

mbgn=mend=

0

。これらの情報は

f

k

i

n

dとともに抽出数値データ数 (

n

s

)の計算 (

7

3

行)と,抽出数値デ

ータのデータベースにおける位置の決定

(

n

s

l,

137~141 行)などに

利用される。

n

c

o

l

(1 行当たり出力系列数

63~65 行

(

4

)

フ ァ イ ル

MACRO_INDEX

は単に

M T

コ ドと漢字系列名を記述したものである

が,指定した

M T

コードが何番目に記述されているかを調べることによコて,データ

ベース上のデータ格納位債が判る。

(

5

)

資料

1を見ると判るように,これらの情報は収録開始期(19

9

0

8月を 9

0

0

0

8と記述)

と収録終了期の

2

つの情報からなるが,プログラムでの計算上必要なため

4

つの変数

として取り扱うことにした。

3

5

1

経済分析とコンビュータ

(

2)

-155

MACRO_INDEXが作成される。

3

.

抽出プログラム

プログラム

macro9

5

.

fはデータベース (MACRO_DATA) から希望する

系列を抽出して,ファイル

out

t

x

tに格納するものである。現時点におけるデ

ータベースの収録系列数は

1

9

0

5

0で あ る ( 14行目 k

e

i

r

e

t

u=

1

9

0

5

0

)。プログ

ラムでは,

21~23 行目において,インデックス・ファイノレの情報を読み込ん

でいる。 25~107 行固までがデータ抽出のための情報の入力部分である。ここ

で,入力する情報とは以下の項目である。

f

k

i

n

d

(期種=データの型

28~30 行

:総合経済ファイノレには,暦年

(CA),年度 (FA),暦年半年次 (

C

S

),年

度半年次

(

F

S

),四半期 (

C

Q

),月次 (M),句次 (TD),週次 (W),日次

(

D

)

の系列が含まれる。しかし,我々のシステムは使用頻度を考慮し

て,現時点では句次

(TD),週次 (W),日次 (

D

)の系列の抽出には完

全には対応していない。期種の情報は主にデータの集計(月次→年次

等)に利用されるが,旬次

(TD),週次 (W),日次 (

D

)の系列からの

集計は,現時点では不可能となっている。

nbgn, mbgn, nend, mend (抽出開始年,抽出開始期,抽出終了年,抽出

終了期)

52~55行

:ただし,期種が年次の場合は,

mbgn=mend=

0

。これらの情報は

f

k

i

n

dとともに抽出数値データ数 (

n

s

)の計算 (

7

3

行)と,抽出数値デ

ータのデータベースにおける位置の決定

(

n

s

l,

137~141 行)などに

利用される。

n

c

o

l

(1 行当たり出力系列数

63~65 行

(

4

)

フ ァ イ ル

MACRO_INDEX

は単に

M T

コードと漢字系列名を記述したものである

が,指定した

M T

コードが何番目に記述されているかを調べることによコて,デ

ベース上のデータ格納位債が判る。

(

5

)

資料

1を見ると判るように,これらの情報は収録開始期(19

9

0

8月を 9

0

0

0

8と記述)

と収録終了期の

2

つの情報からなるが,プログラムでの計算上必要なため

4

つの変数

として取り扱うことにした。

(6)

156--

香川大学経済論叢

3

5

2

:この項目は抽出データをパソコン上の表計算ソフトで、の利用を考慮し

て,抽出データの体裁を整えるためのものである

O

表計算ソフトのデ

ータ読込み上の制限のため,現時点における最大値は

1

5

である。

mtc

(

i

)

(MT コード

97~101 行

:

5

0

系列まて、指定可能。

M T

コード問はスペースで区切り,/がある

と入力終了となる

O

以上の入力情報に基づいて,

110~185 行において,抽出が行われ,必要に

応じて集計が行われる。まず,

1

1

1

行におい、て,

m

t

i

(

i

)

から

M T

コードが

1

つ取り出され,

115~121 行において,インデックス・ファイルの情報との対

応により,データベースにおける指定した系列の位置

(

i

n

d

e

x

)

を決定する。

1

2

2

~149 行で,データペースから index で指定した系列を読み出し,次の行列に

ストックする。

漢字系列名→

jname(

i

)

M T

コード→

mtcd

(i),漢字単位名→

j

u

n

i

t

(i),漢字

出典名→

j

s

o

r

(

0,数値データ

>

e

d

a

t

a

(

i

j

)

ただし,数値データについては,抽出期間に存在しないデータは

9

9

9

9

9

9

9

とされる。また,抽出希望期種

(

f

k

i

n

d

)

がデータベースの系列の期種

(

r

f

k

i

n

d

)

と一致しない場合は,集計がなされるが,これについては項を改めて述べるこ

とにする。以上の作業を指定した

M T

コード総てについて行う。

最後に,

1

8

6

行目以降はストックしたデータを

n

c

o

l (

1

行当たりの系列数)

に従い,

ouUxt

に書き出している。

4

.

データの集計について

抽出データに対して,集計が必要か否かは

1

3

1

行において

f

k

i

n

d

(抽出希望

期種)と

r

f

k

i

n

d

(データベースにおける期種)を比較することによって決定

される。抽出が必要でない場合には,

1

3

2

行から

1

4

9

行において,抽出された

データ

e

j

d

a

t

a

(

j

)

e

d

a

t

a(

i

j

)

に格納される。また,このプログラムにおいで

(6 )

表計算に読み込むテキストファイルは

1

レコード

2

5

5b

y

t

e以下である必要がある。

¥

156--

香川大学経済論叢

3

5

2

:この項目は抽出データをパソコン上の表計算ソフト℃の利用を考慮し

て,抽出データの体裁を整えるためのものである

O

表計算ソフトのデ

ータ読込み上の制限のため,現時点における最大値は

1

5

である。

mtc

(

i

)

(MT コード

97~101 行

:

5

0

系列まで指定可能。

M T

コード問はスペースで区切り,/がある

と入力終了となる

O

以上の入力情報に基づいて,

110~185 行において,抽出が行われ,必要に

応じて集計が行われる。まず,

1

1

1

行において,

m

t

i

(

i

)

から

M T

コードが

1

つ取り出され,

115~121 行において,インデックス・ファイルの情報との対

応により,データベースにおける指定した系列の位置

(

i

n

d

e

x

)

を決定する。

1

2

2

~149 行で,データペースから index で指定した系列を読み出し,次の行列に

ストックする。

漢字系列名→

jname(

i

)

M T

コード→

mtcd

(i),漢字単位名→

j

u

n

i

t(

i

)

,漢字

出典名→

j

s

o

r

(i),数値データ

>

e

d

a

t

a

(

i

j

)

ただし,数値データについては,抽出期間に存在しないデータは

-9999999

とされる。また,抽出希望期種

(

f

k

i

n

d

)

がデータベースの系列の期種

(

r

f

k

i

n

d

)

と一致しない場合は,集計がなされるが,これについては項を改めて述べるこ

とにする。以上の作業を指定した

M T

コード総てについて行う。

最後に,

1

8

6

行目以降はストックしたデータを

n

c

o

l (

1

行当たりの系列数)

に従い,

ouUxt

に書き出している。

4

.

データの集計について

抽出データに対して,集計が必要か否かは

1

3

1

行において

f

k

i

n

d

(抽出希望

期種)と

r

f

k

i

n

d

(データベースにおける期種)を比較することによって決定

される。抽出が必要でない場合には,

1

3

2

行から

1

4

9

行において,抽出された

データ

e

j

d

a

t

a

(

j

)

e

d

a

t

a

(i,j)に格納される。また,このプログラムにおいで

(6 )

表計算に読み込むテキストファイルは

1

レコード

2

5

5b

y

t

e

以下である必要がある。

OLIVE 香川大学学術情報リポジトリ

(7)

3

5

3

経済分析とコンピュータ

(

2)

-157

は次の 3 つのケースにおいては集計不能と判定される(I 51~153行)。

(1)抽出希望期種に対応する値(j

e

k

i

n

d

)

がデータベースにおける期種に対応

する値

(

k

i

n

d

)

より小さい場合。例えば,データベースにおける期種が四半

(

k

i

n

d

=4

)

にも関わらず,月次としてデータを抽出する場合(j

e

k

i

n

d

=

1

2

)

(

2

)

暦年半年次

(CS)

から年度

(FA)

への集計。

(

3

)

年度半年次

(FS)

から暦年

(CA)

への集計。

また,集計の形式はデータベースにおける

r

f

a

g

r

(集計コード)によって決

定されるが,ここでは,

rfagr= 1

(単純平均)の時,

ip1=1

ip2=jkind

rfagr= 2

(単純加算)の時,

ip1=1

ip2=1

r

f

a

g

r

=3

(期末)の時,

i

p

1

= 0

i

p

2

= 1

として,

164~180行において,

6

j

d

a

t

a

(is+

1) +ψ1

*

'

i

e

j

d

ω

(

j

)

e

d

a

t

a

(

i

c

ount

i

)

=

i

p

2

の計算式で計算される。ここで,

i

c

o

u

n

t

e

d

a

t

a

に格納される系列の位置を

示すインデックスであり,右辺の分子におけるヱは期末前まで集計され,

e

j

d

a

t

a

(

i

s

+

1

)が期末データである。

総合経済ファイノレにおける集計コードは単純集計,単純加算,期末のみでは

なく,期初,最大,最小などがあり,我々が作成した集計プログラムは現時点

ではこれらには対応していない。

I

I

I

財務データのデータベース化

1

.

財務データファイルの特徴

日経が磁気テープ℃、提供している財務データファイル(上場企業)の特徴は,

(

1

)

全国 8証券取引所上場企業(銀行・証券・保険を除く)を対象に,東

証上場会社は

1

9

6

4

4

月決算以降,大証・名証単独上場会社は

1

9

7

0

4

月決算以降,その他地方単独上場会社は

1

9

7

5

4

月決算以降,それぞれ

2

6

0

項目(基本項目

1

6

0

項目,付属

1

0

0

項目)を収録している。そのため,

3

5

3

経済分析とコンピュータ

(

2)

-157

は次の 3 つのケースにおいては集計不能と判定される(I 51~153行)。

(1)抽出希望期種に対応する値(j

e

k

i

n

d

)

がデータベースにおける期種に対応

する値

(

k

i

n

d

)

より小さい場合。例えば,データベースにおける期種が四半

(

k

i

n

d

=4

)

にも関わらず,月次としてデータを抽出する場合(j

e

k

i

n

d

=

1

2

)

(

2

)

暦年半年次

(CS)

から年度

(FA)

への集計。

(

3

)

年度半年次

(FS)

から暦年

(CA)

への集計。

また,集計の形式はデータベースにおける

r

f

a

g

r

(集計コード)によって決

定されるが,ここでは,

rfagr= 1

(単純平均)の時,

ip1=1

ip2=jkind

rfagr= 2

(単純加算)の時,

ip1=1

ip2=1

r

f

a

g

r

=3

(期末)の時,

i

p

1

= 0

i

p

2

= 1

として,

164~180行において,

6

j

d

a

t

a

(is+

1) +ψ1

*

'

i

e

j

d

ω

(

j

)

e

d

a

t

a

(

i

c

ount

i

)

=

i

p

2

の計算式で計算される。ここで,

i

c

o

u

n

t

e

d

a

t

a

に格納される系列の位置を

示すインデックスであり,右辺の分子におけるヱは期末前まで集計され,

e

j

d

a

t

a

(

i

s

+

1

)が期末データである。

総合経済ファイノレにおける集計コードは単純集計,単純加算,期末のみでは

なく,期初,最大,最小などがあり,我々が作成した集計プログラムは現時点

ではこれらには対応していない。

I

I

I

財務データのデータベース化

1

.

財務データファイルの特徴

日経が磁気テープ℃、提供している財務データファイル(上場企業)の特徴は,

(

1

)

全国 8証券取引所上場企業(銀行・証券・保険を除く)を対象に,東

証上場会社は

1

9

6

4

4

月決算以降,大証・名証単独上場会社は

1

9

7

0

4

月決算以降,その他地方単独上場会社は

1

9

7

5

4

月決算以降,それぞれ

2

6

0

項目(基本項目

1

6

0

項目,付属

1

0

0

項目)を収録している。そのため,

(8)

158

香川大学経済論議ー

3

5

4

ファイルの大きさは総合経済ファイルの倍近くになる。

(

2

)

そのため,磁気テープの記録形式が

PackedDecimal

と呼ばれる特殊

なものとなっている。

このため,利用者はまず,

Packed Decimal

データを変換

(

u

n

p

a

c

k

)

する必要

がある。当初,我々は,それが可能でなかったが,銀行の財務データを独力で

データベース化する必要から,

ACOSのユーティリティを利用したプログラ

ムを作成することにした。しかし,

1コマンドで変換可能なバイト数の少なさ,

および一回のユーティリティ使用で記述可能なコマンド数が制限されていたた

め,データの

unpack

化には予想以上の神経と時聞を消耗した。現在,本学部

で利用されている財務データ(上場企業および銀行)はこのようにして

unpack

化されたデータをもとにしている。最近においては,

unpack

データが

8mm

テープで提供されるようになったため,次回更新時からはこの

unpack

作業も

必要がなくなると予想される。

2

.

データペース化

財務データファイノレのファイル形式はレコード長

3

0

0

0

バイトのシーケンシ

ヤノレ・ファイルである。レコードの並びは日経会社コード昇順,決算期昇

1I

闘で

データが記載されている。

1

つの会社のデータの並びを図示すると,次のようになる。

(8)

項目

l

項目

2

項目

3

項目

2

6

0

決算期

1

d

a

t

a

1

d

a

t

a

2

d

a

t

a

3

d

a

t

a

2

6

0

決算期

2

d

a

t

a

2

6

1

d

a

t

a

2

6

2

d

a

t

a

2

6

3

d

a

t

a

5

2

0

決算期

n

d

a

t

a

{

n

*

2

6

0

)

このように,決算期が

n

期ある場合には,

n*2

6

0

個のデータが

d

a

t

a1

から

d

a

t

a

(7)

ACOS

のユーティリティ解説舎を参照。

(8 )

実際の項目数は

2

6

0

以上であるが,ここでは例示のため項目数を

2

6

0

としている。

働圃『圃圃圃

/

158

香川大学経済論議ー

3

5

4

ファイルの大きさは総合経済ファイルの倍近くになる。

(

2

)

そのため,磁気テープの記録形式が

PackedDecimal

と呼ばれる特殊

なものとなっている。

このため,利用者はまず,

Packed Decimal

データを変換

(

u

n

p

a

c

k

)

する必要

がある。当初,我々は,それが可能でなかったが,銀行の財務データを独力で

データベース化する必要から,

ACOSのユーティリティを利用したプログラ

ムを作成することにした。しかし,

1コマンドで変換可能なバイト数の少なさ,

および一回のユーティリティ使用で記述可能なコマンド数が制限されていたた

め,データの

unpack

化には予想以上の神経と時聞を消耗した。現在,本学部

で利用されている財務データ(上場企業および銀行)はこのようにして

unpack

化されたデータをもとにしている。最近においては,

unpack

データが

8mm

テープで提供されるようになったため,次回更新時からはこの

unpack

作業も

必要がなくなると予想される。

2

.

データペース化

財務データファイノレのファイル形式はレコード長

3

0

0

0

バイトのシーケンシ

ヤノレ・ファイルである。レコードの並びは日経会社コード昇順,決算期昇

1I

闘で

データが記載されている。

1

つの会社のデータの並びを図示すると,次のようになる。

(8)

項目

l

項目

2

項目

3

項目

2

6

0

決算期

1

d

a

t

a

1

d

a

t

a

2

d

a

t

a

3

d

a

t

a

2

6

0

決算期

2

d

a

t

a

2

6

1

d

a

t

a

2

6

2

d

a

t

a

2

6

3

d

a

t

a

5

2

0

決算期

n

d

a

t

a

{

n

*

2

6

0

)

このように,決算期が

n

期ある場合には,

n*2

6

0

個のデータが

d

a

t

a1

から

d

a

t

a

(7)

ACOS

のユーティリティ解説舎を参照。

(8 )

実際の項目数は

2

6

0

以上であるが,ここでは例示のため項目数を

2

6

0

としている。

OLIVE 香川大学学術情報リポジトリ

(9)

経済分析とコンピュータ (2)

-159-仰木

2

6

0

)

まで,連続的に記述されていると考えられる。このようなファイル

からデータベースを構築するわけであるが,財務データによる分析では,ある

企業の特定項目(例えば,売上高)の経年変化をみることが多いと考え,上の

行列の各列を

1

つのレコードとしたランダムアクセス・ファイノレを作成するこ

とにした。また,ここでも,総合経済ファイ

J

レと同様に会社コードと決算項目

番号により,指定したデータを抽出することとし,データベースにおける会社

の順番を、記述したインデックス・ファイノレを作成した。決算項目番号が

1

から

連続している場合には,インデックス・ファイ/レの会社の順番と決算項目番号

を組み合わせることにより,指定したデータのデータベースでの位置を計算で

きることになる。しかし,実際には財務データファイノレの各レコードには,決

算データ以外に会社名などの情報や,空白も多く含まれている。このため,メ

モリ節約のため必要な・項目を選択することになり,抽出データの位置の決定が

少し複雑になっている。

プログラム

c

m

i

c

r

o

fがソースファイル

u

n

p

a

c

k

からデータベース

(M1CRO

DATA)

とインデックス・ファイノレ

(M1CRO_NAME)

を作成するためのもの

である。ファイル

u

n

p

a

c

k

は上場企業財務データファイルを変換

(

u

n

p

a

c

k

)

たものであるが,データ変換過程において項目の取捨選択,位置の変更を行、っ

ており,上場企業財務データファイノレとは内容が異なる。なお,現時点での収

録会社数

(DSHASU)

2

1

9

9

社,収録項目数

(DITMSU)

2

7

8

項目(取捨選

択後,決算項目データ以外のデータも含む)である。

4

7

"

-

5

7

行において,ソースファイル

u

n

p

a

c

k

から

l

社分のデータを読み込

んで行列にストックしている。読み込まれるデータは,

会社コード

(VMTCODE)

,決算期

(

V

J

P

E

R

)

JPER

(

1

)

2

7

8

項目のデータ

(VJDATA

(

j

)

)

JDA

T

A

(

1

, j),英文社名

(VENAME)

である。同一会社のデータか否かの判定は,

4

8

行で,会社コードにより判定し

ている。この過程で,その会柾の決算期数

(

K

K

1

S

U

)

が計算される。

(

9

)

スペースの関係から財務データファイ/レのレイアウトは提示できない。

rNEEDS

経財務デ

タ 磁気テ

プ説明書」日本経済新聞社データパンク局

を参照のこと。

3

5

5

経済分析とコンピュータ

(

2)

-159-仰木

2

6

0

)

まで,連続的に記述されていると考えられる。このようなファイル

からデータベースを構築するわけであるが,財務データによる分析では,ある

企業の特定項目(例えば,売上高)の経年変化をみることが多いと考え,上の

行列の各列を

1つのレコードとしたランダムアクセス・ファイノレを作成するこ

とにした。また,ここでも,総合経済ファイ

J

レと同様に会社コードと決算項目

番号により,指定したデータを抽出することとし,データベースにおける会社

の順番を記述したインデックス・ファイノレを作成した。決算項目番号が

1から

連続している場合には,インデックス・ファイ/レの会社の順番と決算項目番号

を組み合わせることにより,指定したデータのデータベースでの位置を計算で

きることになる。しかし,実際には財務データファイノレの各レコードには,決

算データ以外に会社名などの情報や,空白も多く含まれている。このため,メ

モリ節約のため必要な項目を選択することになり,抽出データの位置の決定が

少し複雑になっている。

プログラム

c

m

i

c

r

o

fがソースファイル

u

n

p

a

c

k

からデータベース

(

M

1

C

R

O

_

DATA)

とインデックス・ファイノレ

(M1CRO_NAME)

を作成するためのもの

である。ファイル

u

n

p

a

c

k

は上場企業財務データファイルを変換

(

u

n

p

a

c

k

)

たものであるが,データ変換過程において項目の取捨選択,位置の変更を行っ

ており,上場企業財務データファイノレとは内容が異なる。なお,現時点ごの収

録会社数

(DSHASU)

2

1

9

9

社,収録項目数

(DITMSU)

2

7

8

項目(取捨選

択後,決算項目データ以外のデータも含む)である。

4

7

"

-

5

7

行において,ソースファイル

u

n

p

a

c

k

から

l

社分のデータを読み込

んで行列にストックしている。読み込まれるデータは,

会社コード

(VMTCODE)

,決算期

(

V

J

P

E

R

)

JPER

(

1

)

2

7

8

項目のデータ

(VJDATA

(

j

)

)

JDA

T

A

(

1

, j),英文社名

(VENAME)

である。同一会社のデータか否かの判定は,

4

8

行で,会社コードにより判定し

ている。この過程で,その会柾の決算期数

(

K

K

1

S

U

)

が計算される。

(

9

)

スペ

スの関係から財務データファイ/レのレイアウトは提示できない。

rNEEDS

(10)

160

香川大学経済論叢

3

5

6

59~68行がストックした 1 社分のデータの書き出しである。 59行でインデッ

クス・ファイル

MICRO_NAME

に会社コードと英文担名を書き出している。

64~68行が先に説明した,決算データ行列を列単位でデータベースに書き出し

ている部分であるが,

6

4

行にあるように,決算データ書き出しのまえに,決算

期情報(例えば,

9

0

0

3

)

の書き出しに

1

レコ]ド使用しているため

1

社当た

りの使用レコード数は

2

7

9

となる。

3

.

抽出プログラム

プログラム

m

i

c

r

o

.

fはデータベース

MICRO_DATA

から指定する会社の指

定する決算項目の時系列データを抽出して,ファイ/レ

o

u

t

t

x

t

に格納するもの

である。

50~53 行において,インデックス・ファイル MICRO_NAME の情報(会

社の順番)が

MTCODE(i)

に読み込まれる。抽出に関する情報の入力部分は

80~152 行であり,ここで指定する情報は以下のものである。

OKAISHA

(

i

)

(会社コード

81~92 行

:

:

1

0

社までの会社コードを指定可能。記述方法は

macro9

5

M T

コード

と同じ。

OITM

(

i

)

(項目番号

97~113 行

:

:

2

0

項目まで,指定可能で ある。ただし,決算期(項目番号

=411)

と決

算月数(項目番号

=375)

は自動的に抽出されるようにプログラムされ

ている。記述方法は会社コードと同じ。

COLSU (

1

行当たりの出力項目数

1

1

9

"

"1

3

0

:表計算ソフトでの利用を考慮、して抽出データの体裁を整えるためのも

の。現時点での最大値は

2

0

項目である。

HAJIME

O W

ARI

(抽出開始期,抽出終了期

1

3

4

"

"

1

5

2

これらの入力情報に基づき,抽出は次のように行われる。先ず,

1

6

3

行にお

ξ

160

香川大学経済論叢

3

5

6

59~68行がストックした 1 社分のデータの書き出しである。 59行でインデッ

クス・ファイル

MICRO_NAME

に会社コードと英文社名を書き出している。

64~68行が先に説明した,決算データ行列を列単位でデータベースに書き出し

ている部分であるが,

6

4

行にあるように,決算データ書き出しのまえに,決算

期情報(例えば,

9

0

0

3

)

の書き出しに

1

レコ]ド使用しているため

1

社当た

りの使用レコード数は

2

7

9

となる。

3

.

抽出プログラム

プログラム

m

i

c

r

o

.

fはデータベース

MICRO_DATA

から指定する会社の指

定する決算項目の時系列データを抽出して,ファイ/レ

o

u

t

t

x

t

に格納するもの

である。

50~53 行において,インデックス・ファイル MICRO_NAME の情報(会

社の順番)が

MTCODE(i)

に読み込まれる。抽出に関する情報の入力部分は

80~152 行であり,ここで指定する情報は以下のものである。

OKAISHA (

i

)

(会社コード

81~92 行

:

:

1

0

社までの会社コードを指定可能。記述方法は

mado9

5

M T

コード

と同じ。

OITM

(

i

)

(項目番号

97~113 行

:

:

2

0

項目まで,指定可能で ある。ただし,決算期(項目番号

=411)

と決

算月数(項目番号

=375)

は自動的に抽出されるようにプログラムされ

ている。記述方法は会社コードと同じ。

COLSU (1

行当たりの出力項目数

1

1

9

"

"1

3

0

:表計算ソフトでの利用を考慮して抽出データの体裁を整えるためのも

の。現時点での最大値は

2

0

項目である。

HAJIME

O W

ARI

(抽出開始期,抽出終了期

1

3

4

"

"

1

5

2

これらの入力情報に基づき,抽出は次のように行われる。先ず,

1

6

3

行にお

OLIVE 香川大学学術情報リポジトリ

参照

関連したドキュメント

「心理学基礎研究の地域貢献を考える」が開かれた。フォー

絡み目を平面に射影し,線が交差しているところに上下 の情報をつけたものを絡み目の 図式 という..

データベースには,1900 年以降に発生した 2 万 2 千件以上の世界中の大規模災 害の情報がある

子どもたちは、全5回のプログラムで学習したこと を思い出しながら、 「昔の人は霧ヶ峰に何をしにきてい

 東京スカイツリーも五重塔と同じように制震システムとして「心柱制震」が 採用された。 「心柱」 は内部に二つの避難階段をもつ直径 8m の円筒状で,

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

町の中心にある「田中 さん家」は、自分の家 のように、料理をした り、畑を作ったり、時 にはのんびり寝てみた

(ECシステム提供会社等) 同上 有り PSPが、加盟店のカード情報を 含む決済情報を処理し、アクワ