明 推 協 P C 版 神 江 伸 介
日 次 はじめに
[ I ]
素 デ ー タ 作 成( 1 )
シ ス テ ム フ ァ イ ル か ら のEBCDIC
フ ァ イ ル ヘ の 書 き 出 し (2) 縮 小 フ ァ イ ル 作 成[ I I ] dBASEIII
ラ ベ ル フ ァ イ ル の 作 成(1) 変 数 ラ ベ ル , 仙 ラ ベ ル と ネ ー ミ ン グ 1 . 変 数 ラ ベ ル
2. 値 ラ ベ ル
(2) 廿寺間軸を下りる作業
(3) 選 羊 種 別 の デ ー タ ベ ー ス フ ァ イ ル 作 成 (4)
SPSS/PC+
コ マ ン ド フ ァ イ ル ヘ の 変 換1 . イ ン デ ッ ク ス フ ァ イ ル 作 成 2. レ ポ ー ト フ ォ ー ム フ ァ イ ル 作 成 3. コ マ ン ド フ ァ イ ル ヘ
[III] デ ー タ チ ェ ッ ク そ の 他 (1) デ ー タ チ ェ ッ ク
(2) テSー タ ベ ー ス 修 正 と コ ー ド ブ ッ ク 出 力 今後の課題
l O : 2 3:26 (香法'90)
明推協
PC
版(神江)は じ め に
最近日本の学界において投票行動関係のデータバンクまたはデータベースの構築に対 する関心が高まって来つつある。 1990年5月の選挙学会でも具体的な提案も含めた問題 提起が行われた。他に以前からご宅研究室を中心として,データの収集が行われてもき
たという実紹がある。いくつかの研究機関,個別の研究者においても,研究者間のデー タ交換,海外のデータ収梨などが行われてし\るようだ。米国の
ICPSR
が米国内だけでな< t
仕界の研究・教育機関にデータの提供を行い,L l
本のいくつか(})機閲もそれに加盟し データ利川を行ってし\る。選学学会においては,なんらかの形でデータ収集が行われることに対する積極的態度 が表明される反面,各種調査機関の態度,研究者の意識,金銭
I ・ .
u)制約,プライバシー の保設といった消極的態度も表明され,直ちにデータベース構築へという合意形成の難しさを坦間見せた。
公共的なフォーラムでの吊怠なデータベース構築は胄面困難としても,全国で分散し て行われている試行に対して, •貨定の標準化された f 続きで個々にデータ保仔を行い,
将 来 的 な デ ー タ バ ン ク 構 築0)と き に 備 え て お く と い う オ リ エ ン テ ー リ ン グ は 必 須 で あ る。そのような観},圧で, 1989年度から継続されている科学研究
t
じ補助金試験研究(1) 「政 治閲連データバンクシステムの凋発と利川」(研究代表者,慶応義熟大学法学部助教授小 林良彰)の実験もデータバンク構築の流れの中に位i
悦づし\てし\る。惰 者 の 担
, r i
している「明るい選学推進協会(旧公明選学連盟)」調査データ(})パーソナ ル・コンピューター版(以ド、明推協PC
版と呼ぶ)も,意識的に1 1
本におけるデータバンク構築作哭への遺乳として位
i
紺づけられたものである。明推協
PC
版のデータバンクに関連した特徴を以ドに紹介しておこう。① 1967年地方選挙から83年参:院選挙までの13[u]の各種選学に際して行われた全国調 脊を集大成した大規模時系列データである。
② 索データは
MSDOS
ファイルに変換され,一部を除いて布略されていない。即 ち,国際的に標準的なパーソナル・コンピューター川のデータであり圧換 性が翡い。③ 変数と値については,
l I
本語ラベルがつけられている。1 1
本(})調介機関の調在で あること,各研究者の利用の便利さ,日本語による学lj:̲へのI
如倫ドータ処理教育,等0) J,1.(でIlぷ沼ラベル(})釘利性は語り尽くせない。④ ラベル作成の
J
じ本となるラベルデータベース(後述)から,または,PC
版のシス テムファイルからコードブックが容易に出力できる。10 2・325
(香法'90)2 ‑ ‑
⑤ 明推協 PC版は日本語ラベルと素データが結合されたシステムファイル形式であ る。
1 U
販の SPSS/PC十によって誰でもアクセスできる。⑥ パーソナル・コンピューターによる処罪のみで済むので,初期投資を除いてラン ニングコストが不要である。システムファイル化されているので,処坪スピードが高速 である。必要物品は以ドの通り。 PC9801パーソナル・コンピ1 ーター, 20メ ガ 以r.O)ハ ードディスク,数伯油算プロセッサー(オプシ]ン), SPSS/PC+である。 SPSS/PC+
のEXPORT機能により汎用機での利用も可能である。
⑦ 一つの調杏渭たり 1メガバイトフロッピーディスク 1枚に収められているのでポ ータブルである。骸罪もしやすい。
⑧ 惰者の明推協PC版作成の「:̲順は,標準化されれば,他の大規模時系列データ(例,
ANES)の 変 数 管 岬 に 応 用 で き る 可 能 性 が あ る 。 単 発 の 横 断 調 化 地 域 調 在 に も 応 用11J 能であろう。むしろ惹識的に
t u :
綸調在データベースシステムを念頭においた調脊設叶は 今後のデータベース構築の準備に寮与することになる。本論は,筆者のプリミティヴなコンピューターの知識の制約O);じで,汎用機のシステ ムファイルから明推協PC版を作成して行った
F
順を出録したものである。利川したツ ールは,汎用機SPSS, EBCDICー..M S DOS変換ソプト, dBASEIII+, SPSS/PC+, MS DOS VER.: 3 .
:‑1 エディター ,ワードブロセッサー,であった。明推協 PC版 の 作 成 の 手 順 は 大 き く 言 っ て 以 ド の ス テ ッ プ を 踏 ん だ 。 [I
l
素 デ ー タ 作 成。汎用機で作成された明捐協調査のシステムファイルの EBCDIC形式での内き出し。EBCDIC O) MELCOMによる縮小EBCDICファイル作成と,縮小EBCDICファイルの MS‑DOSファイルヘの変換。「
I I l
変数ラベル,仙ラベルOJdBASEIIIファイル作成。:v1SDOSデータファイルとラベルファイルを SPSS/PC+によって糾合したシステムファ ィル作成。 [III]データチェック。 0)3:ステップであった。以ド順を追って説明してゆく。
[ I ] 素データ作成
(1) システムファイルからの EBCDICファイルヘの内き出し。
システムファイルは1985年時,点でー:宅教授が東大大刑計算センターで保存されていた ‑・‑ ものを利用した。背時,システムファイルから EBCDICファイルヘと内き出した理由は,
0
香川大学の MELCOM•SPSSでは東大のシステムファイルが訛めなかったからである。
EBCDICファイルは M Tに保存され,各変数.,}コラム, レコード長120,記録密度1600 BPIである。詳細は拙稿「推協データ変数火lい香川法学[]第6巻第3号, 1986年10月。
)1)
︑ `
10 . 2 :. )24 (香法'90)
明推協
PC
版(神江)以ド「変数表」と呼ぶ)を参照されたい。データファイル作成と同時に、ファイル情報 を
LP
に打ち出したが,その際・:宅教授の指ぷ通りに: ¥ I T
にも,杯ぎ込んでしヽたら,現在 の作業の精度が上がっていたと思われるが,後の祭りである。(2) 縮小ファイル作成
85 年 '{1 時東大センターが混雑しており 1:)本のファイルの最大• 最小値を出してチェッ クする作業が困難を極め,又,各変数にどの様なサイズの伯が人っているか分からない,
ディスク0)/;,!J'りが小さし', といった理由で,大体の安全尺度として 1変 数 3コラムをと った。そのままでも卜分に
MELCOM
で読み内き可能であるが,9 0
年度の研究課題とし てのSPSS/PC
十版のデータに変換するためには,原則として1
メ ガ バ イ ト の フ ロ ッ ピディスク 1枚に収まるようなサイズにするとし}うことを決定していた。
縮小フ fイル作成は,
MELCOM/SPSS
により現EBCDIC
フ ァ イ ル を 訛 み 込 む と 同 時に,各変数の最大• 最小を打ち出し,それを13本のファイルに')し}てチェックした。次に,
SPSS/PC+
データ定義の便0)ため,l
桁の仙に収まる変数を前に内き,そう数は 多くないが, 2桁以上の変数についてはファイルの最後尾に付け加え, 1行80桁で内き 出した。できあがった私用ディスク内ファイルについて,本学経済学部本田道犬助教授 作成のMELCOMPC
間の変換ソフト「TERM
」を利川して,MSDOS
ファイルに変換 した。結果は,ほとんどのデータはフロッピーディスク 1枚に収まった。 80年のダブル 選挙のみ lメガを超えたので,再度,情報接触の部分などを削除して作成し直した。例
7 2
年衆院調在MS DOS
データファイル名D A S H U. 7 2
データ 選 挙 種 調 介 年[ I I ] dBASEIII ラベルファイルの作成
0 九
データベース・ソフトを用いて,明推協のラベルファイルを作成した。その狸由は以 下の通り。
① 明推協の調牡は,
6 ( ) :
年代木から現在まで,多くの質間文,l
叫答項目がl11Jーであり,紺
l u [
の調任別にラベルを新たに作る必要が少ないこと。② 将来的な調脊について検索・追加・修正が可能となること。
③
SPSS/I
℃ ‑卜ヘのコマンドファイルの出力にほぱそのまま使えること。④ ラベルリスト,コードブック作成をデータベースから
f f
えること。即ち,ワープ ロ人)]を最小限に抑えることができる。10・2 323
(香法' 9 0 )
~ 4⑤ ‑‑ 定 の 「 : 順 が 決 ま れ ば , 他 の 横 断 調 介 , パ ネ ル 調 在 の 変 数
I
胄 報 も プ ロ グ ラ ム コ ン トロールによって操作できる可能 性が凋けること。⑥ 明 推 協 類 似 の デ ー タ , 例 え ば 令 米 選 ) 作 研 究O)
I l
本 出 版 作 成 の 際 に も 応 用 が 可 能 な こと。⑦ 明 推 協 内 部 の , 衆 参 地 方 選 挙 , そ れ 以 外 の 類 似 の 調 査 の デ ー タ ベ ー ス と の 間 の 変 数 情 報 の 相
h
関 連 付 け を フ ァ イ ル の 多, f i :
オープン機能や,初発,点の厳格なデータベ ー ス の 設 叶 に よ っ て 可 能 と な る こ と 。ラ ベ ル デ ー タ ベ ー ス ・ フ ァ イ ル 作 成 の 作 業 は ,
l ・ ̲ O )
ような可能'性を苔慮に含めて表現 するとI I 1
図のようになる。図では初発人りを8 ]
作参院明推協,翡任にとってある。I I 1
図 ラ ベ ル デ ー タ ベ ー スコードブJク
‑̲1111J
ー削正値下
.各
.
扉 . 炊 ︱
ー追除変一
ーー
1 1 1
ーL I
L 1 ,
‑
ー
︱▲ ︱
‑ q
‑
LIIII﹂
. . . .
‑‑‑‑
‑̲,̲I I
l追加・削 I
,‑‑ ‑‑‑ I除・ 修正'
I I
I I―
‑ ‑ ‑ ‑ ‑ ‑ ‑ 7
変敷、 1直I I
I , ̲̲̲̲ ̲I
電
r r o
帳簡易C B
↓ 共同利用センターへ
• ー ・ ― ‑ ― ‑
li
ワープロi
1 1‑H
f J
L_ ―-—-」
SPSS/PC+ COMMA:‑;D file
8 3 明協院査
年推参調1 9
一 ー 1 9 1 1 J
‑ I I I I I I J
L 削
l E
値一 ー
L削正値︱
︱
‑
. 冬 一
.冬
‑ 1 1
‑ l i
‑
扉 . 改
l
︱加
・料
5
‑
︱追除亦父一︳追除変一
‑ L
‑
﹂ー1
ー 一 ー
1 1 J
̲̲̲ ̲
}
‑
︱
‑
︱
‑
︱
︱
︱
︱
︱
︱
TIlー—’11ー'lll年ek几—
︱
︱
︱
.I i‑
1" ‑+J‑ー1
r 1 9 , L r ' 1
ーL
他調査機関に よる調査
!~!PORT I
二 I ― ̲ 」
研究・教育
. . . .
総合世論調査データベース・システム調査設計
. . . . .
国際比較. . . . .
データヘのアクセス
0
八図の,特に ~i ド段部分は将来の夢を含んでいるので,本誨ではとりあえず,明推協
SPSS/PC
ト シ ス テ ム フ ァ イ ル の 作 成 の と こ ろ ま で の 手/ l l r i
について触れておこう。ラ ベ ル デ ー タ ベ ー ス は , 次 の よ う な ス ト ラ ク チ ャ ー で 構 成 さ れ て い る 。
'
‑ ‑‑ ,) 10 ..'.2 3'.2'.2 (香法'90)
明推協
PC
版(神汀)例 参院ラベル
LISTSTRUCTURE
データベースの構追:SA. DBF
データレコードの数:3 2 1
最 終 吏 新f l
付:0 4 / 1 7 / 9 0
番号 フィールド タイプ 幅
VARNA
文字刑 ~62 SA83QNO
文,('.I t '
リ I'¥3 SAH3QNA
文字刑 l~O4 SAK3VNO
文字氏l ' 8
;)
SAHOQNO
文字刑H 6 SA80QNA
文字'.1\1~1 2 0 7 SAHOVNO
文 字t '
・リ ~8 SA77QNO
文字刑8
, SA77QNA
文字咽 l~O1 0 SA77VNO
文字凡l l 8 1 1 SA74QNO
文字氏リ8 1 ' . Z SA74QNA
文字刑l ' . ! O 1 3 SA74VNO
文字邸8 1 4 SA71QNO
文字刑H l S SA71QNA
文' j ‑ ' . J t
リ l~O1 6 SA71VKO
文字刑8
0 七
I :
例 で み る よ う に , ラ ベ ル デ ー タ ベ ー ス の 最 も 韮 本 と な る も の は 変 数 ラ ベ ル
(VARNA)
である。変数ラベル作成は次のような原則にしたがった。第‑・・ に, i変数表」の「変数」 (p.6)につけた名前に
l
よづしヽてネーミングを行う。変数名,単数[11[答の場合は伯ラベルもつけていく。
第二に,貼本となる調介時、i,1i0)データベースファイルからf翡間軸をドりるという縦方 向のフィールド埋め。今[ri]は, 8:l年参院選学調在を初発点とした。
第三.に,選卒種別にデータベースファイルを作成する。ファイル名は,衆院 SHU.
DBF,
参 院SA. DBF,
地方LO. DBF,
である。第四に,
SPSS/I
℃十コマンドファイルヘの自動変換が行えるように配慮する。最後に,
c l B A S E I I I
の機能をフルに活用し,省)]化を図る。(1) 変数ラベル, 1[1'(ラベルとネーミング 1. 変数ラベル
変数ラベルは,最大全角
1 3
文字分であった。その理由は,SPSS/PC t
の最大値を各変 数,値ラベルに採川してゆくと,将来の追加を考^えると,データベースファイルの許容1 0 2 : 1 2 1
(香法' 9 0 ) ‑ 6 ‑ ‑
サイズ (4000バイト)を超えてしまう恐れがあったからである。
システムファイルヘの変換への号b位は引用符(,)でラベルを開むことであった。
引用符内ラベルについては, 11本泊を使川し, i変数表」でつけたネーミングに, .DBF
ファイルが 3 種になることを衿慮し,各叩に公職種を表1]~する文字をつけた。
例
VARNA'衆 投 梨 政 党 '
この例は,衆院選洋())』訃査表における,対象者の投奴した政党を表す表現している。
公職種のネーミングは以下の通り。
公職(大分類)公職(小分類)
衆 院
ネーミング
衆
参 院
統 一 地 方
参 参 令 地 上
t
知̲ ︳
'' '; ,(
. メ 学 例 選
. .
比 体 方 国 体O t f 令 地 全 全 知
ロ
.... い 凡 `¥ ー︐
ー ・ ヽ
T'
,•
ノ、ー—f"
L•ぷしー︐ ︐ e .‑ .
1 1 I
ヽ﹇ /
複数日答部分については史に情報が必要であった。ー〖覧しておく。
公 職 柿 変 数 名 伯 名
() 棄 権 理 由 月
l ,
病気,—情報接触選挙公報,立会い演況,
,情報利用 選挙公報,立会い演説,
若慮侑点輻祉,公'};‑, ...•...
(tリ
H J
き し だr I
『報)(役にたった情報)
ーーコウエンカイ加人罪由— 'f翌.張,.........
拒否政党—自民,社会,.........
政治―不満ー公約,.........
所属団体―町内会,婦人会,....… .. 社 会 化 機 閲 家庭,学校,…••…•
複数 ~1] 答部分については,大~(に同じ文字を打ち込まねばならないため,省)j 化を図 った。即ち,先ず,単数阿答のレコードを人)jし終え,次に,複数
l
口l
答の人力を行い,dBASEIIIのSETCARRY ONコマンドを利川して,部分修Iじを行しヽながら APPEND を実施した。
︒
'
ノ
‑ I 10
: z ・ : m i
(香法'90)明推協 l℃ 版(神汀)
0 五
単数・複数回答0)いずれの人))過程においても,変数番号と質間文番号をつけておか ねばならなしヽ。これらの番号は後々のインデックス, システムフ i'イル作り, コードブ ック作りの址本となってゆく極めて市要なものである。変数番号は文字刑で 3桁までの V001~V999 とし)う表現を取る。質間文番号は文字刑で 8 桁まで。
2 . 1
『(ラベル各変数値にはラベルが必要である。
SPSS/PC
十の文字数制限(印刷u
は半角2 0
文 字まで(最大半角60字)。
値ラベル付けの作策も後続作業の韮本となるので可能な限り完全なものである必要が ある。
1 1
標は完全な調在表のワーディングであるが,.DBF
フ,,イルのサイズとSPSS/
PC
十の字数制限があるため,1 f r i
の多い項l l
は略記法を取らざるを得なかった。厄介なこ とは,変数ラベルでも同様だが,引用符でくくらねばならなし¥ことだ。値が多数にわた ると数字を打ってり[JIJ符を打つという作業が実に煩雑となる。そこで,dBASEIII
のSET F
じNCTIONXTO'"'
を利用し,定刑的な「I "2 "
:3'' ………」をし)くつか割り ~ljてておいて,
SET.PRG
ファイルに人れ,起動のときにDOSET
で引き出すようにし,引用符の中に挿入する方式でラベル付けを行った。今日はじとして単数[r1]答にラベル付 けを施した。
1
直ラベルのフィールドはSA83QNA
である。変数ラベルを含んだ例をぷす。
VARNA SA83QNO SA83QNA SA83VNO
参 政治満足度' Q:lO 1'卜分満足, 2 , だいたい満足' . :3 …… V195 (2) 時間軸をドりる作業8 3
年参院選学の変数ラベルと値ラベルができたら,これを元にして8 0 '
ダ ブ ル ( 一 部 を衆院データベースにコピーすることになる),7 7
年,7 4
年,7 1
年のソィールドを埋める 作業が続くことになる。VARNA
はすべて同じなので,変数番号,質間番号,値ラベルを書かねばならなし%。
作業の第一は, 8:3年と同一フィールドを他の 4調介とも作成し,「変数表1の各調牡年 度の変数番号と質間番号を打ち込んで行くことであった。単数[口]答は「変数表」のまま の番号で打って行ってよいが,複数[叫答は,占い年度のものは脱洛したり新規に登場し たりするものがあるので,その都度変数名と対照しながら,必要ならば
APPEND
して 行かねばならない。その過程で,複数回答については全調在を通して完備したものにな ってゆくのである。尚,複数[口l
答には, 8:3年の値ラベルを内いてはならない。 [11[答の有 無について,値の与え方に年度により大きな変吏があるからだ。複数[11]答の値について は,いずれ,システムファイルのコード変容を行って年度を通した—→貫した値に統一す る必要があろう。10 ‑2
i ‑ :
19 (香法'90) 8第二この作業は,他年度調査についての伯ラベルの作成である。この作業については,
(1) でやったようなことの緑り返しではなし 'o 先ず—•気に, S:3 年 0) 仙ラベルを他年度のラ ベルフィールドにコピーをしてしようことである。
{
列 80年 へ の コ ピ 一 方 法
REPLACE ALL SA80QN A WIT II SA83QN A FOR SA80VNO〈 ),'. J¥T¥D. SA8:3VT¥O〈〉''
即ち,80年の変数が存在しかつ83年に変数があるものについて,80年のQNAフィール ドヘ83年のラベルがコピーされる。以下, S/¥8:lQNAを
1 , u
様 に し て 他 年 度 ヘ コ ピ ー を 施 してゆくのである。 .AND.以ドがしつこし)ようだが,これがないと,後で付け加えた83 年にない新規変数についてもし伯ラベルを打ち込んているようだったら, 83年の名豆白のフィールドがせっかく作った新規変数の値ラベルを真っ白にしてしまうからだ。
最後に,伯ラベル0)内容変史の有無に従って,ラベル内換えの作菓が残っている。「変 数 表 」 は , 伯 に つ い て の 変 化 は フ ォ ロ ー さ れ て い な い の で , 各 回 調 在 の 調 在 表 を 参 若 に してチェックを行い,ワーディングの相違,イ直の変吏などのチェックとフィールドの内 換 え を 行 っ た 。 値 の 変 更 が あ っ た 変 数 に つ い て は 変 数 ラ ベ ル の 最 後 に 「 十 」 を 人 れ て 識 別が容易なようにしてある。
(3) 選 学 種 別 の デ ー タ ベ ー ス フ ァ イ ル 作 成
参 院 の デ ー タ ベ ー ス フ ァ イ ル 作 成 終 了 後 , こ れ を 有 効 に 活 か す , ま た は , 明 推 協 調 行 の 他 選 挙 調 在 と の 類 似 性 を 根 拠 に , 衆 院 デ ー タ ベ ー ス フ ァ イ ル SIiじ DBF,地 方 選 洋 データベースファイル—LO. DBF, へ の 参 院 デ ー タ ベ ー ス フ ァ イ ル の 各83年 選 挙 へ の 変 数 ラ ベ ル と 値 ラ ベ ル の コ ピ ー を 行 っ た 。 変 数 ラ ベ ル の コ ピ ー に は , 参 院 か ら 衆 院 へ の 場 合,例えば 参 政治満足度’であるので,これを'衆——政治満足度'に変史しながらのコピ ーとなる。先ずデータベースファイルをSA.DBF→ SHU. DBFヘコピーし,後者のフィ ールドを調査年に合わせて内き換える。次に,'参……'の部分を'衆……'に附き換える。
REPLACE ALL SUBSTR (¥TARN A, 2, 2) WIT II'衆でよい。 REPLACEコマンド を使わないときは, COPYTO SHU. TXT DELIMITEDというテキストファイルを作 り,エディターを使って参→衆の置換を実行し,再度SHU.DBFファイルヘ説み込めば よし%
後の作業は,衆,地方ともに,存在しない変数の削除,新たな変数の追加,変数番号,
質間番号の変吏,値ラベルの変吏など,参院データベースファイルで行った手順を紺り 返せばよい。
(4) SPSS/PC十コマンドファイルヘの変換
コ マ ン ド フ ァ イ ル ヘ の 変 換
f
順 はII '.Z図の通り。0
四ー---~--- 10 2:
i ‑ :
18 (香法'90)明推協
PC
版(神江)I I 2
図 コ マ ン ド フ ァ イ ル ヘ の 変 換 衆院の例。S H
,じDBF 変ラ . 値ワ‑
註
質問‑ ‑ ‑ , ―
S‑
H‑
U‑
80‑
‑7‑
2‑
QN‑
O‑
番号\'AR~A
‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑
SHU80‑72QNA
‑‑‑ ‑‑ ‑
SHU80-72V~O
ス成ク作
/ル
デイ ンマ 1i 17
S H
じ80‑72VDX
‑ ‑ ‑ ‑ ‑ ‑ ‑ S H
じ80‑72QDX 2.
レポート7ォーム 7ァイル作成
SHURP80
‑72V. FRM
‑ ‑ ‑ ‑ ‑ ‑
SHURP80
‑72Q. FRM 3.
ゴマンドファイルヘ
変炊レベル
‑
テキスト‑ ‑ ‑ ‑ ‑ ‑
値ラベル テキスト
SPSS
/PC十 変 数、値ラベ ルコマンド ファイル1. インデックスファイル作成
L
例のように, 各調牡年度の変数, 質問(ここでは利用しないがコードブック作成の とき必要となるのでついでに作る)番号についてインデックスファイルを作成する。混乱がないように選挙種と調査年が入ったファイル名にしておくとよい。
2 レポートフォームファイル作成
SPSS/PC
十 の コ マ ン ド フ ァ イ ル の 一 部 と な る も の な の で ス ラ ッ シ ュ を 付 加 し た も の を変数ラベル用,値ラベル用に各作成する。※変数ラベル用レポート
フィールド
l
フィールド内容:'/'+SHUSOVNO
※値ラベル用レポート
フィールド
l
フィールド内容:'/'+SHUSOVNO
これら三.つのレポートフォームを使って,
フィールド
2 ''+VARNA
フィールド
2 ''+SHU80QNA
コマンドファイルの応になるテキストファ イルを き出すのであるが, その際各々条件が必要となる。
※変数ラベル
USE SHU INDEX SHU80VDX
REPORT FORM SHURP80V TO SHURP80V. TXT FOR SIIU80VNO
〈〉', このようにすると,8 0
年調査について変数が存在するラベルのみが変数順に並んでテ1
0
1 ︱ ︱
キストファイルに書き出される。
※値ラベル
USE SHU INDEX SHU80VDX REPORT FORM SHURPHOQ AND. SIIUSOQNA
〈〉,'l()~- 2 ... 317 (香法'90)
TO SHURPSOQ. TXT FOR SHU80VNO
〈〉''.― ‑
10~こうすると,
8 0
年 調 査 に つ き 変 数 が 存 在 し か つ 値 ラ ベ ル が 存 在 す る 値 ラ ベ ル コ マ ン ド ファイルが変数番号と共に順序よく書き出される。3 .
コマンドファイルヘコ マ ン ド フ ァ イ ル 作 成 に 最 低 必 要 な 材 料 は , 汎 用 機 シ ス テ ム フ ァ イ ル か ら の
WRITE CASES
で書き出したときのフォーマット文,M SDOS
データファイル,変数ラベル,値ラベルになる2.で作成した二つ0)テキストファイルである。
コマンドファイルの例
①
DATA LIST FILE='¥SHU¥DA¥DASHU. 8 0 '
i ) i i )
r̲i )
神江のディレクトリー,ii)MS‑DOS
データ]②
③
④
/V006 TO V 0 1 8 , V052 TO V l l 7 . Vll9
l80
I
・・・・・・・・・・・・・・・I
・・・・・・・・・・・・・...← ピリオ ドVARIABLE LABELS VOOl'
地域+'/V002'
都市規模十'/V005'
明正選挙'I
・・・・・・・・・・・・・・・.VALUE LABELS VOOl
1'北海道 '2 東北'…•………••/V002 1 '
束 以 都 区 部' 2 ' 1 0
大r t i ' I
・・・・・・・・・・・・・・..SAVE OUTFILE ='¥SHU¥GT¥GTSHU. 8 0 ' .
t
例は,衆院8 0
年調査のMS‑DOS
データをSPSS/PC+
で読んで,変数ラベルと値ラ ベ ル を つ け た じ でSPSS/PC+
O)シ ス テ ム フ ァ イ ル に 変 え て 保 存 す る コ マ ン ド フ ァ イ ル の例である。エディターを使って作成する。① データの定義
EBCDIC
からMSDOS
へ変換されたデータファイルを訛むが,MSDOS
の変数の並 びは,縮小ファイルに内き出すときのWRITECASES
OJ¥り式に定義されているので,この内式を参者にしながら,
SPSS/PC
十川0)データ定義(DATALIST)
を行う。最後に ピリオドを忘れないように。② 変数ラベル
1 1 1 0
‑:2: n 6
(香法' 9 0 )
゜
明推協
PC
版(神江)これは
2 .
で 作 成 し た テ キ ス ト フ ァ イ ル にVARIABLELABELS
を加え,dBASEIII
の レ ポ ー ト の 際 の ペ ー ジ 区 切 り と 余 分 な キ ャ ラ を 削 除 す れ ば 完 成 で あ る 。
③ 値 ラ ベ ル
これも,
VALUELABELS
を付加し,更に,8 0
桁以内で改行マークを人れて行けば,そのまま使える。
④ シ ス テ ム フ ァ イ ル
SA VE OUTFILE
='……'を入れておけばシステムファイルとして保存される。注意 しておかなければならないのは,SPSS/PC+O)BAR. INC
にSETCOMPRESS = ON.
としておかないとい大なファイルを生産してしまうという,点である。
⑤ テストラン
テストランを行うのは,コマンドファイルのデバッグを行うとしヽう意味もあるが,ラ ベ ル デ ー タ ベ ー ス 作 成 に と っ て も , 禁 止
i
莫 字 を 発 見 す る と い う 最i f t
要 な 意 味 が あ る 。 現 在 ま で の 発 見 さ れ た 禁I t
→j葵字は投票行動関係では余りないようだ。以下の通り。繁l卜出 後援会
・PTA
・義務カタカナもしくは半角英語表現にしておくとよい。
現 在 シ ス テ ム フ ァ イ ル と し て 保 存 さ れ て い る の は , 衆 院 ( ダ ブ ル を 含 む ) 5件 , 参 院
4
件 , 統 一 地 方5
件 の 計1 4
ファイルである。シ ス テ ム フ ァ イ ル 北 応
衆 院 参 院 地 方
G T ! : , l l l J . 7 2 GTSA. 7 1 GTLOC. 6 7 GTSIIU. 7 6 CTSA. 7 4 GTLOC. 7 1 G T S l i l J . 7 9 GTSA. 7 7 GTLOC. 7 5 GTSIIU. 8 0
(;‑「SA.8 3 GTLOC. 7 9 GTSIIU. 8 : 1 GTLOC. 8 3
゜
1 0 2 : n s
(香H ( 9 0 ) 1 2 ‑ ‑ ‑
[ I I I ] データチェックその他
デ ー タ チ ェ ッ ク と デ ー タ ベ ー ス 修 正 , シ ス テ ム フ ァ イ ル 完 成 ま で の 作 業 の 流 れ は 次 図
0)ようになる。
III ‑ 1図 デ ー タ チ ェ ッ ク と 修 正
ラベル データ べ ース
FREQUE:‑;CJES GE:‑;ERAL=ALL
デ ー タ ベ ー ス 作 成
明推協調査表 明推協原資料
変 数 並 び チ ェ ソ ク 値カテゴリーチェ/ク 度 数 チ ェ / ク
度 数 分 布 付 き コ ー ド ブ ! ク
‑‑ ‑ ‑ ‑
変 数 、 値 ラ ベ ル ゴ ー ド ブ ッ ク
(1) データチェック
各 々 の シ ス テ ム フ ァ イ ル を 訛 ん で , デ ー タ と 変 数 番 号 が 正 確 に 対 応 し て い る か , デ ー タの値と
f f r {
ラ ベ ル が 対 応 し て い る か , デ ー タ の 度 数 と , シ ス テ ム フ ァ イ ル の 度 数 が 対 応 しているか, と い う 確 認 作 業 が デ ー タ チ ェ ッ ク で あ る 。 シ ス テ ム フ ァ イ ル か ら の デ ー タ の 内 き 出 し は 令 て の 変 数 に つ い て 度 数 表(FREQUENCIESGENERAL二 ALL.)を出 す こ と に よ っ た 。 出 力 結 果 は , 何 も 定 義 し な け れ ばSPSS.LISというファイルに裕えら れ る 。 プ リ ン ト ア ウ ト は 紙 と リ ボ ン の 無 駄 と な る の で 画 面 チ ェ ッ ク で あ る 。 チ ェ ッ ク の 原本としたのは,明推協調在の各「原資料」であるが,「I
泉行料」自体年度によって実数 がでてし)なかったり,J f i l J
が 幣 罪 さ れ て い た り で , 牛0){直に対応していないことが多い ので注意を要する。大枠として,チェック領域は,1 W
述 の 通 り 変 数 と デ ー タ の コ ラ ム の 対 応 と 値 の 分 布 と デ ー タ の 値 と の 対 応 で あ っ た 。 実 数 に よ る 確 認 が 最 も 正 確 で あ る 。 変 数ズレが発見されたら,イ直ラベルの方の変数ズレも修正しておかねばならない。(2) デ ー タ ベ ー ス 修
r E
とコードブック出力間 違 い が 発 見 さ れ た ら シ ス テ ム フ ァ イ ル の 修
1 f .
と,ラベルデータベースの修正を行う。最後に,修正済みのシステムファイルで再度,祉んでみて間違いがit'(っていればシステム フ ァ イ ル の 完 成 で あ る 。 完 成 し た シ ス テ ム フ ァ イ ル と ラ ベ ル デ ー タ ベ ー ス か ら , コ ー ド ブ ッ ク 関 係 が 出 力
1 1 J
能な状態となる。0 0
ー‑‑‑ I:¥ ‑ 1
o
z:: n
4 (香法'9())九 九
明 推 協 PC版(神江)
コードブックにつし\ては,利用者にとって,フロッピーにシステムファイル情報が人 っ て い る の で , い つ で も 好 き な と き に 引 き 出 す こ と が で き る 。 従 来 の よ う に 大 部 の コ ー ド ブ ッ ク を 携 岱 す る こ と は 必 ず し も 絶 対 条 件 で は な く な っ た 。 も し 大 刑 セ ン タ ー の シ ス テムファイルを利川しようとするなら, fl11Uで 行 う 場 合 IMP()RT/EXPORTがある・ー・
方 , 既{iO)汎 用 機 シ ス テ ム フ ァ イ ル の 利 川 の 場 合 ラ ベ ル デ ー タ ヘ ー ス か ら 必 要 な 情 報 を 屯
( ‑ f
船 な ど に りI
き出して携術することができる。しかし,明推協のような時系列データの場合, 上 級 品 と し て , 度 数 分 布 付 き の コ ー ド ブ ッ ク , 中 級 品 と し て , 変 数 検 索 と 値0)‑‑・屁表的なコードブックは俵然として必要であ る。
I :
級コードブックは大部となるが,特定の共通してし\る変数に,)し)ての時系列軸I :
の国民())態度変容())‑‑. 覧にイ
i
川である。実数が分かる())で,統, i i
処罪())J
よ礎的情報とし て活用できる。等々。q ,
級ラベルコードブックはシステムファイルに人るための初期 「N
報 収 集 作 業 を 節 約 で き る 。 最 低 , 特 定 年 度 を ロ ッ ク し た 状 態 で の 変 数 ラ ベ ル と 変 数 番 号 対照表, iれ数回答変数のイ直ラベル,変吏のあった 1伯ラベル,が必 I~である。 卜級,中級 の出力例を小しておしーう。
※上級コードブック
GET FILE 'YSIIU¥VJ'Y(;TSA. 83' FREQ GEi¥E ‑V2H T O V2J4.
¥'24"1 参 付~ ..
¥'alid Cum Value Label Value Frequency Percent Percent Percent 男 1 10()4 ‑16.7 Hi.7 46.7 女 z: 1248 :り3. 3 ,―),') ).,')) 100.0
TOTAL :2'.l4:2 ]()()̲() 100. 0 Valid Cases 2342 Missing Cases )(
‑ ‑‑‑‑ . 呵. ‑‑
¥'246 参 {ド齢 2
Valid Cum Value Label Value Frequency Percent Percent Percent 20 24 I 1:i'.{ 6. :i 6. ;j 6. ;j
2:i 29 2 17:i I . ,) ~I . ,' ) 14. 0
: r n
39 :1 ,‑) ‑' ,J~ I 23.~ '2'.¥. H :17. 8 40 49 4 ,,),'J).'J) 22.8 '.:!'.:!.H 60.:i;i() G9 `r ) 406 17. :i 17. :{ 77.9 60 6 518 22. l 22. 1 100.0
TOTAL 2342 100.0 100.0 Validし:ases 2342 l¥Iissing Cases )(
10 2 ・:in (香サ);'90) 14 ... 一
V247 参 学 歴
Value Label 初 存
闘校 大 学 不 明
[い級コードブック
① 変 数 対 照 表
Value
変 数 名 参 性 参 年 齢 l 参 ・年齢2 参 学 歴 参—一本人職業 t 参 収 人 自 営I 参 労 組 加 人 参 勤 務 先 規 模 参 ー 収 人 被 傭j
参
i
・:人職業 参 ),り住年数十参 所属団体・一町内会 参所屈団体—婦人会 参‑/折属団体
PTA
参 所 属 団 体 農 協 参 面 屈 [ 寸 ] 体 労 組 参
1
祈 属 団 体 経 済 参—所属団体家教 参 所 属 団 体 同 好 会 参—所属団体 その他 参 所 属 団 体 未 加 人 参 所 属 団 体 不 明 地 域t
参 都 市 規 模t 参ー年齢
② 非 変 吏 分 伯 ラ ベ ル 表
ゥ︶︶
4
TOTAL
Valid Cases 2342 Missing Cases‑‑‑・‑‑‑‑‑‑‑‑‑・・‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑・‑‑‑‑‑ ‑ ‑ ..
18
・・・・‑‑‑‑・‑・
2:l42
参 院 推 協 調 任 8'.i V244 V2:15 V216 V247 V248
¥
「249
V255 V256 V257 V258 V259 V260 V261
¥'262 V26:l V264 V26:i
¥'266 V267 V270
80
¥r:)b/ V:368 V:369
v : m i
V'.371 V:l72 V2SO V373 V251
V2fi2
v 2 s : i
V254 V:l7り
V:l76 V:l77
¥':l78 V:l79 V:l8o V381 V:l82 V383 V38、t V:185 V386 V387 V388 VOOl V002
Frequency 796 119~
: n o
77 V221 V219
V218
¥'19::i
¥T 196
¥'197 V198 Vl99
V201
VOO:i V006
ー
︑
74 V:254 V:Zj:2
V'.251 V:216 V:217 V218 V219
¥'220
V222
V006
¥'007
lやrccnt : 34 . 0
s
l.'.? 14. l.8
‑‑‑‑
100 .0
¥'alid Percent
: 34. 0 :'il. ~
14. 1 .8
‑‑‑‑‑‑‑‑‑‑‑
100.0
Cum Percent
: 34 . 0 H~.l 99.:Z 100.0
71
\ ア278 V276
V27S V~46 V'.Zl7
¥'2‑1‑8 V'.Z‑1‑9 V2SO
¥'2り2
VOOcl
¥'00日
九 八
LJ 10 ッ ] 312 (香法'90)
明推協 PC版(神江)
変数名 83 80
7 7
74 71 値 名 参 一 性 V244 V367 V221 V254 V278 1 l)j 2女 参 年 齢 l V245 V368 V219 V252 V276参一年齢2 V246 V369 1 20 24 2 25 29 3 :rn 39 4 40 49 5 :iO 59 6 60
参 学 歴 V247 V:370 V218 V251 V275 l初 等 2高校 3大 学 4が明
参 労 組 加 人 V250 V373 V197 V218 V248 l加 人 2非加人 3組合無 4不明 参 勤 務 先 規 模 V251 Vl98 V219 V249 1 1 9 2 10 99
3 l 00‑999 4 1000 —不明
参 主 人 職 業 V253 V376 1農 林 2 莉―I~サ 3笠罪 4専 門 5事 務 6販 保 サ 肉 体
7生 産 肉 体 8無 職 9夫無
参ー所属団体―町内会 V255 V378 参 所 属 団 体 婦 人 会 V256 V379
参ー所属団体— PTA V257 V380 (MA) 参 所 属 団 体 農 協 V258 V381
参ー所属団体ー労組 V259 V382 参 所 属 団 体 経 済 v260 v:rn3 参 所 属 団 体 家 教 V261 V384
参—所属団体詞好会 V262 V:385 参ー所属団体 その他 V263 V386 参ー所属団体一未加入 V264 V387
参所属団体—不明 V265 v:rns
参—年齢 V270 12024 2 25‑29
3
: r n
:34 4 35‑395 40 44 6 45‑49 7 50 54 8 55 59 9 60 64 10 65
九
③変更分値ラベル表(紙面の関係から 2回分の調査のみ掲載)七
1983 1971参本人職業+" FVl 農 2商工サ FVl 農林 2商
r
ササ0 2 3農付家 4商 家 () 2 :-1 農林—家
4 4 5管 理 6専門 1 4 4商 工 家 5管 理 8 7 事務 8 販サ—肉体 6 6 専門/事務 8生産
10‑‑2‑‑<311(香 法'90) ~16 ‑‑‑
9 生産—肉体 9学 生 10主婦 10学 生 11主婦 11無 職 , 他 12無
参ー収人自営+ FV1 7 2 7‑ FVl ‑323‑35 0 2 3 10‑4 15 0 2 4 7 5 10‑ 4 4 5 20 ‑6 25‑ 1 4 6 15‑ 7不定 S 9 7 30‑ 8不定 S 7 8不明
Q
9不明Q
1A
参 収 入 被 傭 十 F V 1 7 2 7 FVl 323‑35‑
0 2 3 10‑ 4 15‑ 0 2 4 7‑ 5 10 4 5 5 20‑ 6 25‑ 1 5 6 15‑ 7不定 S 2 7 30‑ 8未定 S O 8不明
Q
9不明Q
:~
4B
参——居住年数十 F V 1 ‑3 2 ] FVl 3 2 ‑10 0 2 3 10‑ 4 20‑ 0 2 3 15 4 15‑
5 5 5不明 2 5 5不明 6無回答,誕生以米
4 S 2
地域+ V 1北 海 道 2束北 V O北 海 l束北 2 3関東 4東京 2)( 区部 3関東 6 5北 陸 6東山 0 4北 陸 5中部 6 7束海 8近畿 4 6東 海 7京 8阪
9 中国 10四国 9近畿 10陰 11)砂卜
I
12沖 縄 11賜 12四 13九今後の課題
明推協の調牡データについては何とか完結に向かいつつある。今後の問題について明 推 協P C版に限って摘記してみよう。第一に, P C版の利用方法である。プロジェクト・
メンバーがデータを共有することは当然としても,メンバー外の利用については,素材 がいつでもコピー11J能なフロッピーディスクに人っているだけでなく,SPSS/PC+によ って不断のコード変容に見舞われる可能性が高い。即ち,複数の人の間のコピーの過程 でデータのオリジナル性が失われていく 0)である。さらに,世論データとはいえ,対象 者を特定できる可能性も残っているというプライバシー侵古の危険性が学会でも指摘さ
~--- 17 10 2・310 (香法'90)
九
/'¥
明 推 協 l℃版(神江)
れ た 。 最 後 に , 明 推 協P C版 原 本 の 改 善 も ル ー チ ン 化 し な け れ ば な ら な し %
とりあえず,
1
項 山 の 間 題 点 に つ い て は , 次 の よ う な ル ー ル で 利 川 の 拡 大 を 検 討 し て い る。第 一 に , シ ス テ ム フ ァ イ ル の 利 用 に つ い て は 無 料 。
, l i
[fljは , シ ス テ ム フ ァ イ ル の BACKUPフ ロ ッ ピ ー デ ィ ス ク を 請 求 し , 利 用 者 が ハ ー ド デ ィ ス ク に RESTOREしたのち 作 成 者 に 返 却 す る 。 ラ ベ ル デ ー タ ベ ー ス の 提 供 は し な い 。
第^^に,シスfムファイルの泊求は,作成者に対して行い,
i
胄求者は自己の所属する 研 究 ・ 教 育 機 関 以 外 で の 利 用 ・ コ ピ ー の 提 供 は し な い 。第―:に,作成者は,調介対象者に関係する研究に不要な部分の識別番サデータについ て は つ ぶ し た 上 で 提 供 す る 。 利JIJ者 は , デ ー タ をflL~ の 研 究 ・ 教
f l
目 的 以 外 に 利 川 し な い こ と , 所 属 機 関 外 へ の コ ピ ー 提 供 を し な い こ と を 確 約 す る 。第 四 に , 利 川 者 は 利 用U)過オ閉で発見した間違いあるいは改善の提案等を作成者に情報 提 供 す る こ と に よ っ て , 明 推 協PC版のレベルアップに協力する()
[付記]
本論の執^在のために1989, 90年 度 科 学 研 究 費 補 助 金 試 験 研 究(l)I政 治 関 連 デ ー タ バ ン ク シ ス テ ム の 開 発 と 利 用 」 を 活
I I J
させて[月し吠:。本研究については,SPSS/PC
t
の イ ン ス ト ー ル 等 に つ き 本 学 商 菜 短 期 大 学 部 堀 啓 造 助 教授,変換ソフト「ターム」については本学経済学部本田道大助教授にお世話になった。香)II大 学 に お け る SPSSOJ利用については, FACOM4SS11寺 代 か ら 脱 業 短 期 大 学 部 中 村 邦 彦 助 教 授 に 一 貫 し て お[If:話になって来た。科研関係・データベ‑ース関係では,神]i大 学 教 授
: : t ‑ ‑
郎 氏 , 慶1心大学助教授小林良彰氏,;;(都外大助教授村山皓(ij氏 , に ご 配 慮 と貨[じな助,i
をJ l ' l
し)た。 90年8j j初句,神Ji大 学 の SPSSXU)最粕版によって, 90年 ま で の シ ス テ ム フ ァ イ ル がEXPORTコ マ ン ド を 使 っ て フ ロ ッ ピ ー に 簡 単 に 洛 せ る よ う に な った。従って,今後システムファイル •EBCDIC→MS DOS変 換 が1滉月となった。九 五
10・2 :¥09 (香法¥)()) -~18