1
第1節 はじめに
日本のプロ野球球団には読売ジャイアンツ・福岡ソフトバンクホークスに代表され る資金力のある球団と広島東洋カープ・横浜DeNA ベイスターズに代表される資金力 のない球団とが存在する。資金力の高い球団は高額の年俸を提示することで能力・実 績のある選手を揃えることができるが、資金力の低い球団は有力選手を揃えることが できない。そのため、資金力のある球団ほど勝率は高くなり、資金力の低い球団ほど 勝率が低くなると考えられる。しかし、現実には資金力の高い球団が下位に落ち込む ことや資金力の低い球団が上位に躍り出ることは頻繁に起こりうる。このことから、 私は資金力のある球団と資金力のない球団のそれぞれにとって好成績を収めるために 適切な選手雇用戦略は異なるものであるのではないか、また異なるとすればどのよう に異なるのかという疑問をもち、この研究に至った。 今回の研究では、2011 年シーズンから 2015 年シーズンの5年分のセントラルリー グ(以下セリーグ)とパシフィックリーグ(以下パリーグ)の各6球団合計12 球団を 一定の基準によって資金力の高い球団と資金力の低い球団とに分け、勝率に影響を与 えると思われる3つの要素について、回帰分析により、その影響の有無・大きさが資 金力の大小によって異なるのかどうかを調べる。勝率に影響を与えると思われる3つ 要素とは、球団に所属する全選手の年俸額の合計、球団に所属する全選手のプロ入り 後の年数の平均、ホームゲーム(自チームが本拠地とする球場における試合)におけ る平均観客動員数のことである。 分析前に3つの予想を立てた。1つ目は、「年俸額の合計」という要素が勝率に与え る影響は資金力の高い球団のほうが大きいという予想である。根拠は資金力のある球 団にとっては金にものを言わせた選手雇用戦略が成功したとき勝率が向上すると考え たことである。2つ目は、「プロ入り後の平均年数」という要素が勝率に与える影響は 資金力の低い球団のほうが大きいという予想である。根拠は資金力の低い球団が高い 勝率を収めるのは選手の育成に成功したときだと考えたことである。3つ目は、「ホー ムゲームでの平均観客動員数」という要素が勝率に与える影響は資金力の低い球団の ほうが高いという予想である。これは自分の感覚としてファンと選手の交流が密には かられているときに球団が好成績を収めることが多いということがあったことからそ う考えた。 分析によって導き出された結果は次の通りである。年俸額の合計については、資金 力の高い球団では勝率に影響を与えるが、資金力の低い球団では影響を与えないとい うことがわかった。プロ入り後の平均年数については、資金力の高い球団・低い球団 についても影響を与えないとわかった。ホームゲームでの平均観客動員数は資金力の 低い球団では勝率に影響を与えるが、資金力の高い球団では影響をあたえないことが わかった。これより、資金力の大小により勝率を向上させるための選手雇用戦略が異2 なるという結論を導くことができた。 ここで既存研究と本論文の違いを主張したい。既存の研究としては、宮本・田口 (2005)によって、年俸額の大小が勝率に与える影響について分析がなされているが、 本論文と年俸のデータについて違いがある。既存研究では年俸のデータを球団に所属 する全選手の平均年俸としているが、本論文では球団に所属する全選手の年俸の合計 額としている。各球団によって所属する選手数に違いがあるため、平均年俸額の大小 は球団の資金力の大小を正確には意味しない。球団の資金力をより正確に反映したデ ータを用いているという点に違いがある。 本論文の構成は以下の通りである。まず第2節において問題の背景となる情報を説 明する。次に第3節において、この分析における仮説について述べる。第4節では、 分析に用いるデータ、第5節では分析方法について説明する。第6節で分析結果をま とめ、第7節で分析結果の解釈を行い、第8節で分析における課題と問題点について 検討をしている。そして最後に第9節で改めて全体をまとめている。
第2節 問題の背景となる情報
2-1 日本のプロ野球について
日本のプロ野球はセントラルリーグとパシフィックリーグによって構成されており、 それぞれのリーグに6球団が所属している。3月下旬~10 月中旬までをシーズンとし ており、シーズンはおおよそ3つの時期に分けることができる。1つ目は基本的にリ ーグ内のチームとクライマックスシリーズ(後述)での優位なポジションをかけて戦 うレギュラーシーズン、2つ目は各リーグのレギュラーシーズンにおける1~3位チ ームが、レギュラーシーズンの成績によって有利・不利がある時点から再度リーグ優 勝チームを決めるために戦うクライマックスシリーズ、3つ目はクライマックスシリ ーズにおける各リーグのチャンピオン同士が日本一をかけて戦う日本シリーズである。 また、レギュラーシーズンは基本的は同一リーグ内のチームとの対戦であるが、途中 別のリーグのチームと試合をする交流戦が設けられている。2011 年~2014 年はレギ ュラーシーズン144 試合のうち交流戦は 24 試合あり、2015 年はレギュラーシーズン 143 試合のうち交流戦は 18 試合あった。2-2 球団の略称について
セリーグおよびパリーグに所属する各球団をそれぞれ表1の通りの略称で表記する。 表1 球団の略称3 セリーグ パリーグ 読売ジャイアンツ 巨人 福岡ソフトバンクホークス ソフトバンク 阪神タイガース 阪神 北海道日本ハムファイターズ 日本ハム 中日ドラゴンズ 中日 千葉ロッテマリーンズ ロッテ 広島東洋カープ 広島 埼玉西武ライオンズ 西武 横浜DeNA ベイスターズ 横浜 オリックス・バファローズ オリックス 東京ヤクルトスワローズ ヤクルト 東北楽天ゴールデンイーグルス 楽天
2-3 横浜
DeNA ベイスターズについて
横浜DeNA ベイスターズは 2011 年 12 月の親会社の変更により球団名を変更してい る。横浜という表記に関して2011 年は横浜ベイスターズを 2012 年以降は横浜 DeNA ベイスターズを指すものとする。2-4 ホームゲームについて
プロ野球の球団には、必ず自チームの本拠地となる野球場が決められている。そし て、プロ野球の試合は、ほとんどの場合、自チームの本拠地である野球場か、相手チ ームの本拠地である野球場にて実施される。そして、自チームの本拠地で開催される 試合をホームゲーム、相手チームの本拠地で開催される試合をビジターゲームと呼ぶ。 プロ野球の球団には、地域のつながりを大切にしながら運営している球団が多く、本 拠地周辺にはファンが多いので、ホームゲームではビジターゲームと比較してより多 くの自チームのファンが観戦・応援に訪れる。第3節 仮説
今回の分析で検証したいのは、資金力の有無によって適切な選手雇用の方針・球団 運営の方針が異なるという仮説である。そのために「資金力のある球団」と「資金力 のない球団」で勝利に影響を与える要因が異なるか、あるいは同じであったとしても、 その影響度合いが異なるかを検証する。勝利に影響を与える要素としては、球団に所 属する全選手の年俸総額、球団に所属する前選手のプロ入りからの平均年数、ホーム ゲームにおける平均観客動員数の3つについて分析をすることとした。 分析前に以下の3つの予想を立てた。1 つ目は、年俸総額という要素については資金 力のある球団のほうが勝利に与える影響が大きいという予想である。根拠は資金力の ある球団にとっては金にものを言わせた選手雇用戦略が成功したとき勝率が向上する と考えたことである。2つ目は、プロ入り後の平均年数という要素が勝率に与える影 響は資金力の低い球団のほうが大きいという予想である。根拠は資金力の低い球団が 高い勝率を収めるのは選手の育成に成功したときだと考えたことである。3つ目は、4 ホームゲームでの平均観客動員数という要素が勝率に与える影響は資金力の低い球団 のほうが高いという予想である。これは自分の感覚としてファンと選手の交流が密に はかられているときに球団が好成績を収めることが多いということがあったことから そう考えた。
第4節 データ
分析は以下のデータを用いて行った。12 球団の 2011 年~2015 年の各年度における 勝率、所属する全選手の年俸総額、所属する全選手のプロ入りからの平均年数、ホー ムゲームにおける1試合あたりの平均観客動員数。 勝率、観客動員数のデータは日本野球機構(NPB)の公式 HP より引用した。年俸 総額、プロ入り後の平均年数のデータは毎日新聞社が刊行している『プロ野球選手名 鑑 2011』~『プロ野球選手名鑑 2015』より引用したデータをもとに年俸総額につい ては球団ごとに所属選手全員の年俸を足し合わせたもの、プロ入り後の平均年数につ いては球団ごとに所属選手全員のプロ入り後年数を足し合わせたものをデータとした。第5節 分析方法
5-1 回帰分析とは
分析には回帰分析を用いた。回帰分析とは、統計的多変量解析の一つである。公益 社団法人日本オペレーションズ・リサーチ学会がインターネット上で運営する『OR 辞 書』によると、“目的変数といわれる1 つの変数と説明変数といわれる変数の間の関数 関係を求める方法”と定義されている。さらに“説明変数が 1 つである場合を単回帰 分析, 複数である場合を重回帰分析といい, 説明変数の関数を回帰式という”との説明 がなされている。今回の分析では重回帰分析の手法を用いる。5-2 ダミー変数とは
今回の分析ではダミー変数を用いた。ダミー変数とは、世界大百科事典第二版によ ると、“擬変数と訳されることもある。計量経済学では,生産定量的に測定された値を 示す実変数のほかに,数量的に表現できない定性的,属性的なものを分析する必要が ある。定性的,属性的な要因を計量経済モデルに取り入れる目的で作られた特別な変 数がダミー変数で,通常0 または 1 の値をとる。”と説明されている。今回の分析では、 年俸high ダミーと年俸 low ダミーという2つのダミー関数を用いる。年俸 high ダミ ーは球団に所属する全選手の年俸の合計額が他球団と比較して大きい場合、つまり球5 団に資金力がある場合に1、そうでない場合に0の値をとるダミー変数である。逆に 年俸low ダミーは年俸の総額が他球団よりも低い場合、つまり球団に資金力がない場 合に1、そうでない場合に0の値をとるダミー変数である。
5-3 何を分析するのか
仮設がデータによって支持されるかどうかを検証するために、目的変数を「勝率」 として、説明変数は3つの独立な変数である「球団に所属する全選手の年俸の合計額 (以下では『年俸』と表記する」、「球団に所属する全選手のプロ入り後の平均年数(以 下では『年数』と表記する」、「ホームゲーム1試合当たりの平均観客動員数(以下で は『観客動員数』と表記する)」にそれぞれ年俸high ダミーと年俸 low ダミーを掛け 合わせたもの、つまり年俸*年俸 high ダミー、年俸*年俸 low ダミー、年数*年俸 high ダミー、年数*年俸 low ダミー、観客動員数*年俸 high ダミー、観客動員数* 年俸low ダミーの6つとして、回帰式を立てた。回帰式については5-1でも説明し たが、説明変数の値が与えられたときに目的変数の値を推定する式のことである。回 帰式は以下となった。 (勝率)= (年俸high ダミー)*(年俸)*a1 +(年俸low ダミー)*(年俸)*a2 +(年俸high ダミー)*(年数)*a3 +(年俸low ダミー)*(年数)*a4 +(年俸high ダミー)*(観客動員数)*a5 +(年俸low ダミー)*(観客動員数)*a6+b5-4 回帰分析に用いたデータについて
以下では、分析に用いたデータについて目的変数、説明変数に分けて詳細な説明を する。「勝率」、「年俸」、「年数」、「観客動員数」のそれぞれのデータの出典等について は、第4節で説明したが、データはそのままの形で用いず、多少の調整を施したこと で使用した。調整の内容を中心に説明する。5-4-1 目的変数について
目的変数には勝率のデータを用いる。この章では、はじめに勝率の他に目的変数と して使うのに適当と思われた2つのデータについて、それを採用せず勝率のデータを 採用した理由を説明する。次に勝率のデータを分析で使うために施した調整について 説明する。 はじめに勝率以外の目的変数の候補を採用しなかった理由について説明する。勝率 の他にも、勝利数そのものやリーグ内の順位がチームのパフォーマンスを表す指標と6 なりうると考えられるが、それぞれ以下の理由から、比較的不適当と考えたので、チ ームのパフォーマンスを表す指標として勝率を採用した。 勝利数そのものについては以下の理由から不適当と考えた。勝利数を目的変数とす ると天候不順等による中止、および、引き分けを考慮する必要がある。試合中止・引 き分けの多いチームがあれば、勝利数の多寡は必ずしも順位の大小を意味しない。そ のことから勝利数を分析のデータとして使うためには、中止・引き分けの数を考慮に 入れて、調整をする必要がある。煩雑な手続きが必要となるにも関わらず、得られる データが、勝率のデータとほとんど同じものになるので、「勝利数」をデータとして採 用するのは不適当と考えた。 リーグ内の順位については、以下の理由から不適当と考えた。他チームと大きく差 を開けて優勝した場合と、僅差で優勝した場合とを同等に扱うのは単純化しすぎだと 考えられる。順位という変数が、パフォーマンスが発揮された具合をもとに決定され るものではあることは間違いないが、1位と2位、2位と3位、…、5位と6位の間 のパフォーマンスの差がすべて等しい場合など現実的にありえないことからもわかる ように、パフォーマンスの程度を正確に反映するものではない。今回の分析は、いく つかと要素がパフォーマンスに与える影響を与える影響の有無・大小について検討す るために実施する。その点から考えると、パフォーマンスの程度を正確に反映しない のは致命的であるので、採用しなかった。 つぎに、勝率のデータを分析に使うに当たり施した調整について説明する。下記の 数式によって勝率のデータの調整を実施した。 (調整後の勝率)=0.50* (n年におけるチームX の勝率/n年における X の所属するリーグの平均勝率) 上記の調整の意図は以下の通りである。交流戦では毎年パリーグがセリーグに対し て勝ち越すために、レギュラーシーズン全体での各リーグの平均勝率では、毎年セリ ーグは0.50 を下回り、パリーグは 0.50 を上回っている。しかし、どの程度パリーグ が勝ち越すかは、年度によって大きくばらつきがある。つまり、セリーグとパリーグ の実力の差が年度ごとに大きく変動するのである。パリーグのチームの目線で考える と、n年度シーズンとn+1年度シーズンでリーグ内での競争力は同じでも、n年度 とn+1年度で、セ・パ両リーグの実力差が大きく変動したとすると、そのチームの n年度とn+1年度の勝率は大きく異なるものとなってしまう。セ・パ両リーグの実 力差の変動という要素を排除するために、リーグ平均の勝率を0.50 とした場合の勝率 に、実際の勝率を変換する。 上記の調整を実施したところ、60 個のサンプル(12 球団*5 カ年)について、平均 値:0.50,最小値:0.351,最大値:0.640 となった。
7
5-4-2 説明変数について
以下では、「年俸」・「年数」・「観客動員数」の3つの独立変数,年俸high と年俸 low の2つのダミー変数,および3つの独立変数とダミー変数をそれぞれ掛け合わせるこ とによって作り出した説明変数について説明する。3つの独立変数については、それ を説明変数に加えた狙いと、データを分析のためにどのように調整したかについて説 明する。2つのダミー変数については、どのような基準で年俸high と年俸 low の線引 きをしたかということを中心に説明する。独立変数とダミー変数を掛け合わせること によって作り出した説明変数については、どのような狙いをもって、その操作を実施 したのかについて説明する。5-4-2-1 年俸
年俸のデータはそのまま使うのではなく、その年のリーグ平均の合計年俸額から各 チームの合計年俸額がどれだけ乖離しているかをデータとした。具体的な処理として は以下の数式にデータを当てはめることにより算出した。 (「年俸総額」-「リーグ平均年俸総額」)/「リーグ平均年俸総額」 ※ただし、「年俸総額」はn年におけるチームX に所属する全選手の年俸の合計額 リーグ平均年俸総額はn年におけるX の所属するリーグ6球団の年俸合計額の 平均を指す 調整の意図は2つある。以下においてその意図を説明する。第一は、外部環境の変 化による年度ごとの年俸のベース金額の変動の排除である。ここでは、外部環境を1 つの球団の経営努力では変えることができないプロ野球産業全体の置かれた環境と定 義する。具体的には、日本国の経済状況の変化,プロ野球産業全体の隆盛・衰勢が外 部環境の変化に当たる。外部環境が変化することで乖離を見る際の基準となる平均の 年俸額が変化する。外部環境の与える影響を排除して、年俸の多寡を見るために、各 年度において平均に対して、どれだけ乖離があるのか、つまり高くなっているのか、 低くなっているのかを「年俸」の独立変数とした。 第二は、リーグごとにそれぞれのリーグ平均と比較したことである。リーグで分け ずに12 球団の平均からの乖離を「年俸」を表す変数とした場合、目的変数(「勝率」) はリーグ内の他球団との関係によって決まっているにも関わらず、説明変数が12 球団 の平均からの乖離で決まっていることとなり、分析が不正確になる。具体的には、5 年間のリーグ内6球団の平均年俸総額をセリーグとパリーグで比較したとき、セリー グの平均年俸総額のほうが、パリーグのそれよりも、平均で2億円高い。そうすると、8 「年俸」を表す変数は、セリーグのほうが、パリーグよりも全体的に高くなる。その 結果、仮に「年俸」の大きさが勝利数に対して、ポジティブな影響を与えるとした場 合、セリーグでは、説明変数につく係数(上記の回帰式における a1a2)の値が、セリ ーグでは実際よりも低く、パリーグでは実際よりも高くなってしまう。このような事 態が発生するため、乖離を見る際の基準となる平均を12 球団での平均とすることは、 説明変数が目的変数に与える影響を正確に把握することができないので不適当である。
5-4-2-2 年数
年数のデータもそのまま使うのではなく、「年俸」と同様に、各チームの全選手のプ ロ入り後平均年数をリーグ内6球団で平均したものから、各チームの合計年数がどれ だけ乖離しているかをデータとした。具体的な処理としては以下の数式にデータを当 てはめることにより算出した。 (「プロ入り後年数平均」-「リーグ平均・プロ入り後年数平均」) /「リーグ平均・プロ入り後年数平均」 ※ただし、「プロ入り後年数平均」はn年におけるチームX に所属する全選手の プロ入り後の年数の平均値、「リーグ平均・プロ入り後年数平均」とはn年にお けるX の所属するリーグ6球団にとっての「プロ入り後年数平均」の平均であ る 調整の意図は2つある。以下においてその意図を説明する。第一は、プロ野球選手 の平均プロ入り後年数の低下の影響を排除するためである。セリーグでは 2011 年に 10.19 年であった全選手のプロ入りからの年数の平均が、2015 年には 6.39 年となって いる。この傾向はパリーグにおいても同様である。年度によって平均年齢が大きく変 動するためその年度におけるリーグ平均からの乖離を「年数」の変数とした。 第二はリーグごとにそれぞれのリーグの平均と比較したことである。「年俸」と同様 に目的変数に合わせて、説明変数でも12 球団の平均に対しての乖離ではなくリーグ内 6球団の平均に対しての乖離を年数のデータとした。5-4-2-3 観客動員数
観客動員数のデータもそのまま使うのではなく、「年俸」・「年数」と同様に、リーグ 内6球団のホームゲーム1試合当たりの観客動員数の平均から、各チームのホームゲ ーム1試合当たりの観客動員数がどれだけ乖離しているかをデータとした。具体的な 処理としては以下の数式にデータを当てはめることにより算出した。9 (「ホームゲームでの平均観客動員数」-「リーグ平均・ホームゲームでの平均観客動員数」) /「リーグ平均・ホームゲームでの平均観客動員数」 調整の意図は以下の2点である。第一は、プロ野球の人気の変動による影響を排除 するためである。5-3-2-1で「年俸」のデータを外部環境の変化による影響を 排除するように調整したが、狙いは「観客動員数」についても同様である。プロ野球 の人気が変動すれば、リーグ平均の観客動員数が変化すると考えられる。各年度にお いてその時の平均に対して、どれだけの乖離があるのかが肝心であるので、「観客動員 数」についても乖離を見る際の基準となる平均は2011 年から 2015 年の5年分の平均 ではなく、それぞれの年の平均とした。 第二は、リーグごとにそれぞれのリーグの平均と比較したことである。「年俸」と同 様に目的変数に合わせて、説明変数でも12 球団の平均に対しての乖離ではなくリーグ 内6球団の平均に対しての乖離を年数のデータとした。
5-4-2-4 ダミー変数
分析に用いたダミー変数について説明する。今回の分析では、「年俸high ダミー」 と「年俸low ダミー」という2つのダミー変数を用いる。ダミー変数については、5 -2で説明した通りである。年俸high ダミーは年俸総額の高い球団、つまり資金力の ある球団のある球団である場合1の値をとり、年俸総額の低い球団、つまり資金力の ない球団の場合0の値をとる。逆に年俸low ダミーは、資金力の低い球団である場合 に1の値をとり、年俸の高い球団の場合0の値をとる。 年俸high と年俸 low の線引きであるが、以下の2つの条件を満たしている球団を年 俸high、そうでない球団を年俸 low とした。1つ目の条件は、5年間の年俸総額の平 均が、リーグ平均のそれを上回っていること、2つ目の条件は、5 年間の間に年俸総額 がリーグ平均のそれを下回ったことがないことである。上記の条件によって、巨人・ 阪神・ソフトバンクを「年俸high」の球団、それ以外の 12 球団を「年俸 low」の球団 とした。中日は前者の条件は満たしていたものの、後者の条件を満たしていなかった。 それ以外の8球団は前者・後者いずれの条件も満たしていなかった。ダミー変数を分 析に用いた意図については次章で説明する。5-4-2-5 独立変数とダミー変数を掛け合わせて作った説明変数について
説明変数は、「年俸」,「年数」,「観客動員数」を表す3つの独立変数と、「年俸high ダミー」,「年俸low ダミー」を掛け合わせて6つ設けた。年俸 high 球団と年俸 low 球 団のそれぞれについて、3つの独立変数を説明変数とする回帰式を立てて、それぞれ 分析することと意味としては同じであるが、1つの回帰式で同時に年俸high 球団と年 俸low 球団の分析を実施するため、独立変数にダミー変数を掛け合わせるという操作10 を実施した。
年俸high 球団の場合、年俸 low ダミーが0の値をとる。そのため、回帰式において、 「年俸low ダミー*年俸」、「年俸low ダミー*年数」、「年俸low ダミー*観客動員数」 の3つの説明変数の値が0となる。また、このとき年俸high ダミーは1の値をとるの で、回帰式は、以下の通りとなる。
(勝率)=(年俸)*a1+(年数)*a3+*(観客動員数)*a5+b
年俸low 球団の場合は逆に「年俸 high ダミー*年俸」、「年俸 high ダミー*年数」、 「年俸high ダミー*観客動員数」の3つの説明変数の値が0となり、年俸 low ダミー は1の値をとるが、回帰式は上記と同様の形になる。1つの回帰式で年俸high 球団と 年俸low 球団について同時に分析を実施したのは、サンプル数を増やすことが目的で ある。
5-5 どのような結果がでれば仮説は検証されるのか
回帰式を推定した結果、どのような結果がでれば仮説が検証できるのか説明する。 “年俸総額の大小つまり球団の資金力の有無によって勝利に影響を与える要素が異な る、あるいは同じであってもその影響度合いに差がある”という仮説が検証されるた めには、以下の2通りの結果のうちいずれか、あるいはいずれもが実現している必要 がある。1つ目は、説明変数「(年俸 high ダミー)*〇〇」と「説明変数(年俸 low ダミー)*△△」の2つの説明変数について、いずれもが目的変数に与える影響が統 計的に有意と判定され、そのうえで影響度合いが異なる、つまり係数であるa1(3,5),a2(4,6) の大きさに差がある場合である。2つ目は、「説明変数(年俸 high ダミー)*〇〇」 と「説明変数(年俸low ダミー)*△△」の2つの説明変数について、一方は目的変 数に与える影響が統計的に有意と判定され、一方は統計的に有意と判定されない場合 である。なお、〇〇と△△はそれぞれ、「年俸」、「年数」、「観客動員数」の3つの独立 変数のうちのいずれかを意味する。第6節 分析結果
以下では分析した結果導き出した回帰式と、それについての解釈をしていく。5- 3で述べた回帰式は以下のとおりである。 (勝率)= (年俸high ダミー)*(年俸)*a1 +(年俸low ダミー)*(年俸)*a211 +(年俸high ダミー)*(年数)*a3 +(年俸low ダミー)*(年数)*a4 +(年俸high ダミー)*(観客動員数)*a5 +(年俸low ダミー)*(観客動員数)*a6+b この回帰式を推定したところ、表2の推定結果が導かれた。 表2 回帰分析の結果 係数 標準誤差 t P-値 (年俸high ダミー)*(年俸) 0.132738 0.085425 1.55386 0.126169 (年俸low ダミー)*(年俸) 0.028633 0.073355 0.390339 0.69785 (年俸high ダミー)*(年数) -0.22475 0.254367 -0.88355 0.38093 (年俸low ダミー)*(年数) 0.163139 0.18354 0.888845 0.378103 (年俸high ダミー)*(観客動員数) 0.010372 0.081869 0.126692 0.899664 (年俸low ダミー)*(観客動員数) 0.13106 0.061317 2.137402 0.037197 表2の結果から回帰分析の結果は以下の式で表される。 (勝率)= 0.132738*(年俸high ダミー)*(年俸) +0.028633(年俸low ダミー)*(年俸) -0.22475(年俸high ダミー)*(年数) +0.163139(年俸low ダミー)*(年数) +0.010372(年俸high ダミー)*(観客動員数) +0.13106(年俸low ダミー)*(観客動員数)+0.50325
6-1 有意水準
5%における分析
有意水準 5%では、t 値の絶対値が 1.97976 より大きい時に帰無仮説が棄却さ れ、説明変数である各変数が目的変数である勝率に影響を与えているということにな る。よって表2より有意水準 5%において試合の勝敗に影響を及ぼしている変数は、 「(年俸low ダミー)*(観客動員数)」の1つだけである。 有意水準5%では、目的変数に影響を与えているといえる説明変数が「(年俸 low ダ ミー)*(観客動員数)」の1つだけであり、「(年俸 high ダミー)*〇〇」の説明変 数が目的変数に与える影響については統計的に有意といえないという結果となった。 「年俸high ダミー」を掛け合わせて作成した説明変数と「年俸 low ダミー」を掛け合 わせて作成した説明変数のうち、それぞれ1つ以上の説明変数が目的変数に影響を与12 えることが、仮説が検証されるための必要条件であるが、このとき「年俸high ダミー」 を掛け合わせることで作成した説明変数のなかで、t値の絶対値が1.97976 より大き いもの、つまり有意水準 5%において統計的に有意といえる説明変数はない。つまり、 有意水準5%において仮説は検証されなかった。
6-2 有意水準
10%における分析
次に、有意水準 を 10%にして分析を実施した。有意水準 10%での分析であるが、 回帰式も推定結果も有意水準が5%の場合と同様である。 有意水準が 5%の場合と異な る部分は、帰無仮説を棄却するかどうかの判断をする時の t 値の基準である。有意水 準5%の場合は、t 値の絶対値が 1.97976 より大きい時に帰無仮説を棄却された。つ まり説明変数が目的変数である勝率に影響を与えていないということであった。これ に対して有意水準 10%の場合は、t 値の絶対値が 1.65754 より大きい時に帰無仮説 を棄却することになる。表2を見ると、t値の絶対値が1.65754 を超えている説明変 数は、有意水準が5%のときと同様に「(年俸 low ダミー)*(観客動員数)」の1つだ けであった。つまり有意水準を10%としても仮説は検証されなかった。6-3 相関係数
5-1,5-2において、「(年俸low ダミー)*(観客動員数)」以外の5つの説明 変数が目的変数に与える影響が統計的に有意といえなかったが、その原因として説明 変数同士の相関が強かったことが考えられる。説明変数同士の相関度合いを調べるた めに相関係数を求めたところ表3の通りの結果となった。 相関係数とは、変数同士の類似性を調べるためのものである。列と行のぶつかると ころの値が、その2 変数の関係性を表す数値である。-1 から 1 の間の値をとり、1 に 近ければ近いほど「正の相関」、反対に-1 に近ければ近いほど「負の相関」があると いい、0 は相関が ない、つまり何も関係がないことを示す。 表3 相関係数 ① ② ③ ④ ⑤ ⑥ ① 1 ② 0.32413 1 ③ -0.2258 -0.03542 1 ④ -0.01821 0.364081 0.001991 1 ⑤ 0.873126 0.371239 -0.26675 -0.02086 1 ⑥ 0.348055 0.594424 -0.03804 0.271579 0.398642 1 ※ただし、①~⑥の示す説明変数は以下の通り13 ①:(年俸high ダミー)*(年俸) ②:(年俸low ダミー)*(年俸) ③:(年俸high ダミー)*(年数) ④:(年俸low ダミー)*(年数) ⑤:(年俸high ダミー)*(観客動員数) ⑥:(年俸low ダミー)*(観客動員数) 表3より①の説明変数、つまり「(年俸 high ダミー)*(年俸)」と⑤の説明変数、 つまり「(年俸high ダミー)*(観客動員数)」の相関が 0.873126 と非常に高いことが 読み取れる。
6-4 説明変数を1つ減らして回帰分析
表3より2つの説明変数、「(年俸high ダミー)*(年俸)」、「(年俸 high ダミー) *(観客動員数)」の相関が非常に高いことが示された。これより、第6節のはじめに 挙げた回帰式を推定した結果、目的変数に影響を与えることが統計的に有意な説明変 数が6つのうち、1つしかなかったことは、説明変数同士の相関が強く、互いの効果 を薄めあっていたことが原因だと考えられる。言い換えると、同じような意味をもつ 変数を複数使っていたことで、多重共線性の問題が発生していたといえる。より正確 な分析結果を得るため、同じような意味をもつ説明変数(「(年俸high ダミー)*(年 俸)」と「(年俸high ダミー)*(観客動員数)」)のうち、1つを回帰式の説明変数か ら外して再度、分析を実施する。 「(年俸high ダミー)*(年俸)」と「(年俸 high ダミー)*(観客動員数)」の2 つの説明変数のうち、「(年俸 high ダミー)*(観客動員数)」を説明変数から外すこ ととした。その理由は以下の2点である。1点目は、目的変数に与える影響の大きさ である。表2より、「(年俸high ダミー)*(年俸)」の係数は 0.132738、「(年俸 high ダミー)*(観客動員数)」の係数は0.010372 である。「(年俸high ダミー)*(年俸)」 の係数が 0.132738 であることは、球団に在籍する選手の年俸総額がリーグ平均のそれより も 10%高くなるごとに勝率が 1.32%ずつ上昇することを意味する。一方、「(年俸high ダミー) *(観客動員数)」の係数が0.010372 であることは、ホームゲームにおける年間観客 動員数の平均がリーグ平均のそれよりも 10%高くなるごとに勝率が 0.1%ずつ上昇す ることを意味する。また、「年俸」,「観客動員数」ともにリーグ平均からの乖離は±40% 程度(つまり平均のおよそ60%~140%の範囲の値におさまる)である。これより、「(年 俸high ダミー)*(年俸)」のほうが「(年俸 high ダミー)*(観客動員数)」よりも、 説明変数の変化が目的変数の変化に与える影響が大きいため、有効性という観点から 「(年俸high ダミー)*(観客動員数)」を説明変数から外すのが適当と考えた。 2点目は、t値の大きさである。表2より「(年俸high ダミー)*(観客動員数)」14 のt値は1.553859 であった。一方、「(年俸 high ダミー)*(観客動員数)」のt値は 0.126691 であった。また、p値はそれぞれ 0.126169 ,0.899663 となった。これは それぞれ12.6% ,89.3%の確率で説明変数が目的変数に与える影響が誤差の範囲内で あることを意味する。これより、正確性という観点でも「(年俸 high ダミー)*(観 客動員数)」を説明変数から外すのが適当と考えた。 「(年俸high ダミー)*(観客動員数)」を説明変数から外して回帰式を立てると以 下のようになった。 (勝率)= (年俸high ダミー)*(年俸)*a1 +(年俸low ダミー)*(年俸)*a2 +(年俸high ダミー)*(年数)*a3 +(年俸low ダミー)*(年数)*a4 +(年俸low ダミー)*(観客動員数)*a5+b この回帰式を推定したところ、表4の結果が得られた。 表4 回帰分析の結果 係数 標準誤差 t P-値 (年俸high ダミー)*(年俸) 0.141785 0.04646 3.05174 0.003525 (年俸low ダミー)*(年俸) 0.029835 0.072074 0.41395 0.68055 (年俸high ダミー)*(年数) -0.23008 0.248559 -0.92567 0.358737 (年俸low ダミー)*(年数) 0.160476 0.180664 0.888257 0.378342 (年俸low ダミー)*(観客動員数) 0.132176 0.060126 2.198311 0.032233 表4の結果から回帰分析の結果は以下の式で表される。 (勝率)= 0.141785 *(年俸high ダミー)*(年俸) +0.029835 *(年俸low ダミー)*(年俸) -0.23008 *(年俸high ダミー)*(年数) +0.160476 *(年俸low ダミー)*(年数) +0.132176 *(年俸low ダミー)*(観客動員数)+0.503257 6-1,6-2と同様に有意水準5%と有意水準 10%で分析をする。有意水準が 5% の時、t値の絶対値が1.97976 を超えるかp値が 0.05 を下回れば、その説明変数が目 的変数に与える影響が統計的に有意であるといえる。また有意水準が 10%のとき、t 値の絶対値が1.65754 を超えるか、p値が 0.1 を下回れば、その説明変数が目的変数
15 に与える影響が統計的に有意であるといえる。 有意水準が 5%のとき、目的変数に与える影響が統計的に有意といえる説明変数は、 表4より、「(年俸high ダミー)*(年俸)」と「(年俸 low ダミー)*(観客動員数)」 の2つである。また、有意水準を10%としても目的変数に与える影響が有意といえる 説明変数は有意水準が5%のときと同様、「(年俸 high ダミー)*(年俸)」と「(年俸 low ダミー)*(観客動員数)」の2つであった。 6-4で立てた回帰式を推定した結果、得られた式について「切片」,「(年俸 high ダミー)*(年俸)」,「(年俸low ダミー)*(観客動員数)」に分けて説明をする。
6-5 切片
6-4より、回帰式を推定した結果得られた式について、その切片の値は 0.503257 で ある。これは他の全ての説明変数の値が0のとき、つまり「年俸」,「年数」,「観客動員数」の 3つの変数で平均からの乖離がいずれも0、すなわち平均と一致しているときに、目的変数 である勝率のとる値が、0.503257 となることを表す。つまり、「年俸」,「年数」,「観客動員数」 のいずれもがリーグ内の平均と一致した場合、勝率が 50.3%と 50%に非常に近い値をとるとい うことがいえる。6-6 (年俸
high ダミー)*(年俸)
6-4より、係数は0.141784 となった。この係数の示す意味について考える。係数 が0.141784 ということは、説明変数が 0.1 増加したときに、被説明変数が 0.0141 増 加することを意味する。5年間の平均年俸総額はセリーグ 29.4 億円、パリーグ 27.1 億円である。説明変数の値が 0.1 上昇することは年俸総額がリーグ平均のそれよりも 10%上昇することを意味するので、セリーグでは 2.94 億円、パリーグでは 2.71 億円 の年俸総額の上昇を意味する。つまり、この説明変数の係数が意味するところは、セ リーグでは平均2.94 億円,パリーグでは平均 2.71 億円年俸総額が上昇するごとに、 リーグ内の他球団と比較した勝率が1.41%上昇するということである。6-7 (年俸
low ダミー)*(観客動員数)
6-4より、係数は0.12176 となった。この係数の示す意味について考える。係数 が0.12176 ということは、説明変数が 0.1 増加したときに被説明変数が 0.12176 増加 することを意味する。5年間の平均観客動員数は、セリーグ 2.8 万人,パリーグ 2.3 万人である。説明変数の値は 0.1 増加することは観客動員数が、リーグ平均のそれよ りも 10%増加することを意味する。つまり、セリーグの場合 2800 人の観客動員数の 増加,パリーグの場合2300 人の観客動員数の増加を意味する。つまり、この説明変数 の係数が意味するところは、セリーグでは2800 人,パリーグでは 2300 人観客動員数 が増加するごとに、リーグ内の他球団と比較した勝率が 1.21%上昇することを意味す16 る。
第7節 結果の解釈
6つの説明変数について、回帰式を推定した結果をもとに解釈をしていく。なお、 その際、分析前に立てた予想と比較しながら進めていくこととする。それらの変数を、 目的変数を説明する可能性のあるものとして、説明変数に採用した理由については、 第3節の仮説において述べているので、ここでは省略する。なお、ここからは、「(年 俸high ダミー)*(年俸)と(年俸 low ダミー)*(年俸)」,「(年俸 high ダミー) *(年数)と(年俸low ダミー)*(年数)」,「(年俸 high ダミー)*(観客動員数) と(年俸low ダミー)*(観客動員数)」に分けて説明をしていく。7-1 (年俸
high ダミー)*(年俸)と(年俸 low ダミー)*(年俸)について
分析前の時点では、資金力のある球団のほうが年俸総額の勝利に与える影響は大き いという予想を立てた。それはすなわち、変数「(年俸high ダミー)*(年俸)」のほ うが変数「(年俸 low ダミー)*(年俸)」よりも目的変数である勝率に与える影響が 大きいということである。予想の根拠は資金力のある球団にとっては金にものを言わ せた選手雇用戦略が成功したとき勝率が向上すると考えたことである。 分析の結果、変数「(年俸high ダミー)*(年俸)」が目的変数に与える影響は統計 的に有意といえたが、変数「(年俸 low ダミー)*(年俸)」が目的変数に与える影響 は、68%の確率で誤差の範囲内であり統計的に有意であるといえなかった。このこと から、資金力のある球団は、年俸総額の増加は勝率の向上を意味するが、資金力の低 い球団にとっては年俸総額の増加は勝率に影響を与えると言えないという結論を導く ことができる。 年俸総額の大小、つまり球団の資金力の有無によって、年俸総額が勝率に与える影 響が異なる理由について以下で考える。資金力のある球団で年俸総額が勝率に影響を 与える理由と、資金力のない球団で年俸総額が勝率に影響を与えるといえない理由は、 それぞれ以下の通りであると考えられる。 資金力のある球団は年俸の高い選手を大人数雇用することができる。年俸の高い選 手とは高い確率で活躍することが期待される選手である。高い確率で活躍することが 期待できる選手を揃えれば揃えるほどに、安定して試合に勝ち続けることができると 考えられるので、資金力のある球団では年俸総額が勝率に与える影響と考えられる。 一方、資金力のない球団は年俸の高い選手を大人数雇用することはできない。その ため、年俸の低い選手、つまり高い確率で活躍が期待される選手を揃えることができ ない。活躍するかどうかという点で不確実性の高い選手が多いという点から、年俸総17 額の多寡が勝率に与える影響があまりないと考えられる。
7-2 「
(年俸
high ダミー)*(年数)と(年俸 low ダミー)*(年数)」について
分析前の時点では、資金力のない球団のほうが平均年数の勝利に与える影響は大き いという予想を立てた。それはすなわち、変数「(年俸 low ダミー)*(年数)」のほ うが変数「(年俸high ダミー)*(年数)」よりも目的変数である勝率に与える影響が 大きいということである。予想の根拠は資金力の低い球団が高い勝率を収めるのは選 手の育成に成功したときだと考え、育成には時間がかかることから、球団に育成され た選手が多いほど、平均年数は上がると考えたことである。 分析の結果、変数「(年俸high ダミー)*(年数)」が目的変数に与える影響は 35.8% の確率で誤差の範囲内であり、変数「(年俸 low ダミー)*(年数)」が目的変数に与 える影響も 37.8%の確率で誤差の範囲内となった。これより、平均年数については、 年俸総額の大小、つまり球団の資金力の有無に関わらず、勝率に与える影響は統計的 にはあるといえない。 年数が勝率に影響を与えない理由としては、予想における根拠でロジックが成立し ていなかったことで仮説そのものが論理的におかしなものになっていたことが考えら れる。予想時点では、「資金力のない球団が高い勝率を収めるのは選手育成に成功して いたとき」→「選手育成には時間がかかる」→「選手育成に成功したとき選手の平均 年数は長くなっている」というロジックを立てたが、1つ目の矢印と2つ目の矢印が それぞれ必ずしも前後の関係性を結びつけているものとは限らなかった。 1 つ目の矢印についてであるが、選手がドラフト会議やトライアウトを経て球団に入 団してから、何年目で活躍できる選手となるかという点で、活躍するまでに10 年かか る選手がいる一方で、1年目や2年目から活躍する選手もいるので必ずしも選手育成 に時間がかかるとは限らない。2つ目の矢印についてであるが、選手育成に時間がか かったとしても、それが必ずしも選手の平均年齢を高くすることにはつながらない。 球団の間で人材の流動性がなければ、つまり、2球団の間で選手同士(あるいは選手 と金銭)を交換するトレードや、プロ入り後原則8年を経て得られる希望球団と入団 交渉をする権利を得られるFA といった制度がなければ、選手育成に時間がかかること は、選手育成に成功したとき選手の平均年数が高くなることを意味するが、人材の流 動性があるため、時間をかけて育成した選手が他球団に流出してしまうということも 往々にしてある。7-3 「
(年俸
high ダミー)*(観客動員数)」と
「
(年俸
low ダミー)*(観客動員数)」について
分析前の時点では、資金力のない球団のほうが観客動員数の勝利に与える影響は大 きいという予想を立てた。それはすなわち、変数「(年俸low ダミー)*(観客動員数)」18 のほうが変数「(年俸high ダミー)*(観客動員数)」よりも目的変数である勝率に与 える影響が大きいということである。予想の根拠は、資金力の低い球団(つまり、巨 人,阪神,ソフトバンク以外の球団)は、チームを応援してくれるファンに勢いのあ るときに好成績を収めることが多いということが自分自身の感覚としてあったことで ある。 分析の結果、変数「(年俸low ダミー)*(観客動員数)」が目的変数に与える影響 は統計的に有意といえた。一方、変数「(年俸high ダミー)*(観客動員数)」は、変 数「(年俸high ダミー)*(年俸)」との相関が非常に強かったため、説明変数を5つ に減らして実施した 2 回目の回帰分析では、説明変数から外した。ちなみに説明変数 として含まれていた1回目の回帰分析では、89.9%の確率で誤差の範囲内という結果と なった。このことから、資金力の低い球団にとっては観客動員数の増加は勝率に影響 を与えるが、資金力の高い球団にとっては観客動員数の増加は勝率に影響を与えない という結論を導くことができる。 観客動員数のリーグ平均からの乖離が、勝率に与える影響が、球団の資金力の有無 によって異なる理由について考える。そもそも資金力のある球団は観客動員数が資金 力のない球団と比べて多い。それは、観客動員数の多さが球団の資金力の源泉となっ ているからである。表5が示すように、巨人・阪神・ソフトバンクの資金力のある3 球団は他球団と比べて、安定して多くの観客を動員できている。そのため、観客動員 数の多寡が勝率を説明しなかったと考えられる。一方、資金力のない9球団に関して は、表5が示すように5年間の間に観客動員数に大きな変化のあった球団が複数存在 する。 表5 ホームゲームにおける平均観客動員数(2011 年~2015 年) 資金力 球団 2015 年 2014 年 2013 年 2012 年 2011 年 5 カ年平 均 資金力 high 巨人 42270 41921 41781 40333 37736 40,808.20 阪神 39977 37355 38494 37886 40256 38,793.60 ソフトバン ク 35221 34284 33458 33993 31860 33,763.20 資金力 low 広島 29722 26455 21744 22079 21980 24,396.00 中日 28469 27790 27753 28896 29777 28,537.00 DeNA 25546 21730 19802 16194 15308 19,716.00 ヤクルト 23021 19983 19899 18371 18726 20,000.00 オリックス 24890 23663 19979 18482 19458 21,294.40 日本ハム 27211 26358 25773 25813 27644 26,559.80 ロッテ 18620 16999 17506 17211 18511 17,769.40
19 西武 22456 20811 22234 21195 22106 21,760.40 楽天 21467 20142 17793 16358 16225 18,397.00 資金力のない球団では、さらに観客動員数の変動が球団の勝率の変動と連動してい る。そのため観客動員数が勝率に影響を与えるという結果となったと考えられる。
第8節 分析における課題と問題点
今回の分析では、3つの独立変数「年俸」,「年数」,「観客動員数」と2つのダミー 変数「年俸high ダミー」,「年俸low ダミー」をそれぞれ掛け合わせて作成した6つの 変数を説明変数として、勝率を目的変数として回帰分析を行ったが、「年数」のデータ の取り方に改善が必要であると考えている。また、「観客動員数」についても説明変数 に含むのに慎重な検討が必要であったと考えている。以下においてそれぞれについて 説明をする。8-1 独立変数「年数」について
独立変数「年数」は、各球団について在籍する全選手の“プロ入りからの平均年数” がリーグ平均のそれと比較して、平均の何倍乖離しているかを表す変数である。この 独立変数を回帰式に説明変数として加えた意図は、資金力の低い球団が高い勝率を収 めるのは選手の育成に成功したときだという予想のもと、“選手の育成に成功した”と いう状況を数値で表現するためである。ここでは“選手の育成に成功した”という状 況が“「プロ入り後の平均年数」の値が大きい”ということに結びつくという想定があ ったが、この想定が誤りであった。どのように想定が誤っていたかについては7-2 で述べた通りである。 変数「年数」をどのように設定すればよかったか考えたい。そもそも球団が戦力を 増強するには「選手育成」と「選手補強」の2つの手段がある。資金力のない球団は、 高額な年俸を捻出できないことから後者の戦略で有力選手を獲得することがあまりで きない。そのため、後者の球団が戦力増強を図るには「選手育成」を成功させる必要 がある。その前提を踏まえたうえで、資金力のない球団が“選手育成に成功した”と き、どのような状況が発生しているのか、改めて考えたい。 資金力のある球団は有力選手をFA 等の手段によって「即戦力」を確保することで戦 力増強を図っている。一方、資金力のない球団は「即戦力」を確保することができな いので選手育成の成否が戦力増強の鍵となっている。そのため、一軍の試合で中心と なって戦っている選手の「その球団への在籍年数」は資金力のある球団は比較的短く、 資金力のない球団の場合、選手育成に成功している場合は長く、選手育成に失敗して20 いる場合は短くなっていると考えられる。このように、 “一軍の試合に中心的な選 手として出場している選手”を一定の基準によって選びだし、彼らの「球団への在籍 年数」を調べれば、資金力のない球団がいかに選手育成に成功したかを、よりよく反 映した変数を用いることができたと考えられる。
8-2 独立変数「観客動員数」について
独立変数「観客動員数」は、1年間のホームゲームにおける観客動員数の平均値が、 リーグ平均のそれから平均の何倍乖離しているかを表す関数である。今回の分析では、 「観客動員数」とダミー変数を掛け合わせて作成した変数を説明変数として目的変数 に与える影響を分析した。つまり、「観客動員数」が変動するという原因によって、「勝 率」が変動するという結果が生まれる、という因果関係を前提として分析を行った。 しかし、これは因果関係を逆に捉えていた可能性がある。つまり、「勝率」が変動する という原因によって、「観客動員数」が変動するという結果が生まれる、という因果関 係のほうがより正確であったということである。 「観客動員数」が増えることで、選手の士気があがったり、応援で試合の流れが変 わったりすることで「勝率」が上昇するという部分も全くないわけではないであろう が、逆の因果関係で考えるほうが自然である。例えば、「勝率」が上昇し、チームがよ く勝つようになれば、ファンの数が増えて「観客動員数」増えると考えられる。第9節 おわりに
今回の分析の目的は、日本のプロ野球の球団を対象として、資金力のある球団と資 金力のない球団の間で勝利の収めるための適切な球団戦略、特に選手雇用戦略が異な るのかどうかを調べることであった。球団戦略によって決定づけられるもの、あるい は球団戦略の影響を大きく受けて決定づけられるような変数で、球団の勝利に影響を 与える要素と思われるもののデータを分析に用いた。具体的には、「球団に所属する全 選手の年俸総額がリーグ平均のそれと比較して平均の何倍乖離しているか」、「球団に 所属する全選手のプロ入りからの平均年数がリーグ平均のそれと比較して平均の何倍 乖離しているか」、「ホームゲームにおける1年間の平均観客動員数がリーグ平均のそ れと比較して平均の何倍乖離しているか」の3つのデータを使って分析を実施した。 また球団の勝利を表す変数のデータには、勝率を用いた。目的変数を「勝率」、説明変 数を3つの独立変数(「年俸」、「年数」、「観客動員数」)と2つのダミー変数(「年俸 high ダミー」と「年俸 low ダミー」)それぞれ掛け合わせたものとして、回帰分析を 実施して、説明変数が目的変数に与える影響を分析した。 データについては、勝率、観客動員数のデータは日本野球機構(NPB)の公式 HP21 より引用した。年俸総額、プロ入り後の平均年数のデータは毎日新聞社が刊行してい る『プロ野球選手名鑑 2011』~『プロ野球選手名鑑 2015』より引用したデータをも とに年俸総額については球団ごとに所属選手全員の年俸を足し合わせたもの、プロ入 り後の平均年数については球団ごとに所属選手全員のプロ入り後年数を足し合わせた ものをデータとした。 分析をする前に3つの予想を立てた。1 つ目は、「年俸額の合計」という要素が勝率 に与える影響は資金力の高い球団のほうが大きいという予想である。2つ目は、「プロ 入り後の平均年数」という要素が勝率に与える影響は資金力の低い球団のほうが大き いという予想である。3つ目は、「ホームゲームでの平均観客動員数」という要素が勝 率に与える影響は資金力の低い球団のほうが高いという予想である。 分析の結果、以下の二通りの場合のいずれかの結果が出れば、仮説が検証される。 1つ目は、説明変数「(年俸high ダミー)*〇〇」と「説明変数(年俸 low ダミー) *〇〇」(ただし、〇〇はそれぞれ、「年俸」、「年数」、「観客動員数」の3つの独立変 数のうちのいずれかを意味する)の2つの説明変数について、いずれもが目的変数に 与える影響が統計的に有意と判定され、そのうえで影響度合いが異なる、つまりそれ ぞれの係数の大きさに差がある場合である。2つ目は、「説明変数(年俸high ダミー) *〇〇」と「説明変数(年俸low ダミー)*〇〇」の2つの説明変数について、一方 は目的変数に与える影響が統計的に有意と判定され、一方は統計的に有意と判定され ない場合である。 実際に6つの変数を説明変数として回帰分析を行った結果、目的変数に与える影響 が統計的に有意といえる水準にある説明変数は1つだけあった。そこで、説明変数同 士の相関が強いために、説明変数が目的変数に与える効果が薄くなっているという可 能性を考え、6つの説明変数について互いの相関係数を求めた。その結果、87.3%と非 常に高い相関をしている変数の組み合わせがあったので、2つの変数のうち、1つの 変数を説明変数から外して、説明変数を5つにして再度回帰分析を実施した。その結 果、目的変数に与える影響が統計的に有意な説明変数が2つ現れた。2つの説明変数 とは、「(年俸high ダミー)*(年俸)」と「説明変数(年俸 low ダミー)*(観客動 員数)」である。前者の説明変数と意味するところは、資金力のある球団では、セリー グでは2.94 億円,パリーグでは 2.71 億円年俸総額が上昇するごとに、リーグ内の他 球団と比較した勝率が 1.41%上昇するということである。後者の説明変数の意味する ところは、セリーグでは2800 人,パリーグでは 2300 人観客動員数が増加するごとに、 リーグ内の他球団と比較した勝率が1.21%上昇するということである。 分析結果を整理すると以下の通りである。「(年俸 high ダミー)*(年俸)」は目的 変数に影響を与えるが、「(年俸low ダミー)*(年俸)」は目的変数に影響を与えない。 「(年俸low ダミー)*(観客動員数)」は目的変数に影響を与えるが、「(年俸 high ダ ミー)*(観客動員数)」は目的変数に影響を与えない。「(年俸 high ダミー)*(年
22 数)」と「(年俸low ダミー)*(年数)」は、ともに目的変数に影響を与えない。この 分析結果より、資金力のある球団と資金力のない球団で勝利に与える要因が異なると いう仮説が検証された。具体的には、資金力のある球団は年俸総額の多寡が、資金力 のない球団は観客動員数の多寡が、勝率に影響を与えるということがわかった。 第8節では、分析における課題と問題点について述べた。特に独立変数「年数」の 表すデータを何にするかという点で課題があったことについて述べた。また、独立変 数「観客動員数」と目的変数「勝率」について現実とは逆の因果関係で関係性を捉え てしまった可能性があることも述べた。何を説明変数とするかという点でその根拠を 論理的に突き詰めて考えるということが不十分であったことが悔やまれる。