オートコール(IVR)方式による参院選情勢調査
大隈 慎吾・佐藤 航(毎日新聞社)
1 はじめに
RDD(Random Digit Dialing)による 従来型の固定電話調査は、対象者の応答率 低下やオペレータの人件費高騰によって実 施環境が悪化しつつある。2019 年に入って からはその傾向がより顕著となり、7月に 執行される参議院議員通常選挙(以下参院 選)では選挙区情勢調査で数万件の大規模 サンプルを回収する必要があるため悪影響 が懸念されていた。仮に携帯電話のRDD 調査で代替しても、対象者の応答率という 点では幾分ましになるものの、人件費高騰 という状況は変わらない上に対象地点(選 挙区)を事前に特定できないという難点が あった。そのため、毎日新聞社は参院選の選 挙区情勢調査において自動音声応答通話
(以下IVR:Interactive Voice Response) による調査(以下オートコール式調査)を 導入した。 オートコール式の情勢調査は、すでに政 党や選挙の立候補者により多数行われてい るとも言われているが、報道機関による調 査にも中谷(2017)や琉球新報(2018)の例 がある。ただし、これらは北海道や沖縄の地 域限定で行われたものであり、国政選挙に おける情勢調査のような全国規模の調査事 例ではなかった。また、オートコール式調査 は大量の架電数に比して回答率が低いため、 世論調査としての信頼性に欠けるのではな いかという疑問も呈されていた。 にもかかわらず、国内で初めて全国規模 のオートコール式情勢調査を導入したのは、 以下2点の要件を満たしたと考えたからで ある。 ・従来調査よりも実施コストが高くない ・従来調査より精度が低下しない 本稿では、毎日新聞社が実施したオート コール式参院選情勢調査の方法と調査結果 について説明するとともに、上記2つの要 件が実際に満たされたかについても明らか にする。
2 調査概要 オートコール式調査システムの仕組み オートコール式調査システムでは、RD D方式で作成した固定電話番号に対し、仮 想サーバがIP電話で自動架電を行う。こ の時、使用する複数回線をそれぞれ多チャ ネル化することにより、一度に膨大な量の 同時架電を実現することができる(図1)。 自前でこのシステムを構築しようとすれば 初期投資はそれなりにかかるものの、架電 に人を介することで発生する人件費が以後 一切不要となり、加えて、膨大な同時架電が 回答回収にかかる時間コストを劇的に引き 下げるため安価な調査が可能となる。 図1 オートコール式調査システム概要図 幸いなことに、今回の参院選に向けて情勢 調査の準備を進めていた時点で、すでに オートコール式調査システムを代行する調 査会社があったため委託した。委託費用は、 オペレータが架電する従来型の調査会社に 委託する場合に比べ、半額よりもさらに安 価であった。 架電に対して調査対象者が応答する(電 話に出る)と、IVR機構が動作を開始する。 あらかじめ録音された質問文と選択肢を読 み上げる音声が自動再生され、その際、各々 の選択肢に対応する電話機のプッシュボタ ンが指定される。対象者は音声に従って、自 分の意見に近い選択肢のボタン押すことで 回答が完了する。これを全問繰り返すこと で調査が完了し、仮想サーバの回答データ ベースに登録される。対象者が電話に出な い、または回答途中で電話を切っても、再架 電は行わない(掛け捨て)。 情勢調査の仕様 今回の参院選では、公示日前の6月 29 日 (土)~30 日(日)、公示日~翌日の7月4 日(木)~5日(金)、投開票日 1 週間前の 7 月 13 日(土)~14 日(日)の計3回情勢 調査を行った。 固定電話で接触する調査対象は、18 歳以 上の有権者がいる全国の世帯とした。選挙 区情勢調査における回収目標の標本サイズ は、選挙区ごとの改選数に応じ、改選数1を 500 件、改選数2を 750 件、改選数3または 4を 1,000 件、改選数6を 1,200 件とした 計 28,200 件を設定した。設問数は全7問で、 投票意思(投票に行くか行かないか)、投票 先(どの候補者に投票するか)、内閣支持(安 倍内閣を支持するか)、支持政党(普段支持 する政党)、性別、年代、世帯内有権者数(同 居する有権者の数)について質問した。投票
先の設問に関しては、候補者の読み上げ順 による順序効果を考慮し、第1回調査では、 全選挙区で読み上げ音声が降順・昇順の2 パターンでランダムに再生されるようにし た。しかし候補者が少数の選挙区では昇順 と降順で回答傾向に差が見られなかったた め、第2回調査以降はランダム再生を行う 対象を立候補者数が多い4選挙区のみに 絞った。回答を集計する際には、平成 27 年 国勢調査をもとに性・年代によるウエイト バック集計を行った。 実施時の経緯 オートコール式調査は、実施数日前に調 査会社に調査票と選挙区ごとの候補者リス トを渡し、自動再生用の音声を録音しても らう必要がある。しかし、公示前は立候補が 予想される顔ぶれが日々変わるためリスト が確定しない。そのため、第1回調査ではぎ りぎりまで立候補状況を見極める必要があ り、調査会社にリストを送付した以降のス ケジュールが過密となった。具体的には、6 月 27 日(木)のリスト送付後、録音と音声 データの確認に中1日しかかけることがで きなかった。第2回調査もリスト送付は 前々日(7月2日)だったが、送ったのは第 1回調査から変更があった差分のみなので 比較的余裕があった。第3回調査は公示日 後のため立候補者が確定しており、基本的 にリストの差し替えは発生しなかった。 第2回・第3回調査は、第1回調査で回収 した1日目午前中から夕方にかけてのサン プルに 10~40 代の回答者が極端に少なかっ たこと、同時架電システムの稼働状況にま だ余力があったことから、調査時間を1日 目は 17 時から 21 時まで、2日目は9時か ら 12 時までに短縮した。 以上についてまとめて表1に示す。 表1 情勢調査スケジュール 日付 内容 6/27(木) 政党・候補者データ渡し 6/29(土) 第 1 回調査(9:00~21:00) 6/30(日) 第 1 回調査(9:00~15:00) 7/ 2(火) 政党・候補者データ差分渡し 7/ 4(木) 参院選公示日 第 2 回調査(17:00~21:00) 7/ 5(金) 第 2 回調査(9:00~12:00) 7/13(土) 第 3 回調査(17:00~21:00) 7/14(日) 第 3 回調査(9:00~12:00) 7/21(日) 参院選投開票日 3 調査結果 サンプル回収の効率 第1回調査は計 28,478 件、第2回調査は 28,449 件、第3回調査は 29,259 件の回答を 得た。各回の時間毎の累積回収数は図2の 通りである。これを見ると、調査時間を短縮 した第2回・第3回調査でも、調査1日目で ほぼ目標回収数に達していることがわかる。 1日目は架電スピード(時間当たりの架電 数)を特に抑制することなく運用したので、 オートコール式調査の素の回収能力が発揮 されたと考えられる。2日目は回収目標の 標本サイズをあまり超過しないよう架電ス ピードを抑制した。
図2 累積回収数の推移 第1回調査については、開始直後に回収目 標に達してしまわないよう架電スピードを 終始抑制したため、累積の推移が直線的で ある。 しかし一方で、架電数に比した回収効率 は決して良くはなく、本調査の前後に実施 したオペレータ式のRDD固定・携帯電話 ミックス調査(サンプルサイズ 1,000 程度) に比べると、回収数を架電総数で割った比 率はおおむね 1/6~1/7 であった。 回答者の属性 回答者の属性に関して、性別と年代の集 計結果を図3・図4に示す。また、人口、有 権者、選挙投票者の集計結果もあわせて図 示する。なお、人口の集計は平成 27 年国勢 調査、有権者と投票者は今回の参院選後に 総務省が公表したデータをもとにしている。 図3 調査と各種統計の男女比率比較 図4 調査と各種統計の年代比率比較 図3から、回答者は女性より男性が多いと いう点で人口、有権者、投票者のいずれとも 異なるが、男女ともほぼ同水準という点で は共通している。一方、図4の回答者の年代 に関してはいずれの比較対象とも大きく異 なっており、60 代以上が全体の約8割を占 めるという極めて特異な分布となっている。 次に、回答者の地域的な偏りについても 検証する。ただし、選挙区(都道府県もしく は合区)単位では前述したように一定の回
収目標を設定したので人口、有権者、投票者 のいずれの分布とも一致しないのは当然で ある。そこで、選挙区内の人口分布に応じた サンプル構成になっているかを、平成 27 年 国勢調査の市区町村別世帯数と各選挙区に 割り当てた目標サンプル数をもとに想定さ れる市区町村別回収数を算出し、それが全 体に占める比率と、回答者全体に占める市 区町村別居住者の構成比率の比較を行った。 その結果が図5である。 図5 市区町村別回収数と世帯数の比較 図5から、回答者の地域的分布もおおむね 人口分布に近いことがわかる。 世論調査では、標本の代表性がある、すな わち国民(母集団)の縮図になっていないと 調査結果が歪むとされている。選挙情勢調 査については母集団が国民(人口)なのか、 有権者なのか、選挙の投票者なのかで議論 があるものの、世論調査と同様にランダム サンプリングを基礎に置く以上、標本の代 表性がある方が望ましいとされている。し かし、図3~5の結果からは、性別と地域分 布はともかく、回答者の年代構成に関して は標本の代表性が担保されているとは言い 難い。これは、母集団を人口、有権者、投票 者のいずれと考えても変わらない。年代分 布に関するこの偏りは、選挙結果の予測と いう意味での情勢調査結果を歪める、つま り予測と開票結果を乖離させるのではない かという危惧を生じさせる。以下では、それ が実際どうであったかを確認する。 回答者の意識 回答者の政治的意識を表す代表的な指標 は内閣支持率と政党支持率であろう。それ らに関し、本調査の前後に実施した従来型 調査(サンプルサイズ 1,000 程度のオペレー タ式RDD固定・携帯電話ミックス調査)と 比較した結果を図6・図7に示す。 図6 調査と従来型調査の内閣支持率比較
図7 調査と従来型調査の政党支持率比較 図6から、従来型調査に比べ安倍政権を「支 持しない」が多く、「関心がない」が少ない ことがわかる。図7からは、従来型調査より 立憲民主党の支持率が高く、無党派層が少 ないことがわかる。従来型調査の結果が歪 んでいない(母集団比率に近い)という保証 はないので、図6・図7の結果が即オート コール式調査の歪みを表しているわけでは ないが、同時に、危惧した通り年代構成の歪 みが悪影響を及ぼしている、という可能性 も排除できない。 情勢調査の第一の意義は、選挙結果を予 測することにあると言ってよい。では、その ような意味での予測精度は、オートコール 式調査の導入によってどう変化しただろう か。 まず、オートコール式の導入前後で精度 がどう変わったかをみる。具体的には、前回 参院選時(2016 年)に毎日新聞が実施した オペレータ式調査と、今回参院選でのオー トコール式調査に関して、立候補者ごとの 回答比率を横軸、選挙区得票率を縦軸とし、 散布図を作成した(図8・図9)。今回調査 は公示日から翌日に実施した第2回のみ掲 示しているのは、比較対象の前回調査が公 示日から翌日に実施した1回きりだったか らである。 図8 2016 年参院選情勢調査結果 図9 2019 年参院選情勢調査結果 散布図の性格上、45 度線の近傍に観測点が 密集するほど予測精度が高いことになるが、 図8・図9を見比べてもどちらがそうであ るか判然としない。念のため、立候補者ごと に開票結果との乖離の絶対値を積算してみ たが、前回と今回でほとんど違いはなかっ
た。 次に、今回の参院選で実施された他方式 の調査との比較を行う。ただし、毎日新聞は オートコール式以外の調査を今回実施しな かったので、比較対象は必然的に他紙の情 勢調査となる。しかし、毎日新聞も含め、新 聞は公職選挙法への配慮から紙面で立候補 者ごとの回答比率を公表しておらず、その 代わりに、記事中に登場する候補者の順番 と「優勢」「リード」「追う」「競り合う」と いった形容詞を付ける形で調査結果を表現 している。表現ぶりを解析することで、かろ うじてどの候補者を当選圏内と予測してい るのかが読み取れるので、それと実際に当 選した候補者との一致数を「的中議席数」と して精度の指標とした。その結果を図 10 に 示す。 図 10 各社調査との的中議席比較 紙面での表現ぶりは調査以外の取材結果も 加味されているので、図 10 は純粋な調査結 果(いわゆるナマ数字)の精度を表している わけではない。とはいえ、取材が加味される のは各社とも同様なので、仮に取材による 精度向上にあまり極端な差がないと考える と、唯一オートコール式で実施した毎日新 聞の調査は他方式の調査と精度の上でほぼ 遜色がなかった、ということになる。特に、 ほぼ同日に実施された3紙の中ではまさに 平均的な的中精度となった。 以上をまとめると、時系列的に垂直方向 の比較(前回の従来型調査との比較)分析で も、水平方向の比較(同時期の他方式調査と の比較)分析でも、オートコール調査の導入 によって選挙予測の精度が低下したという 証左は得られなかった。 しかし、回答者属性では年代に大きな偏 りが見られ、内閣支持率や政党支持率では 従来型調査の結果と傾向に差が見られたに もかかわらず、予測精度には影響が見られ なかったのは一体何故であろうか。 それについては、年齢によって投票傾向 にあまり差がなかったことが原因であった 可能性がある。図 11・表2は、第2回のオー トコール調査に関して、選挙区投票先の回 答率を、候補者が所属する政党ごとに集計 したものである。これらを見ると、自民党候 補者への投票率に年代差がほぼなく高水準 であること、立憲民主党への投票率は高齢 層になるほど高くなる傾向があるものの、 そもそも獲得議席数を左右するほど高水準 ではないこと、その他の政党はさらに低水 準なので選挙結果の大勢に影響しなかった であろうことがわかる。調査では立憲民主
党投票者が高齢層に偏っていたが、一方で 若年層は高齢層より未決層(「決めてない」 を選んだ回答者)が多いため、若年層による 実際の投票先は表2の分布通りでなかった 可能性も残る。一方、高齢の未決層は少ない ので、おおむね表2に近い分布であったと 予想される。 図 11 年代別投票先候補者政党(一部) 表2 年代別投票先候補者政党 ※ハイフンは無回答。n はサンプルサイズ 4 終わりに 冒頭において、今回参院選で初めてオー トコール式情勢調査を導入した理由を、従 来調査よりコスト(実施費用)が上昇せず、 予測精度が低下しないという感触が得られ たからだと述べた。コストについては上昇 しないどころか大幅に低下したことは2章 で述べた通りである。精度についても3章 で述べたように低下は見られなかったが、 もちろんこれは事後的な検証の結果である。 事前に導入を決定した際には、当然そのよ うなことはわからなかった。しかし、実査を 委託した調査会社から過去の国政選挙で実 施したオートコール実験調査の結果データ を提供されていたので、3章で紹介したよ うな分析が事前シミュレーションとして可 能であったことを付言しておく。 次期衆院選でオートコール調査を採用す る場合の課題としては、立候補者数が参院 選の3倍弱となるため、調査前の録音作業 が膨大になることなどが挙げられる。今回 の調査を踏まえ、これらの課題の解決策や、 より投票結果に近い結果が得られる方法を 模索していきたい。 文献 中谷 亮(2017)「オートコール方式による携帯 RDD 調査―北海道限定での試み―」『政策と調査』13: 15-22. 琉球新報「玉城、佐喜真氏が接戦 「基地問題」重 視 42% 知事選投票先未定多く」 2018 年 9 月 17 日 付朝刊