選択と集中に関するシミュレーション

(1)

選択と集中に関するシミュレーション

Simulation of Selection and Concentration

小柴等

(KOSHIBA, Hitoshi)1∗ 1_{文部科学省科学技術・学術政策研究所}_(NISTEP) Abstract: 予算等の資源を配分を行う際，一部に対して優先的・集中的に配分する“選択と集中”戦略が選択される場面は珍しくない．ここで，投資に対して見込める利益率の分布が“べき分布”をとり，かつ，見込める利益率の予測ができない場合には選択をせず，遍く対象に投資する方が全体としての利益が大きくなることが示されている[野田19]．ただし，予算等の資源は有限ではないため，たとえば申請があったものについてはすべて予算を支出するとした場合，予算が十分に確保できない可能性が高いほか，当初から利益が見込めない課題を乱発して自己の資源確保最大化を図るような行動も予想され，現実的には遍く対象に投資することは難しく，一定のフィルタリングは必要になると考えられる．そこで本報では投資に対して見込める利益率の分布が“べき分布”の場合に，選択と集中の程度と，個々の課題の利益率に関する予測精度の関係について，モンテカルロ・シミュレーションを通じて明らかにした．

1 はじめに

科学研究費助成事業（学術研究助成基金助成金／科学研究費補助金）_*1をはじめ，研究資金などの配分を行う際，一般に，応募者全員に申請額をそのまま付与するのではなく，何らかの評価を行った上で，高評価なものから資金配分を行う．予算等の上限が限られていることを考えれば，何らかの評価基準を設けて高評価なものを選択する，もしくは低評価なものを排除するという行為は合理的で適切と考えられ，研究資金配分に限らず社会の様々な場面で見ることのできる行為でもある．ところで，研究という作業を考えると，過去になかった新たな知識を開拓する試みと捉えることもできる．これまでに存在しないものに付いての作業であるので，作業した結果，所望の結果を得ることができるか否かも必ずしも明らかでは無い．この傾向はいわゆる基礎研究に関するものほど強いと考えられる．そのため，研究費の申請時点すなわち研究構想時点において，その研究課題の評価を適切に行うことは原理的に難易度が高いことが推察される．さらに評価にあたっては研究内容についての理解も要するため，評価の難易度は更に高まる．こうした背景のもと，例えば科研費については論文査読と同 ∗_{連絡先：文部科学省科学技術・学術政策研究所} 〒100-0013 　東京都千代田区霞が関 3-2-2 中央合同庁舎第 7 号館東館 16 階 E-Mail: hitoshi.koshiba ＠ nistep.go.jp *1 以下，科研費という．様に，専門家による評価に依っている．このように，評価は負荷の高い作業である．また，競争的外部資金を獲得するには申請作業が必要であり，申請者にも申請作業等のコストが生じる．他方，近年の運営費交付金の低下に伴って，研究費を確保するためには競争的外部資金の獲得は不可欠である．結果として申請・評価のコストが研究作業の推進をかえって阻害しているのではないかといった懸念もあり，研究費に関する過度の選択と集中に対する指摘も存在する[豊田19]．ところで，このときにどのように資金配分を行うことが望ましいか，といった配分の方式については必ずしも明らかではない．たとえば，ランダムに課題を選択して資金を配分した場合と，評価を行って配分した場合とでは，最終的にどの程度の差が生じるのか．たとえば，ある研究が産み出すであろう成果の評価について，まったく評価できない場合と，1割程度の正確さで評価できた場合とでは，最終的にどの程度の差が生じるのか．たとえば，評価の正確さが一定として，全体の1割に集中させるのと，5割に集中させるのとでは，最終的にどの程度の差が生じるのか．こうした疑問について，実際に数理的に考察を行ったものもある[野田19]．ただし，ここでは「べき分布」前提とし，かつ「（将来産み出す価値の付いて事前の）評価は原理的に困難」という前提での評価に留まっていた．これらの主張については一定の合理性を有しており納得のゆくものである．ただし，成果算出に関する分布の形状が「べき分布」とは限らない可能性はある．また「わずかでも評価できる」とした場合に，評価の正確性

(2)

がどのように影響するかについても検討の余地はある．そこで本稿では，選択と集中の程度と，個々の課題の利益率に関する予測精度の関係について，モンテカルロ・シミュレーションを通じた検証を行った．

2 既存研究

資金の配分（アセットアロケーション）は研究開発投資に限らず，資本主義社会においては様々な場面で問題となる．たとえば，株式市場においてどの会社の株をどの程度購入するか，資材購入とスタッフ雇用にそれぞれどの程度の資金を配分するか，など，枚挙にいとまがない．特に株式市場における商品購入については，低リスク低リターンな商品と，高リスク高リターンな商品を組み合わせるポートフォリオなど，一種の購買戦略も知名度を得ている．研究課題についても，一種の金融商品と見なすことはでき，金融工学等の知見を活用する余地は十分にある．ただし，今回我々が想定するようなケースを取り扱った論文・理論は見付けることができなかった．他方，研究開発投資を直接対象として，資金集中と分散のどちらが良いかについて実際に数理的な検討を試みたものがある[野田19]．ここでは，研究課題の産み出す価値が「べき分布」に従うことを仮定した上で，その場合に，資金集中と分散でどちらのほうが全体としての利益が大きくなるかを解析的，数値的に検証している．結果として，1．（基本的にはパラメータと関係なく）研究課題数が増すほど利益率も大きくなる，2．資金を集中させるよりも，広く遍く研究課題に投資する方が利益が大きくなる，といったことを報告している．ただし先行研究では，そもそもどのような研究課題が大きな利益を生み出すかを予測することはできない，という前提のもとで分析を行っている．この前提について，著者らも肯定的にとらえているものの，一般に「遍く研究課題に資金を配分する」とした場合には，実施の意図がない研究課題や，到底妥当とは考えがたい予算額を申請する研究課題など，意図的な「ただ乗り」が生じ，結果として「共有地の悲劇」のような状況が発生する可能性も高い_*2．したがって，現実的には「足きり」など何らかの評価・ファイルタリングは必要になる．また研究課題に限らず，多額の投資を行おうとする場合，リスク（例えば研究の実現可能性）とリターン（例えば研究成果の生み出す価値）のバランスをみて， *2 そうした悪意のある申請について，研究を実施したか事後に確認したり，不正発覚時の処罰を厳格化するなどして抑止するような運用も考えられるが，事後確認は結局，確認のためのコストの問題を生じることになる．どの程度の投資が妥当かの判断を行う．翻って，研究投資についても事前の段階において，やはり，その研究課題のリスクとリターンについて一定の評価（高額なものについての厳密な評価）が求められると想定される．そこで，仮に研究課題のリターンについてもある程度は予測できるとした時に，予測精度（事前評価の精度）と資金集中度が利益に対してどのような影響を及ぼすのか，といった問についての疑問がある．また，「べき分布」は計量書誌学の世界でも一般的な法則であり，研究開発投資を考える上でも一定の説得力を有する一方で，たとえば「対数正規分布」のように「べき分布」に類する他の分布も存在するが，そうした分布でも先行研究と類似の結果になるのか，疑問がある．

3 実験

ここでは以下のRQを検証するためにモンテカルロ・シミュレーションを行う． RQ1「べき分布」に従う場合，予測精度と資金の集中は利益全体に対してどのような影響を及ぼすか RQ2「べき分布」の代わりに「対数正規分布」を用いた場合でも，「べき分布」と同様の傾向を示すか

3.1 前提条件

ここで，すでに先行研究で指摘されているとおり，「べき分布」を想定した場合には，研究課題数が多ければ多いほど，期待値が向上する事が示されている．したがって，研究課題数がパラメータのひとつとなる．次に，我々が設定したRQにおいては，「予測精度」と「資金の集中度合い」について言及しているため，これらもパラメータとなる．以上より，最低限設定すべきパラメータは，研究課題数，予測精度，資金の集中・分散度合い，の3点になる．加えて，予測については，A.期待される成果が投入量を上回るか（利益率が1以上か否か）という2値予測と，B．期待される成果の具体値がいくらかという数量予測との2種類を設定する．この他，確率分布のパラメータも影響するが，これは分布毎に異なるので，ここではいったん除外する． 1．研究課題数1000，10000，100000の3パタン 2．予測精度0%, 10%, 25%, 50%の4パタン 3．予測種類2値予測,数量予測の2パタン

(3)

4．資金の分散度合い100%, 75%, 50%, 25%, 10% の5パタンなお，「資金の分散度合い」100%は全ての研究課題に資金が1単位ずつ配分されている状態，「資金の分散度合い」50%は半数の研究課題に2単位ずつ資金が配分されている状態，「資金の分散度合い」10%は1割の研究課題に10単位ずつ資金が配分されている状態，を意味する．従って，資金の分散度合いが小さいほど，少数の研究課題に集中投資をする状態を表し，分散度合いが大きいほど，多数の研究課題に分散投資をする状態を表す．予測については，精度0%以外のケースでは全ての課題に対してなんらかの予測を実施する．例えば精度10% の場合，10%の確率で正しく2値予測もしくは数値予測の結果を返す．それ以外の場合は，2値予測の場合は一様分布に従ってランダムに0（投資額以下の利益）,1 （投資額以上の利益）を，数値予測の場合は，べき分布に従って数値を返す．

3.2 予備実験

ここでは，「べき分布」に基づくモンテカルロ・シミュレーションに際し，先行研究同様，べき分布の累積密度分布関数の逆関数を用いて，「べき分布」に基づく数値生成を行うこととした．ここで，べき分布を以下で定義する． 𝑓 (𝑥) = 𝛽𝑥−𝛼 ₍₁₎ ただし，_{𝛼 > 1, 𝑥 ≥} (_𝛼−1𝛽 )( 1 𝛼−1) ．このとき，べき分布の累積分布は以下の通り表現できる． 𝐹(𝑋) = 1 −_{𝛼 − 1}𝛽 𝑋−𝛼+1 (2) 従って，逆関数_𝐺(𝑝)は以下の通り表現できる． 𝐺(𝑝) = { (1 − 𝑝)(𝛼 − 1) 𝛽 } 1 1−𝛼 (3) その上で，Python3.7のrandomパッケージで提供されるrandom関数を用いて_𝑝を設定することとして，分布のパラメータを_{𝛼 = 1.90, 𝛽 = 0.18}に固定し，10000 回ランダムサンプリングして理論値と比較した．結果を表1に示す．表1のとおり，基本的には理論値と一致する観測値が得られており，シミュレーションのベースとなる値には誤りがなさそうなことが分かる．

3.3 実験

「べき分布」のパラメータについては今回は先行研究を参考に，_{𝛼 = 1.90, 𝛽 = 0.18}として，1．研究課題数， 2．予測精度，3．予測種類，4．資金の分散度合い，の各パラメタを変化させ，結果を比較する． 3.3.1 実験の設定本実験を以下のようなゲームと想定すると理解がしやすい． •「なんらかの数値が書かれたカード」が数値の書かれた面を伏せてテーブルに並べられているとする． • プレイヤーは，カードの枚数と同数のコイン_*3を持っており，好きなカードに手持ちのコインを好きなだけ置くことができる． • プレイヤーが全てのコインを置き終わったらカードを開け，カードの数字にコインの数をかけた値が得点となる．ここで，カードは研究課題，カードの数値が研究の生み出す価値（利益率），コインが研究投資である． 3.3.2 実験の手続きモンテカルロ・シミュレーションの特徴を加味して実験の手続は以下の通りとする． 1. 任意の研究課題数_𝑛件分のカードを作成し，べき分布にしたがってランダムに価値を割り付ける 2. このカードの山に対して，予測精度，種類，集中度合いを変化させた全組合せ（40パタン）の試行を実施する 3. 上記，1．，2．を1000回繰り返し，平均的な傾向を得るつまり，特定のカードのセットを用い，「予測精度が 0%で，全てのカードにコインを1枚ずつ置いた場合（資金分散100%）」「予測精度が0%で，半分のカードコインを2枚ずつ置いた場合（資金分散50%）」など，複数のパタンを試行する．その上で，40パタン全てを終えたら，新たなカードの山を作成し，再び40パタンを試行する．なお，予測精度が0%ではない場合，既に述べたとおりに全カードについて予測を行う．このときに，資金分 *3 シミュレーション上は整数に限らず，2.5 枚といった配置も可能なため，ポイントと考える方がより正確ではある．

(4)

表1 べき分布に基づく区間出現数の理論値と観測値数値件数数値件数〜 1 8053 〜 11 16 〜 2 920 〜 12 14 〜 3 300 〜 13 10 〜 4 173 〜 14 16 〜 5 106 〜 15 8 〜 6 75 〜 16 8 〜 7 43 〜 17 8 〜 8 41 〜 18 12 〜 9 33 〜 19 8 〜 10 23 〜 20 6 数値累積率累積数区間数 数値累積率累積数区間数 1 80.0% 8000 8000 11 97.7% 9771 21 2 89.3% 8930 930 12 97.9% 9788 17 3 92.6% 9258 328 13 98.0% 9803 15 4 94.3% 9428 170 14 98.2% 9815 13 5 95.3% 9532 104 15 98.3% 9827 11 6 96.0% 9603 71 16 98.4% 9836 10 7 96.5% 9655 52 17 98.5% 9845 9 8 96.9% 9694 39 18 98.5% 9853 8 9 97.2% 9725 31 19 98.6% 9860 7 10 97.5% 9750 25 20 98.7% 9866 6

理論値

観測値

α= 1.90, β= 0.18 散の割合が100%を下回っており，1．2値予測の場合，投資額以上の利益が返ってくると予測したカードの山から順にコインを配置する．投資額以上の利益が返ってくると予測したカードの山をすべて引き終えて，まだコインが残っていたら，残りのカードに順次，コインを配置する．2．数値予測の場合，予め予測した価値の大きさに沿って降順にカードをソートし，価値が高いと予測したカードから順にコインを配置する． 3.3.3 実験の結果 1 実験の結果を以下に示す．表2において，is_Binは2値予測か否かを示しており，Trueの場合は2値予測，Falseの場合は数値予測を意味している．べき分布の性質上，極めて大きな価値をもつカードも出現することから，単純な平均を取った表では傾向が読み取りづらい．そのため部分平均を中心として結果を読み取る．部分平均は，得点の上位・下位10%を除外した上で平均をとったもので，今回は1000試行を行っているため，上位下位各100件，計200件を除いた800試行の結果の平均となる．最初に，予測精度0%のケースについてみてみる．このケースは理論的には先行研究と一致するはずで，ここがベースラインとなる．結果を確認すると，コインが分散している方が全体としての利益が大きいこと，課題数が多くなるほど全体としての利益率が大きいこと，が確認でき，先行研究と一致する結果を得られている．続いて，予測を行ったケースについてみる．まず，課題数が多くなるほど全体としての利益が大きいこと，については，予測を行ったケースでも，予測精度・種別にかかわらず同様の結果が保持されている．次に差異について確認する．2値予測の場合，精度 10%および25%の場合は全体の50%程度に絞り込んで投資する方が，全体としての利益が大きくなり，精度 75%では25%程度に絞り込んで投資する方が利益が大きくなるような傾向を示している．数値予測の場合は，精度10%, 25%, 75%の各ケースで全体の10%に集中投資する方が利益が大きくなるような傾向を示している．ここで，予測精度10%では2値予測と数値予測の間で面白い現象も確認できる．具体的には，コイン分散度 75%, 50%のケースで，数値予測よりも2値予測の方が利益が大きくなっている．これは，予測精度が低い状況下では粗い予測の方がかえってよい可能性を示している．例えば，予測精度が十分でないときに「午後15時から10分ほど雨が降る」と予測するよりは「午後雨が降る」と予測する方があたりやすい．これと同様の構造で，予測精度が低い数値予測をした場合，ハズレを引く確率が高まり，局所的に逆転現象が起きていると考えられる．べき分布の場合，片側に裾が広がる分布形状自体はパラメタ（_{𝛼, 𝛽}）が変わっても変化しないため，これらの結果はパラメタによらず，成立すると考えられる． 3.3.4 実験の結果 2 前節の結果から，予測精度によって利益が変化することが確認できた．このときすでに，10%の精度であっても予測ができるのであれば，集中投資する方が（わずかながら）高い利益を得られる可能性があることが示された．そこで，こうした傾向は0%から10%まで単純な増加傾向を示すのか，どこかで逆転を起こすのかについて，詳細に調査した．具体的には課題件数を10000件に固定した上で，予測精度を0%から9%まで1%ずつ変化させ，傾向を確認した．

(5)

表2 試行結果 α= 1.90, β= 0.18 平均は1000試行の平均，部分平均は上位下位10%を除いた800試行平均 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 1000 4.5 3.8 4.3 4.2 3.0 4.5 4.8 4.4 5.1 4.2 4.5 5.0 5.2 6.2 6.0 4.5 5.3 7.2 8.6 8.0 10000 8.3 9.5 8.4 9.9 16.5 8.3 7.7 11.1 10.5 5.6 8.3 7.7 12.8 12.5 19.2 8.3 10.4 11.2 21.4 22.2 100000 10.7 8.8 13.4 7.2 6.5 10.7 11.4 13.6 9.7 9.5 10.7 9.9 12.8 12.7 10.7 10.7 13.3 14.5 25.2 18.0 1000 3.0 2.8 2.8 2.4 2.0 3.0 3.0 3.0 2.7 2.4 3.0 3.2 3.5 3.4 3.0 3.0 3.4 4.4 5.4 4.5 10000 4.3 4.2 4.3 3.6 3.0 4.3 4.4 4.6 4.1 3.4 4.3 4.6 5.4 5.5 4.4 4.3 5.1 6.5 8.3 6.8 100000 6.0 5.8 5.4 4.8 4.2 6.0 6.1 6.3 5.8 4.9 6.0 6.5 7.7 7.6 6.4 6.0 7.1 9.2 11.4 10.0 is_Bin TRUE 予測精度 0% 10% 25% 50% コイン分散度 平均 部分平均 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 1000 4.5 4.6 5.1 4.0 4.0 4.5 4.8 5.1 4.9 7.5 4.5 4.9 5.1 9.4 14.3 4.5 5.1 6.7 9.6 19.4 10000 8.3 6.9 7.8 4.8 6.2 8.3 9.6 11.1 7.4 9.2 8.3 8.1 11.8 10.6 31.1 8.3 10.3 13.9 19.7 34.1 100000 10.7 11.4 12.1 9.6 7.0 10.7 11.9 13.7 11.0 22.1 10.7 12.1 11.7 14.0 23.7 10.7 12.5 17.4 28.5 41.2 1000 3.0 2.8 2.7 2.4 2.1 3.0 2.9 2.9 3.2 4.2 3.0 3.1 3.3 4.5 6.8 3.0 3.3 4.1 6.2 12.4 10000 4.3 4.1 3.7 3.5 2.9 4.3 4.3 4.3 4.6 6.1 4.3 4.6 5.0 6.8 10.8 4.3 5.0 6.1 9.6 20.3 100000 6.0 5.7 5.3 5.0 4.3 6.0 6.0 6.1 6.6 9.0 6.0 6.5 6.9 9.1 15.7 6.0 6.9 8.8 13.5 27.6 FALSE 予測精度 0% 10% 25% 50% コイン分散度 平均 部分平均 is_Bin 図1 パラメータと対数正規分布結果を以下に示す．表3を見ると，概ね予測精度5%以下では選択・集中の効果が見られず，それ以上になると，徐々に選択・集中することで全体の利益が大きくなる傾向が確認できる． 3.3.5 実験の結果 3 ここまではRQ1について見てきた．ここからはRQ2 について見ていく．「べき分布」のように，片側に長い確率密度分布を有する分布は複数存在する．たとえば「対数正規分布」もパラメータによっては「べき分布」と類似する形状を示す．図1に，パラメータを変化させて描画した対数正規分布のいくつかの例を示す．そこで，「対数正規分布」を用いた場合でも「べき分布」と同様の傾向を示すか確認する．ここでは，図2に示すようにべき分布に近い形状を示す_{𝜇 = −5,𝜎 = 5}で試行する．また，予測精度についてはこれまでの試行を参考に，0%, 1%, 5%, 10%, 25%, 50%の6パタンに変更図2 𝜇 = −5, 𝜎 = 5の対数正規分布して行う．対数正規分布に基づく数値の取得は_NumPy*4の run-dom.lognormal関数を用いておこなった．結果を以下に示す．表4からは，べき分布に基づいて試行した表2と同様，課題数が増えるに従って全体の利益率も増加する傾向，予測精度0%では広く遍く課題に資金配分を行う方が全体の利益も増加する傾向，予測精度が上がるに従って，資金の集中配分が全体の利益を増加する傾向，などが確認された． 3.3.6 実験の結果 4 ところで，対数正規分布は図1に示したとおり，パラメータによって全く異なる形状をとる．そこで，パラメータの違いによってどの程度傾向が変化するかについても確認した． *4 Version: 1.16.2

(6)

表3 予測精度と利益率 is_Bin 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% TRUE FALSE 分散度 0% 5.9 5.7 5.4 4.9 4.4 5.9 5.7 5.4 4.9 4.3 1% 5.9 5.8 5.4 5.1 4.5 5.9 5.7 5.5 5.1 4.7 2% 5.9 5.8 5.6 5.1 4.5 5.9 5.8 5.5 5.2 5.1 3% 5.9 5.8 5.7 5.2 4.5 5.9 5.8 5.6 5.4 5.5 4% 5.9 5.8 5.8 5.4 4.6 5.9 5.8 5.6 5.6 6.0 5% 5.9 5.9 5.9 5.4 4.8 5.9 5.9 5.7 5.7 6.5 6% 5.9 5.9 5.9 5.4 4.9 5.9 5.8 5.8 5.9 6.8 7% 5.9 5.9 6.0 5.5 4.9 5.9 5.9 5.8 6.1 7.1 8% 5.9 6.0 6.1 5.6 4.9 5.9 5.9 5.9 6.3 7.8 9% 5.9 6.0 6.2 5.8 5.0 5.9 5.8 5.9 6.3 8.1 予測精度 α= 1.90, β= 0.18，課題数 10000件 1000試行中上位下位10%を除いた部分平均表4 対数正規分布での試行結果 is_Bin 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 0% 282.8 255.7 215.7 151.8 88.8 282.8 251.2 216.3 136.4 77.7 1% 282.8 232.4 224.2 141.7 82.5 282.8 255.3 205.2 136.8 82.6 5% 282.8 245.0 221.7 142.6 94.2 282.8 282.9 217.6 172.6 155.1 10% 282.8 257.0 265.9 183.3 112.0 282.8 270.4 251.9 229.6 215.4 25% 282.8 290.9 315.9 261.5 173.5 282.8 286.3 289.0 369.7 499.2 50% 282.8 323.5 396.8 471.5 275.8 282.8 320.5 376.9 600.5 1280.8 予測精度 TRUE FALSE コイン分散度 0% 508.7 484.6 444.2 386.9 239.9 508.7 473.4 448.0 372.4 249.6 1% 508.7 463.6 419.1 361.7 249.3 508.7 463.1 443.3 391.0 334.7 5% 508.7 482.2 482.7 358.4 291.1 508.7 481.3 442.1 411.1 482.5 10% 508.7 507.4 501.7 460.2 304.0 508.7 499.5 462.1 512.6 646.0 25% 508.7 564.6 657.7 579.9 430.2 508.7 551.8 563.9 719.6 1176.4 50% 508.7 596.6 788.5 1010.3 746.1 508.7 583.9 732.2 1156.8 2548.0 予測精度 0% 866.8 835.8 788.3 676.3 556.0 866.8 839.8 808.4 629.2 503.5 1% 866.8 843.9 781.9 653.6 500.3 866.8 810.5 742.4 652.2 582.0 5% 866.8 877.4 851.9 746.3 562.6 866.8 852.3 779.8 757.2 831.2 10% 866.8 908.4 911.0 831.3 642.4 866.8 859.3 870.1 945.3 1164.0 25% 866.8 934.7 1092.2 1167.7 912.3 866.8 900.2 1013.0 1325.5 2284.6 50% 866.8 1045.9 1347.5 1824.3 1531.0 866.8 989.0 1249.7 1986.7 4109.3 予測精度 1000 件 10000 件 100000 件 μ = -5.0, σ = 5.0 1000試行中上位下位10%を除いた部分平均具体的には図3に示した4パタンのうち，前節で既に示した_{𝜇 = −5,𝜎 = 5}を除いた3パタンについて，課題件数を100000件に固定して試行する．結果を以下に示す．表5からは，分布形状が「べき分布」とは大きく異なるような形状を示す場合，結果も異なる傾向を示すことが読み取れる．

4 考察

実験を通じ，下記のRQそれぞれに対して一定の回答を得た． RQ1「べき分布」に従う場合，予測精度と資金の集中は利益全体に対してどのような影響を及ぼすか予測ができない場合については，既存の報告[野田19] の通り，広く遍く課題に投資することで最も大きな利益を上げられることは確認できた．その上で，おおむね予測精度25%程度からは集中させることで一定の効果が認められそうなことがわかった， RQ2「べき分布」の代わりに「対数正規分布」を用いた場合でも，「べき分布」と同様の傾向を示すか

(7)

表5 対数正規分布での試行結果（パラメタの違い） μ = 0.0, n = 100000 1000試行中上位下位10%を除いた部分平均 is_Bin 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 0% 1.131 1.131 1.132 1.133 1.133 1.131 1.132 1.132 1.133 1.133 1% 1.131 1.134 1.138 1.138 1.137 1.131 1.135 1.138 1.141 1.146 5% 1.131 1.140 1.155 1.155 1.155 1.131 1.141 1.155 1.174 1.199 10% 1.131 1.149 1.177 1.176 1.176 1.131 1.151 1.177 1.215 1.266 25% 1.131 1.170 1.240 1.242 1.241 1.131 1.180 1.241 1.338 1.465 50% 1.131 1.206 1.350 1.350 1.350 1.131 1.230 1.350 1.543 1.798 TRUE FALSE コイン分散度 予測精度 0% 1.060 1.060 1.059 1.058 1.057 1.060 1.060 1.059 1.058 1.058 1% 1.060 1.060 1.060 1.060 1.060 1.060 1.060 1.060 1.061 1.065 5% 1.060 1.060 1.070 1.070 1.071 1.060 1.061 1.070 1.080 1.095 10% 1.060 1.068 1.084 1.085 1.084 1.060 1.070 1.084 1.108 1.133 25% 1.060 1.080 1.127 1.127 1.126 1.060 1.090 1.127 1.180 1.246 50% 1.060 1.100 1.194 1.195 1.195 1.060 1.120 1.195 1.302 1.435 予測精度 0% 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1% 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1.020 1.023 5% 1.020 1.020 1.030 1.030 1.030 1.020 1.021 1.030 1.032 1.040 10% 1.020 1.028 1.040 1.039 1.038 1.020 1.030 1.040 1.050 1.060 25% 1.020 1.030 1.060 1.060 1.060 1.020 1.040 1.060 1.090 1.120 50% 1.020 1.050 1.100 1.100 1.100 1.020 1.060 1.100 1.160 1.222 予測精度 σ = 0. 5 σ = 0. 3 σ = 0. 2 図3 パラメータと対数正規分布2 「対数正規分布」でも，「べき分布」に類似する分布パラメータの場合は，傾向としては概ね同じことがわかった．一方で，実務の面では後述する留意事項に加えて，ここまでのレベルでもいくつかの課題もわかった．たとえば，予測精度の向上は審査コストと比例すると考えられる．ここで，（部分平均をベースとして）予測なしに全体にまいた場合の利益は2.7～2.8，25%の精度で予測して全体の5割に集中させた場合の利益は3.3～ 3.5である．25%の精度での予測を行うために必要なコストが0.6～1.5の利益増加に見合うか，そもそも予測精度を評価できるか，といった点は実務上重要である．さらに，数値予測の場合は予測精度10%で全体の1 割に絞ると高い利益が得られるが，仮に外部資金のみで研究を行うような世界を考えた場合，残りの9割は死に絶えてゆきシュリンクしていく可能性もある．また，既存の報告[野田19]とも関連するが，これまでになかったような革新的なアイデアを評価することは困難性が伴う．単純な話としても“10万円の投資で1万儲かる”と言われた場合と，“10万円の投資で1000万儲かる”と言われ場合とで，後者はにわかには信じがたい．したがって，現状の技術の延長線上にあるか，解離の度合いが小さいもの程度しか評価できず，大きな価値を持つものほど見落としてしまうような問題が生じる可能性も高い．以上より，現状の設定の範囲においても実務上はさまざまな留意を要する．

4.1 追加実験

上記の考察の一部を補強するため，1の投資で100以上の価値を産み出すことが予測される奇特なものを忌避し，そのような場合には価値ゼロと予測を修正した場合のシミュレーションを試行する．ここでは簡単のためにすでに見てきた，べき分布（_{𝛼 =} 1.90, 𝛽 = 0.18）を前提とし，予測精度については0%, 1%, 5%, 10%, 25%, 50%の6パタンを採用する．表6を見ると，このケースでは全体の価値を引き上げる高価値な課題を積極的に切り捨ててしまうため，予測の精度にかかわらず，予測を行わず広く遍く課題に資

(8)

表6 高価値な課題を忌避した場合 is_Bin 100% 75% 50% 25% 10% 100% 75% 50% 25% 10% 0% 6.2 6.0 5.5 5.2 4.3 6.2 6.0 5.7 5.1 4.4 1% 6.2 6.0 5.6 5.0 4.5 6.2 6.0 5.7 5.0 4.2 5% 6.2 5.9 5.6 5.3 4.6 6.2 6.0 5.5 5.1 4.7 10% 6.2 6.0 5.6 5.0 4.7 6.2 5.8 5.5 5.2 4.4 25% 6.2 5.7 5.5 5.1 4.5 6.2 5.4 5.2 4.9 4.9 50% 6.2 4.7 4.6 4.7 5.3 6.2 3.5 3.7 4.4 6.5 TRUE FALSE コイン分散度 予測精度 α= 1.90, β= 0.18，課題数 10000件 1000試行中上位下位10%を除いた部分平均金配分を行う方が，全体の利益を増加することが読み取れる．

5 留意事項

最後に本試行における留意事項について述べる．今回の試行では，「研究の価値」を単純に利益率に変換している．このこと自体には無理はないが，「利益が得られる期間」については考慮していない．たとえば，同じ100と言う利益であっても，1年間で100の価値を生み出す，100年間で100の価値を生み出す，研究終了から50年後の1年間で一気に100の価値を生み出す，など，価値の生み出し方にも様々なパタンが考えられる．また，価値の分布については，「べき分布」を念頭にべき分布と類する形状を示す場合の対数正規分布を試行した．価値の分布として，どちらがより適切なのか，もしくは，全く別の分布形状の方がフィットするのかについては議論が必要である．仮に「べき分布」であるとしても，そのパラメータとしてどの程度の値を取るのかについても考慮していない．さらに，分野毎に必要となる資金投入の単位は大きく異なることも想定される．たとえば，施設の建設を伴うような大型の観測装置が必要な研究分野に対して数十万円の投資では意味がないが，他の分野では最低限のラインとしては十分であるかもしれない．またある額を超えると一気に成果が出るが，その額以上の追加投資を行っても成果の向上は見込めない，といった研究も存在し得る．こうした点については今回の試行では考慮を行っていない．予測についても，現状の予測精度がどの程度であるのか，先行研究で指摘があるとおり，現在存在しない，特にディストラクティブなイノベーションに繋がりうる新奇なアイデアの価値を予測することは可能か，と言った点について多くの議論が必要である．その上で，どのような資金配分を行うかは意思決定の問題であって，論理的な正解は複数存在し得ると想定される．従って，本試行の結果を直ちに研究資金配分へ応用することについては，慎重な検討を要する．

6 まとめ

モンテカルロ・シミュレーションを通じ，最適な予算配分に付いての簡易な試行を行った．結果，研究の生み出す価値が「べき分布」に従うとした場合において，研究の生み出す価値を10%～25%以上の精度で見積もれる場合，予算を集中することで，より高い報酬が得られる可能性があることが分かった．一方で，予測精度が十分ではない場合においては，むしろ予算を集中させることでかえって全体としての報酬が低まることが分かった．また，分布形状を対数正規分布とした場合においても，分布形状が「べき分布」と類似するようなパラメータ条件下では，同様の結果を示すことが分かった．今回の試行は簡易的なものであり，実際の予算配分にそのまま適用できるものかどうかについては，多く検証の余地がある．一方で，根拠に基づく政策立案に向けて，一定のフレームを示すことができた．

参考文献

[豊田19] 豊田長康. 科学立国の危機: 失速する日本の研究力. 東洋経済新報社, Feb 2019. [野田19] 基礎研究や革新的技術開発のやり方. https://www.madnoda.jp/contents/blackswan/ (last accessed : 2020.11.11.) ■注本稿に示された見解や記された内容は著者個人によるものであり，著者の所属する組織を代表するものではない．

選択と集中に関するシミュレーション