マルチコアCPUにおける並行型差分進化のノンパラメトリック検定を用いた比較研究
全文
(2) Vol.2012-MPS-87 No.18 2012/3/2. 情報処理学会研究報告 IPSJ SIG Technical Report. 〔CDE のサブルーチン(ワーカ Wn )の手順〕. 表 1 実行時間の比較 [ms] Table 1 Comparison of execution times [ms]. NT. 1. 2. CPU f1 f2. f2. 6. 8. 142.73 (5.41) 357.30 (9.89). Intel(R) Core(TM) i7 100.00 60.43 51.56 (10.53) (7.94) (8.18) 196.33 106.26 90.63 (8.94) (10.52) (7.61). 45.83 (6.96) 74.46 (8.82). 194.63 (8.95) 397.03 (10.50). AMD Phenom(TM) II X6 170.70 95.76 70.26 (19.36) (11.38) (8.01) 258.80 141.03 101.96 (10.99) (6.44) (8.92). 65.03 (7.17) 106.20 (8.66). CPU f1. 4. 手順 1: 全個体 xi ∈ Pn について f (xi ) を計算する.世代数を g = 0 とする. 手順 2: 各ターゲットベクトル xi ∈ Pn について,手順 2.1 から手順 2.3 を実行する. 手順 2.1: ランダムに親個体 xr1 ,xr2 ,xr3 ∈ P(i = r1 = r2 = r3)を選択する. 手順 2.2: トライアルベクトル u を生成し,f (u) を計算する. 手順 2.3: f (u) ≤ f (xi ) なら,xi = u,f (xi ) = f (u) とする. 手順 3: g < GM (GM は世代数の最大値)なら,g = g + 1 として手順 2 に戻る.. 3. 数値実験と統計的検定 単峰性の Sphere 関数 f1 と多峰性の Griewank 関数 f2 を目的関数 f (x) とし,D = 30 として,それぞれの関数最適化問題に Java 言語で実装した CDE を 30 回ずつ適用した.た. 表 2 目的関数値の比較 Table 2 Comparison of objective function values. NT. 1. 2. CPU f1 f2. f2. だし,制御パラメータは NP = 144,F = 0.5,CR = 0.9,GM = 1000 とした.2 種類の. 6. マルチコア CPU における CDE の実行時間の平均値を表 1 に示す.括弧内の値は標準偏差. 8. 3.58E-10 (9.10E-11) 7.16E-9 (8.09E-9). Intel(R) Core(TM) i7 3.02E-10 6.57E-10 8.81E-10 (9.10E-11) (4.56E-10) (6.10E-10) 6.11E-8 4.11E-9 3.46E-8 (2.41E-7) (2.95E-9) (9.26E-8). 7.50E-10 (4.80E-10) 4.56E-9 (5.71E-9). 3.58E-10 (9.10E-11) 7.16E-9 (8.09E-9). AMD Phenom(TM) II X6 3.36E-10 3.97E-9 2.96E-9 (9.45E-11) (3.30E-9) (6.31E-9) 2.57E-8 2.17E-8 1.07E-8 (6.10E-8) (4.88E-8) (2.16E-8). 2.86E-7 (2.09E-7) 3.03E-6 (4.44E-6). CPU f1. 4. である.同様に,CDE で得られた最良解 xb に対する目的関数値 f (xb ) を表 2 に示す. ノンパラメトリック検定(Wilcoxon 検定)4) により,ワーカ数が NT = 1 と NT ≥ 2 の場 合で目的関数値 f (xb ) を比較した結果を表 3 に示す.記号「*」と「**」は「ワーカ数 NT の違いで f (xb ) に差はない」とする帰無仮説がそれぞれ危険率 5%と 1%で棄却できること を意味する.同様に,マルチコア CPU の違いで f (xb ) を比較した結果を表 4 に示す.. 4. お わ り に CDE は複数のコアを活用して実行時間を短縮するが,CDE により得られる解の精度は,. 表 3 ワーカ数に関する Wilcoxon 検定 Table 3 Wilcoxon test of the number of workers. NT CPU f1 f2. 2. 4. 6. 8. 2. Intel(R) Core(TM) i7 * ** ** ** – – ** *. 4. マルチコア CPU の種類のみならず,ワーカ数にも影響されることを示した.今後の課題は, 6. 実行時の環境の差異に対してロバストな CDE の実装方法を考案することである.. 8. AMD Phenom(TM) II X6 – ** ** ** – – – **. 参. 1. 2. 4. 6. 8. f1 f2. – –. – –. ** **. ** **. ** **. 文. 献. 1) C. Bresbears(千住治郎 訳):並行プログラミング技法,オーム社 (2009). 2) R. Storn and K. Price:Differential evolution - a simple and efficient heuristic for global optimization over continuous space,Journal of Global Optimization,Vol.11, No.4,pp.341–359 (1997). 3) K. Tagawa and T. Ishimizu:Concurrent differential evolution based on MapReduce,International Journal of Computers,Vol.4,No.4,pp.161–168 (2010). 4) 岩崎学:ノンパラメトリック法,東京図書 (2006).. 表 4 マルチコア CPU の種類に関する Wilcoxon 検定 Table 4 Wilcoxon test of the kinds of multi-core CPUs. NT. 考. 2. c 2012 Information Processing Society of Japan .
(3)
図
関連したドキュメント
The VLSI architecture is characterized by pipeline processing of the divided images, concurrent motion models estimation for multiple regions, and a common processing element
2 つ目の研究目的は、 SGRB の残光のスペクトル解析によってガス – ダスト比を調査し、 LGRB や典型 的な環境との比較検証を行うことで、
いない」と述べている。(『韓国文学の比較文学的研究』、
たRCTにおいても,コントロールと比較してク
Orientations are described in terms of functors de- fined on equivariant fundamental groupoids of base G-spaces, and the essence of the theory is to construct an appropriate
for topological spaces equipped with a local partial order, as continuous models of concurrent processes; in Section 8 we show how our fundamental category can be used to
Topological classification of Stokes graphs are given for the case where equations have five regular singular points.. It is proved that there are exactly 25 degree sequences of
Our a;m in this paper is to apply the techniques de- veloped in [1] to obtain best-possible bounds for the distribution function of the sum of squares X2+y 2 and for the