• 検索結果がありません。

Element-by-Element方式有限要素解析における線形方程式解法の高速化

N/A
N/A
Protected

Academic year: 2021

シェア "Element-by-Element方式有限要素解析における線形方程式解法の高速化"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)Vol.2010-HPC-127 No.2 2010/10/13  . . . . . IPSJ SIG Technical Report. ¤£. ¢¡. 1.. ÁÀ. º ». ÃÂ. ¿¾. ½¼. ¹. ª«. Ä. ´³. ²±°. ¦. ¸·. ¶µ. «. ¯. Navier-Stokes. ®­ ¬. © §¨. ¥.

(2). . . Ü. ÛÚÃ. Element-by-Element. Ð. Ð. Ñ. Ñ. º. Ñ Ë. Ë ¯ á. à. Ö×. ØÙ. ÓÔ¼. ßÞ. Õ. Ò. ÇÈ. ÊÉ. ÎÍ. ݸ. ¶. ¶Ï. Ì. ¶µ. ÅÆ ².  . . 6)8)26). ½. (Finite Element Method). Ð. ÷. ¹Ã ó ». ¯ Ò. á. ï ù. õö. ô¼. òî ðñ. Ð. †1. Æø. Æ. íî. . ¹. à Ì. ü. ¸. í. Ö. . . ÿ. ¦ý ¼ü. ¼. î·. ¶¦. ¯. «þ. º¶. . º×. Ñ. ¶Ï. ´³. ²±°. úû. †1. Ö. äì °. ¼. . . . ). ®ë. éê. èç. å×. . æ·. ä. . EbE. º. ܶ. Ú Ã. à ãÌ. Ãâ. . Element-by-Element(. "! $#. . . Ã. Æ. Ñ. Ñ. º. . . Ë. Ì. Ý. ¶. «. . ãÌ ¯. . à. µ.

(3). . . . ý. ö. . ¼. Hughes ß. 1983. . †3. . †2 +. )*. '(. &% , 5). Æ. ¶. Ì . ø. ï. . ². . õö. . . . ¼. °. ¼ ÷. Ã. . ». . Ý. ¶. ¶. ¶. Ì ß. !. Â. . ݸ. Ì. ãÌ. Ë á. à. . . . õö. . . ¼. ". ¼. . KJ $ ,. Ã Æ . . ×. ×. » ¶. Ì ß. ݸ. ¶. &. â. á. à. à ( +. #. [Z. `. #. YXW. ². *. '. %. . ¼. d. M `. :. 1=. k ba. i j. F. e. D. fg. ½. Ð. Ã. Ã. Ã. EbE. Ã. Æ. º. Ñ. . . Ý. ¶. ¶. -. à. .. 0. (. #. 1. ² 6. 5. 34. íî. Ö. _. 4. |. {t. 9[. f. uv. 5t. 9. D. zyM. S. sr. 1. F. M. on. mM. $. Ã. Ã. à Ñ. º ×. Ë. » &. Ì. 7. ¯. <. á. +. EbE. °. ¼. G. xw. G. lL. l. 19)28)2)13)14). äì. 2. /. ² ØÙ. *. %. =>. . î. 89 . :;. ¼. °. pq. G. =. CPU. ). . °. ¼. W. ba. [Z. VU c. `. G>. _. 7. ]\. 1^. VU. G. EbE. h1. Hughes EbE. 9) 10)11)12). EbE. T3. 1 SR. PQ. OMN. Element-by-Element(EbE). HI. FED C. >. =<. 9. 675. G. L. 1. 2000. G. BA@ ?. 4. .-. 18. ;:. 4 23. 1 0/. A. . . . ü. á. î·. 1) 3)27). Ax = b. EbE. . ó. ». ¯. ¶. Ãâ. ó ï. 1990. VU. G. W. >. „. F. €. {. ~. KJ. HI. 8. 7. ƒ ‚. 4. ;:. ba. }3. 1D. s> [ M. 17)23)24). 25). X. X Ü Ð. Ð. ¹ Æ. ó Ñ. Ñ Ë. ¯ Ì. &. . á. á. Òô. ¶à. ï. B. + A. *. @. É. ?. _. ”•m. ’. M. u. G“. Ž. Œ.e Š‹. Ú. ˜. J. K. — –9. 1ˆ‡. =. †D. ‚. ‰ ˆ‡. [. W. ‘ . G. ‰i. Ÿ ;>. . :. a.  . {t. Sž. f. v. œ. ›. i†. `. 1š™. S. ` ke. G. 20). IDR(s). Ð. Ã Ñ . Ì. ¶Ï. ¯. ¶ Ò à. +. ®. î. . ?F. ô¼. DE. *. î. 89. C. ²±°. úû ¼. ° 21). Ð Ã. Ã. ¹. ¹. Æ Ñ. H. ». Ë. ×. × ¯. &. «. &. ßà á. K. G. Bi IDR(s). J OP. N. M. î. 89. L. %. î. ¼. I. 15) 16)4). Ð. Ð. Ð ¹. à ó. Ñ. Ñ . × ¯. «. Ì. ¶ â. ¶Ï Ä. á. à. G. Ä *. Y. VW. U. î. 89. T. S. Q. ¼. X. ¼. R. Ã. º. Ñ. º. ó. Ë. Ë. ». «. « ßà. +. 89. . î. î. ¼. Z. î·. ²±°. úû ¼. Bi IDR(s). ¹. Ã. IDR(s). î. Improvement of iterative methods for linear systems in FEM Analysis by Element-by-Element scheme. à ^. ÃÒ. Ë «. «. ¶. ãÌ ¯. ¶. ß. ß. º®. ×. . ò. #. ù. c. å×. d. ¼. ¼. èç. ä. b. ¼. a `. _. \]. [. . ä ó. ×. ¯. Ì. «. ÃÌ. Æ. Ãâ. . ß. h. à. á. á. Shusaku Shibata,†1 Yusuke Onoue,†1 Seiji Fujino†2 and Kazuo Kashiyama†3. B. ® k. e j. i. Þ. ä. fg. ¼ ó ¯. ¶. ¯. s. <. ï. ¸. á. ï #. î. ¼. p. à . . ø. w. þ. ². õö. x. r. q. uv. ¯ý. ¶Ï. á. ®. °. ¼. Ð. Ë. «. ¯. ¶ á. î. [. ´³. r. q. ¼. p. {. ¼. ®­. ¬. yz. d. IDR(s). º. Ñ. ó. Ñ. ¶ò ù. ^. Bi IDR(s). ºã. ó ¯. ¶. ¯. ¶. «. 7. ß ®. ®. r. q. . |. g. ù. C. î. áô. á. Ãò. ¯. ¶. å. d. 5. IDR(s). . ó. ¯. « î. ö. EbE. 89. P. r. q. éê Ã. î. Ü. à . ƒ ‚ „. } ‰. ˆ. †‡. . . ~ €. €. €. †1. 4. IDR. t. ó. ». no. º î. Large scale analysis of fluid dynamics needs much computational time and memory even if state-of-the-art computers with multicores are used. This motivates us to incorporate Element-by-Element scheme capability into the employed IDR(s) and Bi IDR(s) methods which were recently proposed. A way of obtaining a better convergence is insight for kernel implementation of matrixvector multiplication. Through numerical experiments, we make clear performance improvement of kernel implementation on three kinds of computers.. 3. ó. 2. Ã. à lm. Y. Bi IDR(s). Graduate School of Information Science and Electrical Engineering, Kyushu University “.  ‘ ’. Š‹ . . } Ž. Œ. †‡. ~ €. †2. Research Institute for Information Technology, Kyushu University —. – ˜. . ”• €. €. †3. Faculty of Science and Engineering, Chuo University. 1. c 2010 Information Processing Society of Japan.

(4) Vol.2010-HPC-127 No.2 2010/10/13  . . . . . IPSJ SIG Technical Report 12. 13.. . 2. EbE . . . .  . . Ì . ß à. ï. ò i. ðñ. ²±°. ¼. ²±°.

(5). ¼. á. ¸·. î. î. . Ú. . ¼ Ü. t. Ð Ñ. ó. ». ¶. ¶. ¯. <. s. <. á. ø. ï. ¸ #. º®. . . P. ¼. î·. P. î. . IDR. ». ø. ·. ¼. b. . ³ý. . x. ». þ. þ ý¼. . ²±°. . . IDR. ». . . IDR(s). . Ñ. ¶Ï. &. A. Ð. Ax = b. . ¸·. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.. ó. » Ì. 7. «. . ²±°. 2.1 IDR(s). Bi IDR(s). «. ¯. s. ¥. IDR(s). Ë. ». *. Ax = b. 14.. Ú. ó. Ãà. ó. +. Y. Navier-Stokes. 20) 15). ¯ á. «Ö. ® uv.   . . ×. Ë. ø X. Ú . ¶. ¯ ß. . ü. á. . º®. «.  . . ¼. ¼. KN (A; r0 ). þ. . . Krylov. . ø. . G0. ¶. «. . . þ ý¼. þ. Üý. P = (p1 , p2 , . . . , ps ). Ã. Gj (j = 1, 2, . . .). pi (i = 1, 2, . . . , s). . Ú «. P. º. A∈R. N×N. If mod(n, s + 1) = s then tn = Av n (tn , v n ) ω= (tn , tn ) en = −En cn − ωtn q n = −Qn cn + ωv n Else q n = −Qn cn + ωv n en = −Aqn End If r n+1 = r n + en , xn+1 = xn + q n if ||r n+1 ||2 /||r 0 ||2 ≤  then stop En+1 = (en , . . . , en+1−s ), Qn = (q n , . . . , qn+1−s ) End Do. «.  . ¼. 2.2 Bi IDR(s). 21)16) . . Ð . Ñ ¯. ¶. ¯. . &. ø. á. ï. %. î. ­. . Üà Æ. ¶. ¯. . . á. ø. ®. ®. ®. º®. . &. . á. #. 8 o. ;. 9:. éê. %. . 7. *. '. . o. ¯ô. ¶. «. . <. P. . 2. Ã. Æ. &. 1. à ¯. «. ¶. Ý. ¯. á. (. $. ®õ ). î. î. ö. Bi IDR(s). rn+1. Ü. ó. î·. 56. î. . !. Ü. à º. ó× . ¼. Gj+1. Ð. Æ. . #. for all j > 0. (ii). Gj = {0}. for some j ≤ N. . à  > =. ø ¼. ®¼. D. ¼ . . Ã. ÜÃ. ?. º. ó. . Ë. «. ¯. <. . . á. ï. ø. ø. á. á. þ.

(6). þ õö. Ø. ;. :. ,. *+. õ. ). »ý. ¯. . ï. á. à. ì. Ã. . ¯. ¯. (. '. ÷. Ã. -. Æ. 0. ó. ¶. «. ¯. . .. á. á. á. ®. ®. /. «ò. ¶. ¯. ¯. ¶. ãÌ. ×. ». e. éê. î. ö. î. OP. N. M. î. éê. N. M. î. . . ù. 1. ¼. ¼. ¼. Bi IDR(s). ¼. ·. ?. P. g n+1 := rn+1 − rn+i+1. º®. ×. &. . %. ¼. ó. ». . ¶. Ý. ¯ ®. pj. &. ø. . ¼. Æ. ø. %. . IDR(s). (3). ». . <. . à. . P. P. î. g n+1. . ¶. ¯. <. á. . . &. x0. s+1. ì. . ». ¯ ­. . Ã. IDR(s). Gj. ó. Ñ. ¼. IDR. . . Ð. î. . r0 := b − Ax0. (2). rn+i+1 ⊥ pj (i = 1, . . . s, j = 1, . . . , i) IDR(s). Ü ¶. ¶. N. Bi IDR(s). gn+1 ⊥ pj (i = 2, . . . s, j = 1, . . . , i − 1). Gj ⊆ Gj−1 IDR(s). Ã. . ". þ ý. ¼. IDR(s). Ã. Ã. «. ´. . PT. Ü. ÷ Ã. Â. á. . »Ó. . ¯ ® P. IDR (i). Gj. P. Ú Ã. . º. I − ωj A. (1) N ull(P T ). Á. Á. ωj. . Gj := (I − ωj A)(Gj−1 ∩ N ull(P T )). 3 2. 4. 2. Bi IDR(s) « á ®. î. ö 1. 1. 2. 3. 4.. 3 2. 4. 2. IDR(s). 1. Let x0 be a random vector, and put r 0 = b − Ax0 2. For n = 0, . . . , s − 1 Do 3. v n = Ar n (v n , r n ) 4. ω= (v n , v n ) en = −ωv n 5. q n = ωr n , 6. r n+1 = r n + en , xn+1 = xn + q n 7. End Do 8. Es = (es−1 , . . . , e0 ), Qs = (qs−1 , . . . , q0 ) 9. Do n = s, s + 1, . . . 10. 11.. T. 5. 6. 7. 8.. Let x0 be a random vector, and put r 0 = b − Ax0 , g i = qi = 0, i = 1, . . . , s, H = I, ω = 1 n=0 While ||rn ||2 /||r 0 ||2 >  Do f = P T r n , f = (φ1 , . . . , φs ) Do k = 1, . . . , s Solve c from Hc = f , c = (γ1 , . . . , γs ) v = rn −. s X i=k. 9.. γi g i , q k = ωv +. s X. γi q i. i=k. g k = Aq k. T. Solve cn from P En cn = P r n v n = r n − E n cn. 2. c 2010 Information Processing Society of Japan.

(7) Vol.2010-HPC-127 No.2 2010/10/13  . . . . . IPSJ SIG Technical Report . à . º «. . ø. #. þ. Ã(. º¶. =. í. Ö. ý. x. ³ý. . í. Ö. ¼. Ã. ¹ ». &. × º¶ ¯. / <. á. w. þ. %. ³ý. . í. Ö ¼. ®7. #. 6. ³. í. 98. ó Ö. º Ë Ì á. þ Á. . ½. Ã. . . ø. á. «=. ãÌ ¯. «. ¶ ®. ®. >. . ;<. õö. x. 1. . + . ¯ á. à. =. * C. ?@ ¼B. i. m. ». &. þ. D. >. j. G. Ö. . Ãí. Ã. º ®F. «E. D. þ. ¼. E. A. elem.. D. A. . º. D ý. (j, i, m). . . Ã. Ã. . º. . ». ». . . ¶. ¶. ¶. ¯. ø. ø. á. þ. þ. ´. þ. ³ý. . í. Ö. >. >. ¼. ·. ¼. -. à Æ. Æ. nn. . . ß. à. ?@. r. º. 1. . Õ. ³ý. . í. Ö Ãþ ³ý. . í. Ö. m. j. Æ. Æ. Ãþ. ÃÑ. »®. x. Aelem. (j,. þ. ". þ ý¼. 3. . ». . ¯. ¯ á. à. á. ® . þ. ?@. j. G. f. '. Ö. >. ?@. ¶í. ¶. Ì. 7. ¯ à. H. fg. õö. x. ¼. do m = 1, nelm do i = 1, 9 do j = 1, 9 r(nn(j, m)) = r(nn(j, m)) + Aelem. (j, i, m) ∗ x(nn(i, m)) enddo enddo enddo I. 1 A Fortran-like code of matrix-vector multiplication in EbE scheme.. . . 3.. ¶. «. 5ç %ý ¶. 26. 27. 28.. .. ¹Ã. : ¶. 25.. Fortran. r(:) = 0.0d0. {Update f = P T r } If k < s then φi = 0, i = 1, . . . , k, φi = φi − βµi,k , i = k + 1, . . . , s f = (φ1 , . . . , φs ) End If n=n+1 End Do t = Ar n (t, r) ω= (t, t) xn+1 = xn + ωr n , r n+1 = r n − ωt n=n+1 End While. 17. 18. 19. 20. 21. 22. 23. 24.. ¯. ® ¶4 ¼. i, m) . 16.. 1. Ã. 15.. . 14.. 9×9. 7). Ã. 12. 13.. Aelem.. Ð. 11.. ö. 10.. nelm. . Ú «. {Make g k orthogonal to p1 , . . . , pk−1 } Do i = 1, . . . , k − 1 (pi , g k ) α= µi,i g k = g k − αg i , qk = q k − αq i End Do {Compute pT i g k , i = k, . . . , s update H } µi,k = (pi , g k ), i = k, . . . , s, Hi,k = µi,k {Make residual orthogonal to p1 , . . . , pk } φk β= µk,k r n+1 = r n − βg k , xn+1 = xn + βqk. 

(8) .  .   . Ü. ^. Ñ. Ñ. . ø. á. ¶ò. . w. ¯ý. ¶Ï. ß. и. Ð. Ã. Ã. Ã. ². þ ù. õö. r. %. . x d. °. ¼. ­. EbE. . 3.1 EbE. .  . . . .  . . J. 3.2. R . U T. S.  Q. K VP. OP. L MN. . ½ ÷ ¹ º. Æø. . Ñ ». ¶. . ¶Ï ·. ø. þ ù. ÓÔ. õö. õö. x. ý¼. . ¼. Ú. Á . à 0. Ë . Ìý. þ. [. ¶Z. X. ô. Y Á. Á. Á ½. ½. Ã. Ã. 0. Ã=. ¹Ã ó. . ». á. «A. ø. Ã=. . ® þ. õö. x. í. Ö. >. X. ô. ;< ¼. Y. 1. á. . \. \ Ã. ed. a. =. l. _`. ]^. b6. =®. gf. hg. Æ. ¯. ãÌ. ¶. «. kji. Á. Á. . 7c. ¯ Ò. (. '&. º« ¯ ®. #. . x(nn(i, m)). ¹. «. þ ³ý. . í. Ö. %. ¼. nelm. í. ¼. Z. . #. $. Aelem.. Ö. ³ý. . %. . °. ¼. Ð. Ã. =. # Ð. !. Ã. Ã. º. ×. . . &. ¯ þ. ¶(. º®. (. ³«. ³ý. . í. Ö. %. í. Ö. ³. nelm. >. ². *. ¼. 22). þ. ³. W. . . &. «. +. Y. ! . Ý. « þ. Aelem.. x(nn(i, m)). . µ. ¼. ×. Ë. ». â á. Ã". Ã. ó. ó. ¯. à. Fortran. !. ¹. Ñ. ßÞ. A. tmp. «. ¶. :. Ð. EbE. ó. 2. Ð. Ð. à ²±°. úû. ¶. 18). ¼. u. u. u. ƒ. q. q. }. y. „. x. a €. ‡†. sr. w4. op. sr. |{ a. t. pz. t. n am. ~ ‚. 4. &. * . ³ý. t. j i. y. g z. sr. € q. }. g ¥¦. £¤. ³. . %. ¼. °. © °¯. ƒ. q. ˜. w. ‰w. ‰. „. ª. Œ. ­e. a. µ. ²±. f®. “. ¥¦. ³´. ¡ . ¬. «. §¨. i. i. Ð. !. ¹Ã. Ã. Ñ. 1 Ý. «. /. . ËÏ. . á. w. w. þ. 0¬. #. .. 2. ³ý. . í. Ö. %. ©. x. . }. a z. f. e“. ¸. ed. ¾½. c. „g. ‰. y. x(nn(i, m)). u. q. ƒ. ª » ¼. ¢‹. ¹º i. ·. ¶. §¨. . Ã. Ã. . º. ». × >. ¯. . ø. =. á®. þ. ². õ. x. ³ý. . ×3. Ã". ó. º. . ¼. °. ¼. ". p. v. ¢‹. ¡ . Ÿž. i. &. ². ¼. x(nn(i, m)). tmp. a. . ›i. x(nn(i,m)). Œ. a. œ. š™. ˜“ f. e. —–. Œ •. 2. ×. ». (. ÿ Ð. ¶ =. à Ô. A. ”. . ó. ¶. Ý. á. . Ã". ¹Ã ¯. &. ¯. ß =. *. à þ. EbE. Ž. í. Ö. . ¼ ó. ƺ. ^. Õ. Aelem.. ’‘. . v‚. v. i. Ž. W‹. Š. ø. . . , ¹. +. Ã. A. e“. Œ. Œ. ˆf. . ø. á. ® õö. 2. . Ò. . ¶-. ¯. &. ¯. ß. Ã(. . ó. ƺ. ^. =. EbE. x. . }. ‰. e d. . . ¹. +. belem.. u. u. ƒ. ‚}. ¼. . í. Ö. ) ¼ü. nelm. Õ. þ. þ ³ý. . %. ¼. b. v. v. Aelem.. Ã. ». ×. &. á. nelm. Ã(. ó. º. Ã". ¹Ã ¯. A. 3. c 2010 Information Processing Society of Japan.

(9) Vol.2010-HPC-127 No.2 2010/10/13  .  . .  . . IPSJ SIG Technical Report. . r(:) = 0.0d0. „ f. ed. “. ‡ —–. ed. }‡ b.

(10). do m = 1, nelm r(:) = 0.0d0. do j = 1, 9. {Initialize r(k) (k = 1, . . . , N )}. tmp = r(nn(j, m)). do m = 1, nelm. do i = 1, 9. do i = 1, 9. tmp = tmp + Aelem. (j, i, m) ∗ x(nn(i, m)). tmp = x(nn(i, m)). enddo. do j = 1, 9. r(nn(j, m)) = tmp. r(nn(j, m)) = r(nn(j, m)) + Aelem. (j, i, m) ∗ tmp. enddo. enddo. enddo 3 A Fortran-like code of matrix-vector multiplication using poorly simple exchange between indices “j” and “i”.. . enddo enddo . 2 A Fortran-like code of matrix-vector multiplication using temporary variable “tmp”.. r(:) = 0.0d0 do m = 1, nelm do j = 1, 9.  .  . . . . . . t u. y. ˜. Œ. sr. œb. a. e ‡. €.  . © u q. y g a. a. a z. f. ed. • “. . %. #. Ž. ". ¡ . $. !. ®. ‚. q. ¨. a. Œ. ½ s. 4. .. 6. *. “. ¡. +. 7. ¢. 23. 01. /. ,. (). enddo. ƒ. q. q. q. g Œ. j f. ©. -. ‚. q ‰w. :. =. b. >. ¡ . ;. 9.

(11). enddo. e. . a. gf. a. œ. ½. ˜. 8. ˜µ œ. hg. œb. i. ?. i. ‘ <. Fortran. i. 5. Fortran. &'. i. ”. i. ‡ —– ¸. a. r(nn(j, m)) = r(nn(j, m)) + Aelem. (i, j, m) ∗ x(nn(i, m)). x. }. 3. ‹. Ž. ¢‹. Š. do i = 1, 9. q. x. }. . a. pz. u. tmp. qc. j i. ‚. ›. 2. . A. . . . 3.3. elem.. |. enddo. n. n ƒ. q ‰. h‡. ‰ c. @ C B. ³´. ¥ F E. 5. A. &'. § u. s J. &'. i. ›i. E. n. . ‰. }. w a. m D. o. š™. €. K. e“. a L. ¹º. ¢. F. a. ˜“ f. g. E. i. &'. i. Aelem. (j, i, m). 4 A Fortran-like code of matrix-vector multiplication according to row-wise reference of A elem. .. q. ‰w. ½. H. e. ­. gf. g. hg. h. ‰. sr € F. j. . I. ‚}. t a. a. i. Aelem. (j, i, m). o. ˆf. o. mi. ‡. G. D. d. ed. a. a. am. ½. ¸. 3. t u e. Œ. f. T. µ S. Q. e“. d. . sr d N. M O R. P. © n. u. 7). g ½. s. f. d. .. f. v. 3. elem.. q. q. } a. Œ f. a. x. “. ¡ O. y. rw. 01. q. Z. £¤. ,. ‹. X. ³´ 5. Y. i. i. E. q. a. ›. !. 7. ¢. \. ,. \. ,. ‹. X. ³´. 1. f. K. K. e“. a. h‡. [. ¡. Œ¡. š™. 4. i ‰ e f. T. x. ]. e“. ›. !. rw. 01. c. a. `. ¥. ^. a. a. ]. b. i. _. i. (1). z. q. . g. •. ®. n o. ‹. |}. mi. J. 1.6GHz. z. z. s. r. Intel Itanium2. {. z. 4.. si. – Primequest 580 (CPU. 4Tbytes OS RedHat Enterprise Linux AS release 4). e g. f. d. z. f. i. ® °¯. h. w. a. f. ²±. ‡ “. L. [. Ž. ". o. m. l. j. k n. ‘. ”. v 4. Fujitsu Fortran Driver Ver.2.0. Œ. –. ‰. =. j. Œ‹. e. . a. j. i. Bi IDR(s). q. „. ‰w hi. IDR(s). p. Ž. ". tu. Ÿž. tu. Ž. ". r. 01. pq. ¡ . Cavity. Œ. ½. wa. g Œ. f. b. 2. g. ¡ . ¹º. F. ˜“ f. e“ 7. ¢. 2. e. d. o. V. O. a. ¾½. W. q. 5. ½. a D. mi. N. v. €. e“. a. Œ. q¦. A. }‡. ‰. U. 4. 5. elem.. 2. q. q. . ‰w U. a. ‚­. q. ®½. g. A. v. i ›. 3. c 2010 Information Processing Society of Japan.

(12) Vol.2010-HPC-127 No.2 2010/10/13  .  . .  . . IPSJ SIG Technical Report. ¯. }. g Œ 4. 3. ³´. . 5 2.  8 7. 6 ;. ‰w. :. f. e“. Œ. ­. a {. L. 9. r. <. v q. q. a. Œ f “. r. 01. >. ^. @l. j. i. _. 5. q. C. q. q wa. Œ f “. BC. 0. . Š. 01. @l. j. 0. . Š A. A. 5. 8. g. ½. a. Œ. ½. ½. Œ T. f. f E. F. E. @l. j. ¥. Ž. ". v. 1. ". q. ‰. IDR(s = 4). SR16000. a. 2. q ‰ e f. T. b. W O. y H. q. L. option. I. pq. ¥ J. q. (priority). K. ¡ \. Z. £¤. ,. ‹. X. ³´ Y. -. -. (level). q. q x ¨. ¨ s .. ¡ j. 01. /. , Y. q. q ½. g³. a. (. L. 0. . Š. M. K . Y -. q. q ¨ ½. g³. a. s .. (. ¡. 0. Š. . 01. /. , -. -. x ¨. f. .. “. L. e“. ½. U. a. Œ. q¦. q. q. q ¨ s. W. . ¡. N. O. y. j. k. j. 01. /. ,. i. 5. ”. v. Y. . ¯w. ª. Œ. . . f. L. Ž. ". ¥. i. Œ f. 4. “. e“. ]. P. C. 23. a. O. v. {. {. z. z. z. t. n. s. o. J. si. J. mi. . ‹. |}. q. ). N. j. 01. H. 4. . ›. 1. „›. (. b. Œ. lev.3. Q. f. (3). -. lev.1 lev.2. z. 128Gbytes OS IBM AIX 5L V5.3). z. (1) (2). ª. r. 4.7GHz. q›. ¨. k. ®. POWER6. ®. x L. . z. rw. 01. – SR16000(CPU. ©. Fortran. -. (2). x. •. IDR(s). PrimeQuest. w. G. . solv.time mat.time. “-O0” “-Kfast”. ‰. D. q¦. lev.. 5 A Fortran-like code of matrix-vector multiplication using temporary variable “tmp” and according to row-wise reference of Aelem. .. ‰. ?. “ ?. . prio.. enddo. IDR(s). D. “. „. q. E. opt.. enddo. ) q. „. i. i. „. 2. r(nn(j, m)) = tmp. –. ). 01. >. =. j. k. *+. j. i O. PQ. ‹. enddo. SR. gettimeofday( ). D. tmp = tmp + Aelem. (i, j, m) ∗ x(nn(i, m)). y. (. O. 580 (. do i = 1, 9. y. tmp = r(nn(j, m)). a. 1. q. ƒ. IDR(s). ƒ. do j = 1, 9. f. o. 2. 4.1 IDR(s). ½. |“ Œ. u. do m = 1, nelm. ga. 1. ©. r(:) = 0.0d0. i. ©. ©. ©. {. ¯. ¯. ª. }. q¨. ª g. 4. o. r. R. a. §¨. ‚ u x y. }. g. j i }. q. e“ j. Ž. /S. ¢‹. a’ €. Œ z. ŒŽ. € Š. a. Y. ). . „›. N. © {. ¯. ¯. ª. }. q¨. ª g. 4. o. r. R. a. §¨. 3. ©. ©. ¥¦. lev.3. q. lev.4. q. (4). n. o. mi. s J. ‹. |}. :24Gbytes. D. {. i. si. r. . :2.93GHz. z. ®. :Intel Xeon X5570. q. q. „ ­. ½. Œ. ­. ­. K. Š. . \. ¥ v. 1.0. „g. „. ¨. „. q¡. q x. w. i. ½. “ratio-1”. -. q ¶. E. g Œ. 2. „. E. 1. f. Ž. ". . OS:RedHat Enterprise Linux 5.2. „. „ f “. {. ¡. [ ,. ‹. X. ³´. ^. E. . Š. \. i. i. _. g ½. “ratio-3”. w. a. Œ. ­. K. ,. w. f. ²±. “ratio-2”. q. q. q. q. q. °¯. Ž. " -. ­ s .. (. ¡. (. 0. Ž. ". 01. /. ,. Š. . '. ½. (lev.1). q. ¨. „ ½. ga. Œ. ½ £¤. \. g. Œ. 1.0. q. q. g a K. Œ¡. . . ¯w. ª . . f. L. . Ž. ¥. ". “-O0” “-fast”. Œ. Intel Fortran Compiler Ver. 11.0. ®. i. –. D. ›. rw. 01. – Nehalem CPU –. 5. (loop-unrolling). z. x. (3). lev.1. z. f Ž. ". i. 2. ¦¥. Ž. ". Œ. . ¥. (. 3. q. f. L. . ¯w. ª . L. •. q. D. w ²±. “-O0” “-Oss”. z. °¯. –. Fortran. ¥. Hitachi. ®. –. lev.1. © u. q ‰ w Œ. Œ 3 E. ¥. T. v. '. q Œ f “ E. @l. m n. m. ½.  J. . . . .  .   ". . f x J. ¥. !. c¶. Œ. m. wa. ½. . . i. .  . . . ½ d. f v. [. . . Š. ‹. vc. i. f . @l. i. q. q. q. ‰ 8. w. a. Œ. ½. Œ. D. T. f “. E. @l. j. ¥. E. @l. j. >. v. Bi IDR(s = 2). j. >. ,. n. Bi IDR(s). q. q. w. Œ m. PQ D. 4. }. f. Bi IDR(s). j. i. _. ½. SR. ŒŽ. a. ^. U. „g. J. w ª‹. s. i. 5. Bi IDR(s). ‚. „ i. u Š. . V. ¥. ©. |. q. q. °q. „. w. ½. Œ. m z. ². f. (. [. ). j. j. '. s = 1, 2, 4, 8. 7. w. 8. ˜a. $. j. %&. s. 8. w. J. Re = 103. 6. q. . Reynolds. . . #. Bi IDR(s). ‰. D. i. 8. a. Nehalem. f. . ¸. ŒŽ. ½. Œ . m. IDR(s). ¶. E. a. >. 3. 4.2 Bi IDR(s). ‚ q. g. w. 100. “. “ E. vw. ½. —. Œ. ‰. . ∆t = 0.01. f. f. {. . Š .

(13). v. . ˆi. =. §. i. z. . . 1.953×10−3. M. e. . a.

(14). D. b. 32. u, v = 0). q. }. „g. x. tu. g. ˜. ‰w. (non-slip. q. q. u=1. d v. Cavity. Ÿž. 2. ". e f. F. z. 1. q. q. w ½. 0. /. f ¡ . ,. .. ~. -. *+. j. %& ,. ||r n+1 ||2 /||r 0 ||2 ≤ 10−8. „g. ¨. w. 2. 5. c 2010 Information Processing Society of Japan.

(15) Vol.2010-HPC-127 No.2 2010/10/13  .  . .  . . IPSJ SIG Technical Report 1 Performance improvement of IDR(s) method by some implementations on PQ. opt.. prio.. lev.. col.. 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4. -O0. row. -Kfast. col.. row. col.. 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4. col.. mat.time [sec.] ratio-3 116.32 1.000 110.42 0.949 98.65 0.848 92.27 0.793 107.98 0.928 107.64 0.925 66.46 0.571 69.25 0.595 7.33 0.063 7.27 0.063 7.23 0.062 7.30 0.063 5.68 0.049 5.65 0.049 5.87 0.050 5.88 0.051. q f. ed. ‡ 6 . †. O. y. @l. i q ‰. g e. ¸ f. T. K. K. œb. ½. a. Œ. e“. ¡. (. ¡ k. \. £¤. \. ,. ,. ‹. X. ³´. . E. a. h‡. „. E. @l. i. . v. Y. ' -. q. q. q x. . x. ¨. ¨. „. ¨. ‰ ­. š. s. ¸. ‡. f. ed. ‡. .. 6. L. ¡. . †. 01. /. k. ¥. ¥. j. ,. i. . Y. lev.4. -. -. q. . . •. j. E. q j. •. IDR(s). h‡. “. 5. -O0. solv.time [sec.](ratio-1) ratio-2 139.48 1.000 133.25 (1.00) 0.955 121.57 0.872 115.17 0.826 130.86 0.938 130.79 (1.00) 0.938 89.34 0.641 92.24 0.661 8.15 0.058 8.11 (0.061) 0.058 8.04 0.058 8.12 0.058 6.51 0.047 6.50 (0.050) 0.047 6.71 0.048 6.70 0.048. q. f E. }. g. ˆ. 4. q O. y. q . x. ‰. ‰. g e. ½. U. e. ¸ L. ¡. (. ¥. k. \. £¤. \. ,. ,. ¥. j. v. i. v. Y. ' -. -. ‚ u. q . } ‡. f. ed. a 6. 9 . †. ž. D. . j. E. j. E. r. 01. m. 01. /. ,. i. i. ‰. D. T. ¥. j. ¥. j. v. i. v. i. Bi IDR(s). . 8. D. f. Nehalem. ‰w. ‰. ½. . ‰w. IDR(s). g. ½. .. ¡. v. i e  -. -. -. q. q. q. q x. . x. ¨. ¨. „. ¨. „. e. ­. ­. s f. T. .. L. ¡ 01. /. k. ¥. ¥. ,. i. Y. lev.2. Bi IDR(s). q. w. s. 3. ¥. ˜ j. • IDR(s). 6. „. ¨. e. ­. N. ‰w. „. • PQ SR. IDR(s). q. x. ¨. „˜. „ ¸ ¥. 3. q. q. ¨. U. PQ. ©. -. SR. f. T. f. T. K. K. œb. ½. a. Œ ¡ ‹. X. ´³. •. 3. n. E. Bi IDR(s). lev.. row. Œ @l. m. „. E. @l. j. 2. prio.. -Oss. D. i. IDR(s). opt.. row. q. ‰. 1. 2 Performance improvement of IDR(s) method by some implementations on SR.. mat.time [sec.] ratio-3 390.61 1.000 356.61 0.913 338.48 0.867 304.31 0.779 388.86 0.996 354.99 0.909 283.76 0.726 249.64 0.639 33.69 0.086 30.82 0.079 30.18 0.077 27.53 0.070 13.42 0.034 5.79 0.015 13.42 0.034 13.51 0.035. q. Nehalem q. a. >. 6. solv.time [sec.](ratio-1) ratio-2 482.90 1.000 447.56 (1.00) 0.927 430.53 0.892 395.07 0.818 479.57 0.993 446.41 (1.00) 0.924 373.36 0.773 341.06 0.706 31.66 0.066 28.99 (0.065) 0.060 31.74 0.066 29.09 0.060 14.98 0.031 7.33 (0.016) 0.015 14.97 0.031 15.06 0.031. ‰ e f. T. ¥. j. v. . 5.. . . e T. L. L. j. j. K. ž. . ³´. . . . . Y. E. i. . Y. Bi IDR(s). „. ‰. }. . a. f. ed. ‡ 6. †. ž. Y. IDR(s). q. . j •. ‚. q } D. Z. £¤. ,. i elem.. -. ® ‚ u q. q. q. q. q. q. . ¨. ‰ g. L. “ ¡. ³´. @l. i. -. ƒ ¨. ‰. „ s. e“. .. K. ¡ 01. /. ,. 7. ¢. \. ,. i °¯. w. œ. a. a K. ²±. ‡ cf ½. 8. ™. ed. Z. £¤. \. ,. k. Y. i. v. ®i. h. „. c L. {. Aelem.. q. q. ƒ. . a £¤. ƒ. q. h. „. 8. ½. e. a. e. ˜­. ‰w. ¸ f. ™. T. L. {. I l. V. ¥. ¦. E. . l. ¥. ‘. J. i. i. ‘. ƒ „. g ½. a. a. h‡. ‰. g a. ¸. h‡. {. ^. E. ^.

(16). i. _. i.

(17). 0.018. (ratio-1). Y. v a. K. \. Z Y. £¤. ,. ‘. ¡i. ¡ ‹. X. ¥ q K. \. ¡i. £¤. \. d. š™. ˜“ f. ½ ‡. L. V. i. 0.074. h‡. Œ. L. . i œb. a. K. ,. i. . ˜­ a. . 1. . j. k. 01. /. ,. k. q. q. . £¤. q. ‰w. i. } . 4. Aelem.. }. K. \. ¡i. £¤. r. 01. Aelem.. |. 0.016. |{ a. q. œb. a. K. \. ,. hg. T. gf ½. 8. l. 0.065. 01. ‘. q. i. . PQ. ¥. j. l. ¥ i. Y. r. 01. Aelem.. ˆf. .. .. f. L. Z. £¤. ‰w. SR. ½. Œ. s. ¸. œb. a. K. A. EbE. g. ¡ ‹. X. ³´ \. ,. •. a. a ‡. •. q. c. Aelem.. he. h‡. f. ™ 6. c 2010 Information Processing Society of Japan.

(18) Vol.2010-HPC-127 No.2 2010/10/13  .  . .  . . IPSJ SIG Technical Report 3 Performance improvement of IDR(s) method by some implementations on Nehalem. opt.. prio.. lev.. -O0. col.. 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4. row. -fast. col.. row. solv.time [sec.](ratio-1) ratio-2 41.97 1.000 39.18 0.934 36.63 0.873 33.95 (1.00) 0.809 42.24 1.007 40.56 0.966 32.07 0.764 29.26 (1.00) 0.697 4.73 0.113 4.71 0.112 4.70 0.112 4.71 (0.14) 0.112 4.18 0.100 3.55 0.085 3.77 0.090 3.53 (0.12) 0.084. 4 Performance improvement of Bi IDR(s) method by some implementations on PQ.. mat.time [sec.] ratio-3 32.57 1.000 29.85 0.916 27.28 0.838 24.67 0.758 32.75 1.006 31.08 0.954 22.76 0.699 20.10 0.617 3.64 0.112 3.62 0.111 3.63 0.111 3.63 0.111 3.00 0.092 2.48 0.076 2.70 0.083 2.46 0.076. opt.. prio.. lev.. col.. 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4. -O0. row. -Kfast. col.. row. mat.time [sec.] ratio-3 439.42 1.000 402.60 0.916 381.68 0.869 350.49 0.798 439.59 1.000 401.09 0.913 319.99 0.728 282.23 0.642 34.10 0.078 31.06 0.071 33.95 0.077 31.06 0.071 15.08 0.034 6.48 0.015 15.75 0.036 15.29 0.035. ‚ œe. a. ½ G. /. I. ¡. . . o. 12. 0. .. . i. i. -.  4. f. d v. 7.  6. !. . . . 8. ž. 5. i. i. i. . . i. . ©®. ©°. ©. z. j . u. D. ?. . „. 9. o. .  @. >. B. 01. C. A. <. =. <. :;. . ". . i. i. i. D5-6 pp.1-4 (2003) CAE. E. 3. j. ³´. . . j. ŒŽ. . 58. . . 9). ©. E. . ¯. ¯. 4. s. f. ±. G. F. H. i. i. ©. ©. z. q. ¯. œe. R. G. z. Q. P 4. O. . o. . L. ¡.

(19). j. ³´. . . . i. ‘. i. K. N M. L. J. I. f. V. !. TU. . rS. h. i. i. i. i. . z. q. e. . P. W. . =. Y. j. ³´. . . X. J. I. . i. K. R. G. f. 7. 7. . ¡. !. TU. 8. 8. 01. !. . rS. h. . i. . ". . i. . i. „ˆ. .

(20). e“. L. . j. j. %&. a. K. ž. 2. >. V. ž. . i. Y. E. i.  . (2001) 10) H. Okuda, K. Ohshiro and T. Atsugi: Data-parallel computation of EBE finite element method for air/water/soil coupled systems, Computational Mechanics, Vol.23, pp.158-163, (1999). 11) EBE (B ) Vol.65 No.640 pp.3869-3876 (1999) 12) SMP Clusters Element-by-Element Hybrid 14 pp.347-348 (2001) 13) Element-by-Element Trans. of JSCES Paper No.20070022 (2007) 14) Element-by-Element Matrix Storage Free Vol.11 pp.483-484 (2006) 15) IDR(s) Vol.19 No.3 pp.329-350 (2009) 16) Bi IDR(s) ( ). q. q. q. j •. 1) E. Barragy, G. Carey: A parallel element-by-element solution scheme, Int. J. Num. Meth. Engrg., Vol.26, pp.2367-2382, (1988). 2) G. Beer, I. Smith and C. Duenser: Element-by-element techniques and Parallel Programing in The Boundary Element Method with Programming, Springer Vienna, (2008). 3) J. Erhel, A. Tranard and M. Vidrascu: An element-by-element preconditioned conjugate gradient method on a vector computer, Parallel Computing, Vol.17, pp.10511065, (1991). 4) IDR(s) pp.616-619 9 (2010) 5) T. Hughes, I. Levit, J. Winget: An Element-by-Element Solution Algorithm for Problems of Structural and Solid Mechanics, Comput. Meths. Appl. Mech. Engng., 36, pp.241-254 (1983). 6) CIVA 19 (2005) 7) (2008). Level Set. z. 8). solv.time [sec.](ratio-1) ratio-2 473.68 1.000 436.91 (1.00) 0.922 416.04 0.878 385.84 0.815 474.30 1.001 435.88 (1.00) 0.920 355.19 0.750 316.69 0.669 35.53 0.075 32.38 (0.074) 0.068 35.23 0.074 32.35 0.068 16.39 0.035 7.75 (0.018) 0.016 17.15 0.036 16.60 0.035. z. e. . P. Z. =. ]. [. 9. /. (. @. 81. . a. ^_. \. %. j. #. . b. `. i. i. f. . . . i. i. i. . ©. ®. c. q. q. ‰. ¨. H. H. D. s. s. d. r. r. ,. 9. f. e. i. i. i. f. z. P. Z. ]. [. L. /. (. @. ¥. j. \. %. j. #. i. i. W. :. e“. f. €. 7. !. TU. 8. 01. . g. D. i. i. i. . i. z. g. œe. a. ½. Œ. . x. . L. . . k. j. ³´. . . -. . . . . . –. J. . i. . z. q. q. ˜. P. R. W. m. D. ]. h. h. o. 01. . l. Ž. j. %&. N. jk. ž. . . j. i. n. . i. i. 1. ¯. y. . #. f. $. v. [. . . ‹. !. . i. . ". i. . j. ©. ). p. f. . TU. i. i. i. i.  . ‹. Ž. z. . . q. ¯. x. . . . *. œe. a. . d. v. (. j. ³´. . . F. . '. %&. . . . i. . i. s. z. q. q. „ˆ. ­. i ©. . p. q. D. f. h. 9. ¶. w. f. e. u. j. -. ž. . . j. v. t. Ur. . i. i. °. ¯. ¯. ª. y. f. o. ,. +. 7. c 2010 Information Processing Society of Japan.

(21) Vol.2010-HPC-127 No.2 2010/10/13  .  . .  . . IPSJ SIG Technical Report 5 Performance improvement of Bi IDR(s) method by some implementations on SR. opt.. prio.. lev.. -O0. col.. 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4. row. -Oss. col.. row. solv.time [sec.](ratio-1) ratio-2 141.05 (1.00) 1.000 134.39 0.953 121.14 0.859 114.00 0.808 131.43 (1.00) 0.932 131.06 0.929 84.83 0.601 87.96 0.624 8.72 (0.062) 0.062 8.68 0.062 8.69 0.062 8.68 0.062 6.91 (0.053) 0.049 6.94 0.049 7.14 0.051 7.17 0.051. 6 Performance improvement of Bi IDR(s) method by some implementations on Nehalem.. mat.time [sec.] ratio-3 130.97 1.000 124.30 0.949 111.06 0.848 103.92 0.793 121.36 0.927 120.99 0.924 74.75 0.571 77.89 0.595 8.17 0.062 8.13 0.062 8.14 0.062 8.13 0.062 6.36 0.049 6.38 0.049 6.59 0.050 6.60 0.050. opt.. prio.. lev.. -O0. col.. 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4. row. -fast. col.. row. mat.time [sec.] ratio-3 36.49 1.000 33.36 0.914 30.35 0.832 27.76 0.761 36.35 0.996 34.58 0.948 25.37 0.695 22.52 0.617 4.09 0.112 4.12 0.113 4.10 0.112 4.10 0.112 3.07 0.084 2.99 0.082 2.81 0.077 2.79 0.077. block-ilu preconditioner, Abstract of ICCAM 15th Int. Congress on Computational and Applied Math., Leuven, July 05-09, (2010). 26) M. Wang, T. Sheu: An element-by-element BiCGStab iterative method for threedimensional steady Navier-Stokes equations, J. of Computational and Applied Math., Vol.79, pp.147-165, (1997). 27) J. Winget, T. Hughes: Solution algorithms for nonlinear transient heat conduction analysis employing element-by-element iterative strategies, Comput. Meths. Appl. Mech. Engng., Vol.52, pp.711-815 (1985). 28) VII– – (2002). ©. 17) Y. Saad: Iterative methods for sparse linear systems (2nd edition), SIAM, Philadelphia, (2003). 18) IT Text HPC (2009) 19) T. Sheu, C. Fang and S. Tsai: Application of an Element-by-element BiCGStab iterative solver to a monotonic Finite Element Model, Computers and Mathematics with Applications, Vol.37, pp.57-70, (1999). 20) P. Sonneveld, M. van Gijzen: IDR(s): a family of simple and fast algorithms for solving large nonsymmetric linear systems, SIAM J. Sci. Comput., Vol.631, No.2, pp.1035-1062, (2007). 21) P. Sonneveld, M. van Gijzen: An elegant IDR(s) variant that efficiently exploits biorthogonality properties, Depart. of Applied Math. Anal., TR08-21, Delft University of Technology (2008). 22) OpenMP (2006) 23) M. van Gijzen: Iterative solution methods for linear equations in finite element computations, PhD thesis, Delft University of Technology, (1994). 24) H. van der Vorst: Iterative Krylov methods for large linear systems, Cambridge University Press, (2003). 25) N. Vannieuwenhoven, K. Meerbergen: An element-by-element algebraic multilevel. solv.time [sec.](ratio-1) ratio-2 40.24 1.000 37.08 0.921 34.06 0.846 31.49 (1.00) 0.783 40.07 0.996 38.32 0.952 29.10 0.723 26.23 (1.00) 0.652 4.50 0.112 4.54 0.113 4.51 0.112 4.51 (0.14) 0.112 3.49 0.087 3.23 0.080 3.40 0.084 3.20 (0.12) 0.080. {. z. z. D. ¯. ª. . *. 4. ². 4. o. . Vj. k. o. . ž. . . . i. i. . . i. . i. ©. 1. . f. . i. z. e. . P. . G. :. f. . =. ¡. Ÿ. . . j. 01. 01. 01. J. I.

(22) . i. i. . ". . ". K. i. {. ¯. ª. 4. ². 4. G. f. [. ¡. j. 01. „‹. *. œe. P. . i. i. i. . 8. c 2010 Information Processing Society of Japan.

(23)

参照

関連したドキュメント

The answer, I think, must be, the principle or law, called usually the Law of Least Action; suggested by questionable views, but established on the widest induction, and embracing

この節では mKdV 方程式を興味の中心に据えて,mKdV 方程式によって統制されるような平面曲線の連 続朗変形,半離散 mKdV

Henk, On a series of Gorenstein cyclic quotient singularities admitting a unique projective crepant resolution, in Combinatorial Convex Geometry andToric Varieties (G.. Roczen, On

— Algebraic curves, finite fields, rational points, genus, linear codes, asymp- totics, tower of curves.. The author was partially supported by PRONEX #

Existence of weak solution for volume preserving mean curvature flow via phase field method. 13:55〜14:40 Norbert

Based on these results, we first prove superconvergence at the collocation points for an in- tegral equation based on a single layer formulation that solves the exterior Neumann

The commutative case is treated in chapter I, where we recall the notions of a privileged exponent of a polynomial or a power series with respect to a convenient ordering,

Furthermore, we also consider the viscosity shrinking projection method for finding a common element of the set of solutions of the generalized equilibrium problem and the set of