• 検索結果がありません。

密行列用に行列要素を

書き換え可能なゲート素子を持つデバイスを用いた行列計算専用集積回路の設計

書き換え可能なゲート素子を持つデバイスを用いた行列計算専用集積回路の設計

... 共有メモリでは、プロセッサの数が多ければ多いほど、データのアクセス量が多くな り、その通信によりプロセッサの待ち時間が増え、計算時間増やす要因となってし まう。そのため、メモリとの通信極力減らし、メモリ使わずプロセッサの中で 演算ができるようし、データ待ち時間なく処理できるようする必要がある。ま ...

175

FPGAを用いた行列計算専用プロセッサの設計

FPGAを用いた行列計算専用プロセッサの設計

... 評価行うは大別して、ソフトウェアでエミュレーション行う方法、あるいは実際 対象のアーキテクチャハードウェアとして製作する等の手法が取られているが、 ソフトウェアエミュレーションは実行速度が非常遅い場合が多く、サンプルプログ ...

139

インテル MKL を使用した小行列乗算の高速化 インテル MKL チーム

インテル MKL を使用した小行列乗算の高速化 インテル MKL チーム

... インテル® Xeon® プロセッサー E5-2699 v4 上での パックド API のパフォーマンス システム構成: ハードウェア: インテル® Xeon® プロセッサー E5-2699 v4、2x22 コア、2.20GHz、64GB RAM。オペレーティング・システム: Red Hat* Enterprise Linux* 7.2。ソフトウェア: インテル® MKL 2018。性能に関するテスト使用されるソフト ...

30

空間的自己相関モデルにおける距離行列のべき数の推定と地価決定要因分析への応用

空間的自己相関モデルにおける距離行列のべき数の推定と地価決定要因分析への応用

... 空間要因は ρ , α ともに全期間で有意であり、住宅地では バブル期はさんで空間的な影響が一貫して存在し、FIT の上昇や寄与率からも地価の決定大きく影響しているこ とがわかる。したがって、住宅地では常に周囲の地点の地 価参照して地価が決定されるというメカニズムが働いて いるといえる。また、α の推定値は 1.5~2.3 の範囲で安定 ...

6

新たな予測行列に基づく診断統計量

新たな予測行列に基づく診断統計量

... してその相関行列新規導入したうえで,両者の関数としていくつかの代表的な診断統計 量の新たな表現提案している。 しかしながら,てこ比基づく行列形式の基本的な診断統計量の成分については,統計的 な意味付け不十分な部分があった。観測値の影響力評価するための診断統計量構成す ...

18

2 背景 (1/2) 大規模化, 複雑化, 多様化するハイエンド計算機環境の能力を充分に引き出し, 効率的なアプリケーションプログラムを開発することは困難 有限要素法等の科学技術計算手法 : プリ ポスト処理, 行列生成, 線形方程式求解等の一連の共通プロセスから構成される これら共通プロセスを抽出

2 背景 (1/2) 大規模化, 複雑化, 多様化するハイエンド計算機環境の能力を充分に引き出し, 効率的なアプリケーションプログラムを開発することは困難 有限要素法等の科学技術計算手法 : プリ ポスト処理, 行列生成, 線形方程式求解等の一連の共通プロセスから構成される これら共通プロセスを抽出

... • 有限要素法等の科学技術計算手法: – プリ・ポスト処理,行列生成,線形方程式求解等の一 連の共通プロセスから構成される。 – これら共通プロセス抽出し,ハードウェア応じた最 適化施したライブラリとして整備することで,アプリ ケーション開発者から共通プロセス関わるプログラ ミング作業,並列化も含むチューニング作業隠蔽で きる。 ...

54

3061 チュートリアル Fortran FORmula TRANslation Fortran90/95 Fortran90/95 1 HP 有限要素計算における全体剛性行列の作成法 疎行列データ構造の視点から 永井学志橋本一輝 1 はじめに FEM SIMD FEM PDE FEM FEM FE

3061 チュートリアル Fortran FORmula TRANslation Fortran90/95 Fortran90/95 1 HP 有限要素計算における全体剛性行列の作成法 疎行列データ構造の視点から 永井学志橋本一輝 1 はじめに FEM SIMD FEM PDE FEM FEM FE

... PUBLIC 宣言です. program5 で公開しているものは,上 述した「ブツ」の型定義 ADT_c と,「~する」の定義 initialize , do_something, finalize のみです.不完全 ながら,前者はオブジェクト指向でいうところのクラ ス , 後 者 は メ ソ ッ ド 対 応 し て い ま す . な お , Fortran2003 ...

5

動関数が反対称の性質を持つことになる.(2.4.4) の行列式を Slater 行列式とよぶ.(2.4.1) の波動方程式を解くためには,(2.4.4) の Slater 行列式を用いた波動関数 Φ e に関するエネルギー汎関数の最小値を求めればよい. その際に, 一電子軌道に関する極値 ( つまり

動関数が反対称の性質を持つことになる.(2.4.4) の行列式を Slater 行列式とよぶ.(2.4.1) の波動方程式を解くためには,(2.4.4) の Slater 行列式を用いた波動関数 Φ e に関するエネルギー汎関数の最小値を求めればよい. その際に, 一電子軌道に関する極値 ( つまり

... XANES 計算する場合である. 図 4(b)は有機分子の Coronene の C-K 端の実験 [16]と計算の比較示している.計算は第一原 理 PWPP 法(CASTEP コード)用い,Coronene 分子一個大きなスーパーセル入れて計算行 った.Coronene は 3 つの炭素サイト ...

34

インドネシア経済危機における所得分布の変化  ―社会会計行列からの接近―

インドネシア経済危機における所得分布の変化 ―社会会計行列からの接近―

... ており,行方向見れば,6列の1行と2行とそれぞれの国内生産における 付加価値が記され,海外部門からの要素所得(12列の1行と2行)加えて合 計(13列の1行と2行)それぞれの要素所得の配分が示されている。労働部 門は,37×37部門表において,2つの雇用形態別(雇用,自己雇用)の4つの ...

26

カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し 評価に使用する 対象計算アルゴリズム 固有値計算 ( 実数密行列 標準固有値計

カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し 評価に使用する 対象計算アルゴリズム 固有値計算 ( 実数密行列 標準固有値計

... • 行列の固有値計算では行列簡単な形式(形状)変換し、それ中間形式と して取り扱います。理研の研究チームは、帯行列(ゼロでない要素が対角線上 帯状分布する行列中間形式採用することによって、前処理の時間の ...

26

ハードウェア記述言語を用いた行列計算専用プロセッサの設計

ハードウェア記述言語を用いた行列計算専用プロセッサの設計

... このよう,代入される値の計算と代入同時に実行すると明らかシミュレー ション結果が一意定まらない. VHDL では,同じ回路どのシミュレータ使っ ても同じシミュレーション結果が得られるよう,代入される値の計算と代入が別々 の時刻で行なわれる.まず,信号代入文の右辺の式すべて計算して,代入される ...

89

ハードウェア記述言語を用いた行列演算専用回路設計

ハードウェア記述言語を用いた行列演算専用回路設計

... port 宣言 し,それと同じ signal も宣言する.そして,その port 使われている信号並べた DUT 文 begin 文の後挿入する.proecss は入力ポートにたいする信号記述する.このテストベン チの VHDL ファイルもテストするファイルリンクしているので,必ず ...

73

超高速行列演算チップの作成

超高速行列演算チップの作成

... したら固有値固有ベクトル求めることができるか考えるのが本研究の目的であ る。そしてその過程が正しいか確かめるため C 言語用いプログラムでシミュレー ションすることした。これにより固有値固有ベクトル求める際の過程がわかり、 どの部分が重要であるか、またこの過程は時間がかかるため専用チップ上で行うよ ...

81

pthreadによる行列計算の高速化の試み

pthreadによる行列計算の高速化の試み

... pthread による行列計算の高速化の試み 231 自己列の先頭アドレスを a とすると EA= α+i ホ n+j でなされる。コンパイラがコードから得られる情報を用い て最適化しない場合には、配列の要素 1個毎にこの計算が なされる。もし、配列のアドレス計算の高速化が計られれ ば、全体の処理時聞は短縮される。 C 言語では、ポインタ型の変数が利用できるので、イン[r] ...

3

行列計算専用大規模集積回路の開発

行列計算専用大規模集積回路の開発

... となる。このため、アルゴリズム上並列化が可能でも、実際のシステムでは十分 分散処理が出来ないでいる。並列処理が可能なスーパーコンピュータでも、この メモリから各プロセッサデータ送る時のオーバーヘッドが大きな問題なって いる。この問題はプロセッサ数が多くなる程、顕著現れてくる。この問題は並列 ...

82

群論モデルにもとづく正方行列枠中の要素パターンに対する良さと複雑さ

群論モデルにもとづく正方行列枠中の要素パターンに対する良さと複雑さ

... おいて 複雑さは群化の程度意味するラン数が多くな れば高まるが,良さはラン数の影響受けないこと 明らかした。また van der Helm & Leeuwenberg (1996 [Figure 11D])は反復パターンにおいて塊構造が増える と良さが増加すること示した。このようラン数や塊 ...

10

分のゲージ行列である. γ µ は, 式 2 に示すような x の行 列である. なお, いずれの物理量も複素数で表される. γ i i γ 3 i i i i i i γ 2 γ よって, 式 は, 隣接する 8 方向の格子点上の 3x のス ピノルに, 格子間の 3x3 のゲージ行列と x のガ

分のゲージ行列である. γ µ は, 式 2 に示すような x の行 列である. なお, いずれの物理量も複素数で表される. γ i i γ 3 i i i i i i γ 2 γ よって, 式 は, 隣接する 8 方向の格子点上の 3x のス ピノルに, 格子間の 3x3 のゲージ行列と x のガ

... 3.2 GPU のスレッドへの処理の割り当て のスレッドへの処理の割り当て のスレッドへの処理の割り当て のスレッドへの処理の割り当て 各 GPU スレッド 1 つの格子点割り当てて処理行う. このとき,X 軸方向の格子点連続したスレッド割り当 てるとこで,SoA 形式で保存したスピノルおよびゲージ行 ...

7

表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 ( 坂本 ) 表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 坂本 紫 Simulation of the queue by the spreadsheet Reproduction

表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 ( 坂本 ) 表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 坂本 紫 Simulation of the queue by the spreadsheet Reproduction

... Key Words:Queueing theory, Littleʼs formula, Theme park, Spreadsheet, Excel 論文要旨 文系学部生は初年次Excel学ぶ機会が多く,Excel用いて時系列データの処理やシミュレーション ができるようなれば,卒業論文や大学院での研究,就職後のデータ解析業務等において役立つと考える。 ...

17

のようになる. A ˆ (= E ˆ / Q ˆ ) などは流束ジャコビアンである. この際, 未知量を物理量 Q ˆ ではなく, その時間変化に対応する増分 Q ˆ (= Q ˆ n+1 Q ˆ n ) ととると収束判定に都合がよい.1 つの行列要素 A ˆ や B ˆ が方程式の数のマトリックス

のようになる. A ˆ (= E ˆ / Q ˆ ) などは流束ジャコビアンである. この際, 未知量を物理量 Q ˆ ではなく, その時間変化に対応する増分 Q ˆ (= Q ˆ n+1 Q ˆ n ) ととると収束判定に都合がよい.1 つの行列要素 A ˆ や B ˆ が方程式の数のマトリックス

... 多重格子法は一般ポアソン方程式のよう な単純な楕円型の問題では収束率は 0.1 程度 が得られる.つまり,マルチグリッドサイクル 1 回で残差が一桁落ちる.圧縮性流れ方程式の 基本となる双曲型の方程式の場合では,文献 5 などあるよう収束率は 0.75 程度が得られ ている.これは構造格子,非構造格子どちらの 場合も同じである.しかしながら,粘性考慮 ...

11

Show all 10000 documents...

関連した話題