• 検索結果がありません。

行列の計算

pthreadによる行列計算の高速化の試み

pthreadによる行列計算の高速化の試み

... pthread による行列計算の高速化の試み 231 自己列の先頭アドレスを a とすると EA= α+i ホ n+j でなされる。コンパイラがコードから得られる情報を用い て最適化しない場合には、配列の要素 1個毎にこの計算が なされる。もし、配列のアドレス計算の高速化が計られれ ば、全体の処理時聞は短縮される。 C 言語では、ポインタ型の変数が利用できるので、イン[r] ...

3

2012 年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2012 HPCS /1/24 京 コンピュータにおける疎行列とベクトル積の 性能チューニングと性能評価 南一生 井上俊介 堤重信 前田拓

2012 年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2012 HPCS /1/24 京 コンピュータにおける疎行列とベクトル積の 性能チューニングと性能評価 南一生 井上俊介 堤重信 前田拓

... が高められた.FFB 計算カーネルにおいても, 提案したチューニング手法有効性が確認され,ほ ぼ理論上性能予測値まで性能が高められた事が 分かった.本稿に示した,性能予測手法,チューニ ング手法が,「京」上で色々なタイプ行列と ベクトルプログラムに応用することが期待 できる. ...

9

2011 年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2011 HPCS /1/19 数値計算ポリシーインターフェース付 行列計算ライブラリの開発と評価櫻井隆雄 直野健 片桐孝洋 中島研吾 黒

2011 年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2011 HPCS /1/19 数値計算ポリシーインターフェース付 行列計算ライブラリの開発と評価櫻井隆雄 直野健 片桐孝洋 中島研吾 黒

... さ 中 で 最 優 先 す る も を 設 定 す る . MAXMEMORY,MAXTIME はそれぞれユーザが 許容するライブラリにより確保される最大メモ リ使用量,ライブラリ演算時間を記述する. EPS は解要求精度,PRECONDITIONING は前処理 アルゴリズムを指定する.CPU は演算に使用する CPU 数,SOLVER ...

9

3061 チュートリアル Fortran FORmula TRANslation Fortran90/95 Fortran90/95 1 HP 有限要素計算における全体剛性行列の作成法 疎行列データ構造の視点から 永井学志橋本一輝 1 はじめに FEM SIMD FEM PDE FEM FEM FE

3061 チュートリアル Fortran FORmula TRANslation Fortran90/95 Fortran90/95 1 HP 有限要素計算における全体剛性行列の作成法 疎行列データ構造の視点から 永井学志橋本一輝 1 はじめに FEM SIMD FEM PDE FEM FEM FE

... Fortran (FORmula TRANslation) は半世紀以上歴史を持ち、一部では時代遅れと言われなが らも、今なお数値計算に利用する研究者が多いプログラミング言語です。Fortran90/95機 能や使用例を改めて理解したいという研究者ために、Fortran90/95による近年有限要素 ...

5

カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し 評価に使用する 対象計算アルゴリズム 固有値計算 ( 実数密行列 標準固有値計

カーネルベンチマークコード 開発の目的 エクサスケール規模のシミュレーションの核となる数値計算アルゴリズムの中で 特に重要なものについて 数値計算ライブラリ等を用いてそのコストを推定するためにカーネルベンチマークを作成し 評価に使用する 対象計算アルゴリズム 固有値計算 ( 実数密行列 標準固有値計

... • 行列固有値計算では行列を簡単な形式(形状)に変換し、それを中間形式と して取り扱います。理研研究チームは、帯行列(ゼロでない要素が対角線上 に帯状に分布する行列)を中間形式に採用することによって、前処理時間 ...

26

HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実

HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実

... CPU 普及と性能向上により,マルチコア計算機に適した数値解法重要性はますます高くなっているが,問題 を標準固有値問題に変換して解く従来法はデータ再利用性低い演算を多く含むため,マルチコア計算機 上で高い性能を実現することが難しい.一方,提案法では演算殆どが行列積として実行され,従来法に 比べて高い実行性能が実現できる.Intel ...

9

本日の講義内容 固有値 ( 線形代数 ) と応用問題 振動問題 ネットワーク定常問題 固有値計算アルゴリズム 密行列 べき乗法 ヤコビ法 ハウスホルダー三重対角 + 分割統治法 + 逆変換 疎行列 ランチョス法 ヤコビ デビッドソン法 その他 固有値計算ソフトウェア ScaLAPACK EigenE

本日の講義内容 固有値 ( 線形代数 ) と応用問題 振動問題 ネットワーク定常問題 固有値計算アルゴリズム 密行列 べき乗法 ヤコビ法 ハウスホルダー三重対角 + 分割統治法 + 逆変換 疎行列 ランチョス法 ヤコビ デビッドソン法 その他 固有値計算ソフトウェア ScaLAPACK EigenE

... 分割統治法 • 三重対角行列を適当な摂動により以下ようにする 何らかの方法で と 固有値計算が為されたとする。 それぞれ固有値と固有ベクトルを並べた行列 ( など ) を用いて ...

64

書き換え可能なゲート素子を持つデバイスを用いた行列計算専用集積回路の設計

書き換え可能なゲート素子を持つデバイスを用いた行列計算専用集積回路の設計

... によって記述し、シミュレーションによって、この計算アルゴリズムをハードウェア レベルで動作させるためモデルを作成した。 '98 年度は、山岡 [5] と私により、先に製作された基板を利用してハウスホルダ法 アルゴリズムを使い、実際に行列固有値と固有ベクトル計算をハードウェア上で 動作させた。まず、基板と PC ...

175

2 背景 (1/2) 大規模化, 複雑化, 多様化するハイエンド計算機環境の能力を充分に引き出し, 効率的なアプリケーションプログラムを開発することは困難 有限要素法等の科学技術計算手法 : プリ ポスト処理, 行列生成, 線形方程式求解等の一連の共通プロセスから構成される これら共通プロセスを抽出

2 背景 (1/2) 大規模化, 複雑化, 多様化するハイエンド計算機環境の能力を充分に引き出し, 効率的なアプリケーションプログラムを開発することは困難 有限要素法等の科学技術計算手法 : プリ ポスト処理, 行列生成, 線形方程式求解等の一連の共通プロセスから構成される これら共通プロセスを抽出

... • 有限要素法等科学技術計算手法: – プリ・ポスト処理,行列生成,線形方程式求解等一 連共通プロセスから構成される。 – これら共通プロセスを抽出し,ハードウェアに応じた最 適化を施したライブラリとして整備することで,アプリ ケーション開発者から共通プロセスに関わるプログラ ミング作業,並列化も含むチューニング作業を隠蔽で きる。 ...

54

行列計算専用大規模集積回路の開発

行列計算専用大規模集積回路の開発

... タ問題演算プロセッサ間通信が多くなって並列化率が低くなる。これは計算 なかで、分解される計算一つ一つに注目すると、分解された計算について、計 算されるべきデータ量と演算回数を比べると同程度になるからである。つまり ...

82

FPGAを用いた行列計算専用プロセッサの設計

FPGAを用いた行列計算専用プロセッサの設計

... 化したコンピュータである専用コンピュータを用いる手法が O (N) 法に代表される新 アルゴリズム開発とともに一般的になってきた。本研究では行列計算を対象とし、 専用プロセッサを設計することによって計算時間短縮を試みる。 また従来、対象アーキテクチャ性能評価を行うには大別して、ソフトウェアで ...

139

ハードウェア記述言語を用いた行列計算専用プロセッサの設計

ハードウェア記述言語を用いた行列計算専用プロセッサの設計

... 例するため,次数が数千にも及ぶ実際数値計算では実用に耐えないほど非常に多 く時間を必要とする. この計算時間を短縮しようと,これまで並列化コンピュータを用いたソフトウェ ア的な手法が試みられてきたが,やはり限界があり,それほど改善は見込まれな い.その原因として,現在使われているワークステーションなどは,どの問題にも ...

89

電気磁気学 ( つづき ) 平成 23 年度井瀬潔 4 通年学修単位 2 必修 電磁気学についての数理に関する理論的理解と計算力 1. 電磁気学に必要な数学の基礎学力 ( 三角関数, 行列 ), ベクトルの基本演算 ( 内積, 外積, 微分演算子, 発散, 勾配, 回転 ), 微分, 偏微分, 積分

電気磁気学 ( つづき ) 平成 23 年度井瀬潔 4 通年学修単位 2 必修 電磁気学についての数理に関する理論的理解と計算力 1. 電磁気学に必要な数学の基礎学力 ( 三角関数, 行列 ), ベクトルの基本演算 ( 内積, 外積, 微分演算子, 発散, 勾配, 回転 ), 微分, 偏微分, 積分

... 授業科目名 開講年度 担当名 学年 開講期 単位数 必・選 創造工学 平23年度 全教員 4 前期 履修単位2 必修 [授業ねらい] 3学年までに得た基礎学力と専門的知識を基礎として,学生自らが技術的課題と目標を設定し,その実現ために解決すべき課題 ...

22

行列、ベクトル

行列、ベクトル

... 2.4 コンピュータによる逆行列計算 2.3.1 掃き出し法による連立方程式 解法を、何組か異なる定数項 B に対 して適用し上三角掃き出しも実施すると、 同時に複数方程式解が得られる。 ...

12

表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 ( 坂本 ) 表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 坂本 紫 Simulation of the queue by the spreadsheet Reproduction

表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 ( 坂本 ) 表計算による待ち行列のシミュレーション テーマパークアトラクション待ち時間の再現 坂本 紫 Simulation of the queue by the spreadsheet Reproduction

...  プログラミング教育は,アルゴリズム概念や処 理方法考え方など文系学部生多くにとってはこ れまで授業で経験したことがない新しい概念であ り,さらに,プログラミング言語文法や規則もあ わせて習得する必要がある。そのような背景もあり, 文系学部における情報教育として,プログラミング を取り上げている大学は少ないなか[1][2],プログ ...

17

今回の内容 CUDA 付属のライブラリ cublas 行列 ベクトル積, 行列 行列積 cusperse 行列格納形式 cufft 余弦波の FFT curand モンテカルロ法による円周率計算 Thrust 913

今回の内容 CUDA 付属のライブラリ cublas 行列 ベクトル積, 行列 行列積 cusperse 行列格納形式 cufft 余弦波の FFT curand モンテカルロ法による円周率計算 Thrust 913

...  C言語 におけるA[i][j]メモリ上配置  0/256,0/256,0/256・・・1/256,1/256,1/256・・・2/256,2/256,2/256 ・・・  Fortran におけるA(i,j)メモリ上配置 ←BLAS  0/256,1/256,2/256・・・0/256,1/256,2/256・・・0/256,1/256,2/256・・・ ...

58

Excelを用いた行列演算

Excelを用いた行列演算

...  計量経済学 経済理論から導かれる仮説を数学モデルとして構成し、これを統計学的方法により現実 にどれだけ合致するかを実証する学問領域。また、その計算結果を用いて将来予測や 経済政策効果分析を行う。 ...

30

疎な転置推移確率行列

疎な転置推移確率行列

... マルコフ連鎖時間発展数値計算 状態 x = 0, . . . , m − 1 m 状態マルコフ連鎖を考える . 分布 ⃗ p(t), p(x, t) → 1 d o u b l e p [m] = { 1 . 0 , 0 . 0 , . . . . , 0 . 0 } ; /∗配列 . m は 整 数 . ∗/ ...

11

Title 拡張クロスデータ行列法と共分散行列関数の不偏推定 Author(s) 矢田, 和善 ; 青嶋, 誠 Citation 数理解析研究所講究録 (2015), 1954: Issue Date URL

Title 拡張クロスデータ行列法と共分散行列関数の不偏推定 Author(s) 矢田, 和善 ; 青嶋, 誠 Citation 数理解析研究所講究録 (2015), 1954: Issue Date URL

... $\overline{x}_{n}=n^{-1}\sum_{j=1}^{n}x_{j},$ $M=Y^{T}Y,$ $D=diag(y_{1}^{T}y_{1}, \ldots, y_{n}^{T}y_{n})$ である. Yata and Aoshima (2013) ECDM は,計算コストを意識して開発された先行する方法論 であり, $\delta$ ...

11

動関数が反対称の性質を持つことになる.(2.4.4) の行列式を Slater 行列式とよぶ.(2.4.1) の波動方程式を解くためには,(2.4.4) の Slater 行列式を用いた波動関数 Φ e に関するエネルギー汎関数の最小値を求めればよい. その際に, 一電子軌道に関する極値 ( つまり

動関数が反対称の性質を持つことになる.(2.4.4) の行列式を Slater 行列式とよぶ.(2.4.1) の波動方程式を解くためには,(2.4.4) の Slater 行列式を用いた波動関数 Φ e に関するエネルギー汎関数の最小値を求めればよい. その際に, 一電子軌道に関する極値 ( つまり

... XANES 計算では内殻空孔 を導入する必要がある.内殻空孔とは内殻電子が 伝導帯に遷移した際に内殻に生じるホールこと である.unit cell や primitive cell ような小さなス ーパーセルに内殻空孔を導入して計算した場合, 内殻空孔を導入した原子間相互作用が大きくな る.XANES 理論計算を行うためにその相互作 ...

34

Show all 10000 documents...

関連した話題