• 検索結果がありません。

bcg法は倍精度演算

ハードウェア記述言語を用いた行列演算専用回路設計

ハードウェア記述言語を用いた行列演算専用回路設計

... 第 2 章 設計方法と使用装置 2.1 設計方法 本研究において VHDL による回路設計の流れ図を図 2.1 に示す.まず PeakFPGA という VHDL エディタ で回路機能 を記述し,HDL ファイル (*.vhd) を作製する.もし,VHDL 構文 の記述がおかしければ,コンパイル中にエラーメッセージが出る.その場合正しい文章に書 ...

73

FPGA による画像処理演算器の設計

FPGA による画像処理演算器の設計

... † 愛知工業大学大学院 工学研究科(豊田市) †† 愛知工業大学 工学部 電気工学科(豊田市) 1・2 研究の背景及び目的 画像処理を高速で行う方法としてハードウェア演算が 挙げられる。また近年、画像処理分野でも FPGA の利用 が注目されている。本研究室でこれまで FPGA による 設計を行ってきた。同研究室 2004 年院生卒の杉野 MIPS アーキテクチャを用いた CPU を ...

6

or演算子を含んだ関数ノード群を持つGPによる拡張決定木の生成

or演算子を含んだ関数ノード群を持つGPによる拡張決定木の生成

... から データを用いて、決定 木を構築し、その評価を行った。 その結果、決定木のサイズの改善を行うことができた。ま た、 と を用いたもので、精度の改善も認められ た。拡張したルール表現、遺伝的プログラミングの関数ノー ドの定義を置き換えることにより実装している。そのため遺伝 的プログラミングによる学習の枠組みの変更最小限になって いる。このことより、 や を用いたルール表現も遺伝 ...

2

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

... 256 ビットの幅を持つ浮動小数点形式,Crandall らにより実装されている 2) .この実装 では,ソフトウェアでの高速処理が目標のため,指数部を 32 ビットにし,仮数部 2 の補 数表現になっている.将来的に IEEE 754 でもより高精度な表現が標準化されることを見 込むと,現在の IEEE 754 規格の延長として 8 倍精度を定義した我々の方がデータ/精度互 ...

27

FPGA によるITU-656 ビデオカメラのインターフェイスおよび画像演算器の設計

FPGA によるITU-656 ビデオカメラのインターフェイスおよび画像演算器の設計

... The processing speed with the FPGA was enough to perform real-time processing. 1.はじめに 1・1 研究の背景及び目的 画像情報から視覚的な映像だけでなく、画像を解析 することによって速度、温度、圧力などの情報を得るこ とが出来る。これらの情報を高精度で利便性も高く得る ために求められる性能に、高画質、高フレームレート、 ...

6

3C4-3 組合せ集合のmeet演算による共通因子抽出

3C4-3 組合せ集合のmeet演算による共通因子抽出

... ab 1000 個のす べての組合せに現れるので,頻度が一番高くなっており,順に abc , abcd の頻度が高い.これ,ある頻出パターンの部分集 合も頻出パターン集合に現れる場合,部分集合の頻度の方が 必ず大きくなる例である.一方提案手法, meet 演算が組合 せのペアワイズの共通部分の列挙であったことから,アイテム ...

4

超高速行列演算チップの作成

超高速行列演算チップの作成

... , そして逆反復について説明する。 対称行列の固有値を計算するとき,通常行列を三重対角行列に変換し,その三重 対角行列の固有値を計算する。その理由,与えられた行列の固有値を一度に求め るよりも,このように三重対角化を中間におく方が,全体として手間が少なくなる からである。ここで,三重対角化の方法としてハウスホルダ一変換,そしてその ...

81

倍精度マルチコアプロセッサ及び SSD ストレージによる 計算機合成ホログラムの高速化の研究 2015 年 1 月 杉山充

倍精度マルチコアプロセッサ及び SSD ストレージによる 計算機合成ホログラムの高速化の研究 2015 年 1 月 杉山充

... (M)× 演算数(30)/ 理論性能値 (N)= 画素数 1,920 × 1,080, (M)= 物体点数 1,048,576 それぞれの計算効率, GRAPE-DR ボードが ...23.4%・SR16000 20.0%・CPU 55% となる. この実行性能について, 並列度が大きくなると実行性能理論性能値より落ち ...

55

17 年度 東洋大学審査学位論文 演算子インピーダンスを用いた同期機諸定数 および等価回路定数の算出法に関する研究 理工学研究科電気電子情報専攻博士後期課程 46C141 田中晃

17 年度 東洋大学審査学位論文 演算子インピーダンスを用いた同期機諸定数 および等価回路定数の算出法に関する研究 理工学研究科電気電子情報専攻博士後期課程 46C141 田中晃

... れらの同期が取れていない状態で投入(非同期投入)すると,条件によって 過大な過渡電流が発生してしまい,最悪の場合,投入の失敗や脱調を招く ほか,同期機本体もしくは周辺機器が損傷する恐れもある。特にブラシレス 機において,整流回路が界磁巻線端子に接続されているため,界磁電流が 一瞬でも負になると,界磁電流が遮断されて界磁巻線端子間が開放されたの ...

107

第 1 回 C 言語講座 1. コンピュータって? だいたいは 演算装置 制御装置 記憶装置 入出力装置から構成されている 演算装置 CPU の一部で実際に計算を行う装置 制御装置 CPU の一部で演算装置や入出力装置 記憶装置の読み書きなどを制御する装置 記憶装置プログラムや情報 データを一時的

第 1 回 C 言語講座 1. コンピュータって? だいたいは 演算装置 制御装置 記憶装置 入出力装置から構成されている 演算装置 CPU の一部で実際に計算を行う装置 制御装置 CPU の一部で演算装置や入出力装置 記憶装置の読み書きなどを制御する装置 記憶装置プログラムや情報 データを一時的

... 昔メモリが少なかったので、倍精度あまり使わなかったのですが、メモリが潤沢にある 現在で、double 型を使ってしまって構いません。 float 型の場合%f を使います。 因みに、倍精度整数を表現する long 型、というものも存在します。 調べると色んなものがあるよ。 ...

6

ストリーミング SIMD 拡張命令2 (SSE2) を使用した、倍精度浮動小数点ベクトルの最大/最小要素とそのインデックスの検出

ストリーミング SIMD 拡張命令2 (SSE2) を使用した、倍精度浮動小数点ベクトルの最大/最小要素とそのインデックスの検出

... その方法の 1 つとして、ベクトル内の要素をすべて比較して最大値を見つけ出す(それに、 N-1 回の比較が必要である)。次に、見つかった最大値をベクトル内の各要素と比較してそのイ ンデックスを見つけ出す。 ベスト・ケース、ベクトルの第一要素が最大値の場合で、比較 N 回で済む。ワースト・ケ ース、ベクトルの最終要素が最大値の場合で、比較 2N-2 ...

22

を用いて実装している.. 対象となる演算. による実装と高速化 本研究では反復法ライブラリをベースとしたため, 表 に示す演算のみを実装した. ただしこの実装は一般的な用 途にも適用可能なものである. 演算の名称 Name of calculation 表 演算の一覧 Table list of c

を用いて実装している.. 対象となる演算. による実装と高速化 本研究では反復法ライブラリをベースとしたため, 表 に示す演算のみを実装した. ただしこの実装は一般的な用 途にも適用可能なものである. 演算の名称 Name of calculation 表 演算の一覧 Table list of c

... 計算性能の向上に伴い,高精度で計算を行うことが多くの場面で必要になってきている.4 倍精度で効率良く計算 する手法の中に,倍精度変数を 2 つ用いて 1 つの変数の値を保持する倍々精度演算がある.反復解法ライブリ Lis で この倍々精度演算が SSE2 を用いて実装されている.本研究でその内部使われているベクトル演算を AVX 命令 ...

6

インテル® コンパイラーの浮動小数点演算における結果の一貫性

インテル® コンパイラーの浮動小数点演算における結果の一貫性

... OpenMP* の並列リダクション操作、OpenMP* ディレクティブによって指定され、/fp:precise (Windows®) または -fp-model precise (Linux* および OS X*) で無効になりません。一般に、精度に影響する可能性がある ため、プログラマーの責任において使用してください。同様に、MPI ライブラリー呼び出しを含む MPI のリ ...

14

HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実

HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算 は 演算回数 に対して必要となるデータ量が多く マルチコア計算機に おいて高い実行性能を実

... フェーズを繰り返し適用することで一般の帯幅の帯行列の固有値問題を解く.近年のマルチコア CPU の 普及と性能向上により,マルチコア計算機に適した数値解法の重要性ますます高くなっているが,問題 を標準固有値問題に変換して解く従来データ再利用性の低い演算を多く含むため,マルチコア計算機 ...

9

演算増幅器

演算増幅器

... http://www.kk.iij4u.or.jp/~kondo/bmp/ http://www.umekkii.jp/data/computer/file_format/bitmap.cgi 乱数の利用方法 疑似乱数を生成する rand()関数ゲーム制作に良く使われる。例えばある確率で敵がビームを発射し たり、RPG で敵から受けたり与えたりするダメージの量をある程度の幅を持たせてランダムにするとい ...

9

る連続なアクセスができるなどの利点がある. 倍々精度浮動小数は, 符号部 1 bit, 指数部 11 bit, 仮数部 14 (52 2) bit からなる. これは符号部 1bit, 指数部 15 bit, 仮数部 112 bit からなる IEEE754 準拠の 4 倍精度と比 べて指数部が 4

る連続なアクセスができるなどの利点がある. 倍々精度浮動小数は, 符号部 1 bit, 指数部 11 bit, 仮数部 14 (52 2) bit からなる. これは符号部 1bit, 指数部 15 bit, 仮数部 112 bit からなる IEEE754 準拠の 4 倍精度と比 べて指数部が 4

... DD-SSE2 70%, DD-AVX2 50%の時間が SpMV で,実行時間の多 く SpMV である. これらの結果から,iso(100)における DD-AVX2 のベク トル演算 DOUBLE と比べ約 2 倍の時間がかかる.性能 メモリ性能に制約を受け SIMD 化の効果ないこと, DD-AVX2 における ...

7

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

... 演算回数が増大するため、本来無限桁である実数を有限桁で 打ち切って計算することによる誤差の累積の影響が大きくなる 地球シミュレータで375,000次元の行列の全固有値・固有ベクトルを直接で計算 精度数ケタ ( SC06、Yamada et. al.) 倍精度演算有効な精度の結果が得られない可能性あり ...

18

コンピュータの仕組みを知る上での基礎知識 以下の内容が理解できれば 貴方もコンピュータ通の仲間入り! n 進法演算とは (2 進 8 進 10 進 16 進 ) 私たちが何気なく使用している10 進数は コンピュータの世界にとっては極めて扱いにくいものなのです ご存知の通り このn 進数とは上の桁に

コンピュータの仕組みを知る上での基礎知識 以下の内容が理解できれば 貴方もコンピュータ通の仲間入り! n 進法演算とは (2 進 8 進 10 進 16 進 ) 私たちが何気なく使用している10 進数は コンピュータの世界にとっては極めて扱いにくいものなのです ご存知の通り このn 進数とは上の桁に

... 画像圧縮の場合、一般的に逆圧縮(完全に再現可能な圧縮方式)方式としてハフマン コード圧縮が採用されています。これ発生頻度の高いデータを尐ないビットに置き換え る方式(コード化する)です。大量の画像を扱う医用の世界で、画像診断を目的として いる関係で画像劣化致命的となりますので、圧縮する場合可逆が必須となります。医 ...

8

線形代数演算ライブラリBLASとLAPACKの 基礎と実践1

線形代数演算ライブラリBLASとLAPACKの 基礎と実践1

... 行列 - 行列の積のコンパイルと実行 先ほどのリストを ”dgemm_demo.cpp” などと保存する。 $ g++ dgemm_demo.cpp -o dgemm_demo -lblas -lapack でコンパイルができる . 何もメッセージが出ないなら , コンパイル成功である。 実行以下のようになっていればよい。 Octave や Matlab にこの結果をそのま まコピー & ...

93

線形代数演算ライブラリBLASとLAPACKの 基礎と実践1

線形代数演算ライブラリBLASとLAPACKの 基礎と実践1

... BLAS, LAPACK の現状 : 高速な BLAS, LAPACK について ATLAS:R. Clint Whaley 氏による , オートチューニング機構で高速化した BLAS 。それまでの 2001 年より多くのコンピュータの BLAS 環境を劇的 に改善した , パイオニア的存在。ハンドチューニングした BLAS より数 % から数 10% 低速程度 ...

77

Show all 10000 documents...

関連した話題