Top PDF bcg法は倍精度演算

ハードウェア記述言語を用いた行列演算専用回路設計

... 第 2 章設計方法と使用装置 2.1 設計方法本研究において VHDL による回路設計の流れ図を図 2.1 に示す．まず PeakFPGA という VHDL エディタで回路機能を記述し，HDL ファイル (*.vhd) を作製する．もし，VHDL 構文の記述がおかしければ，コンパイル中にエラーメッセージが出る．その場合は正しい文章に書 ...

73

FPGA による画像処理演算器の設計

... † 愛知工業大学大学院工学研究科（豊田市） †† 愛知工業大学工学部電気工学科（豊田市）１・２研究の背景及び目的画像処理を高速で行う方法としてハードウェア演算が挙げられる。また近年、画像処理分野でも FPGA の利用が注目されている。本研究室ではこれまで FPGA による設計を行ってきた。同研究室 2004 年院生卒の杉野は MIPS アーキテクチャを用いた CPU を ...

6

or演算子を含んだ関数ノード群を持つGPによる拡張決定木の生成

... からデータを用いて、決定木を構築し、その評価を行った。その結果、決定木のサイズの改善を行うことができた。また、とを用いたものでは、精度の改善も認められた。拡張したルール表現は、遺伝的プログラミングの関数ノードの定義を置き換えることにより実装している。そのため遺伝的プログラミングによる学習の枠組みの変更は最小限になっている。このことより、やを用いたルール表現も遺伝 ...

2

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

... 256 ビットの幅を持つ浮動小数点形式は，Crandall らにより実装されている 2) ．この実装では，ソフトウェアでの高速処理が目標のため，指数部を 32 ビットにし，仮数部は 2 の補数表現になっている．将来的に IEEE 754 でもより高精度な表現が標準化されることを見込むと，現在の IEEE 754 規格の延長として 8 倍精度を定義した我々の方がデータ/精度互 ...

27

FPGA によるITU-656 ビデオカメラのインターフェイスおよび画像演算器の設計

... The processing speed with the FPGA was enough to perform real-time processing. １．はじめに１・１研究の背景及び目的画像情報からは視覚的な映像だけでなく、画像を解析することによって速度、温度、圧力などの情報を得ることが出来る。これらの情報を高精度で利便性も高く得るために求められる性能には、高画質、高フレームレート、 ...

6

3C4-3 組合せ集合のmeet演算による共通因子抽出

... ab は 1000 個のすべての組合せに現れるので，頻度が一番高くなっており，順に abc ， abcd の頻度が高い．これは，ある頻出パターンの部分集合も頻出パターン集合に現れる場合は，部分集合の頻度の方が必ず大きくなる例である．一方提案手法は， meet 演算が組合せのペアワイズの共通部分の列挙であったことから，アイテム ...

4

超高速行列演算チップの作成

... 法 , そして逆反復法について説明する。対称行列の固有値を計算するとき，通常は行列を三重対角行列に変換し，その三重対角行列の固有値を計算する。その理由は，与えられた行列の固有値を一度に求めるよりも，このように三重対角化を中間におく方が，全体として手間が少なくなるからである。ここでは，三重対角化の方法としてハウスホルダ一変換，そしてその ...

81

倍精度マルチコアプロセッサ及び SSD ストレージによる計算機合成ホログラムの高速化の研究 2015 年 1 月杉山充

... （M）× 演算数（30）/ 理論性能値（N）= 画素数 1,920 × 1,080, （M）= 物体点数 1,048,576 それぞれの計算効率は, GRAPE-DR ボードが ...23.4%・SR16000 は 20.0%・CPU は 55% となる. この実行性能については, 並列度が大きくなると実行性能は理論性能値より落ち ...

55

17 年度東洋大学審査学位論文演算子インピーダンスを用いた同期機諸定数および等価回路定数の算出法に関する研究理工学研究科電気電子情報専攻博士後期課程 46C141 田中晃

... れらの同期が取れていない状態で投入（非同期投入）すると，条件によっては過大な過渡電流が発生してしまい，最悪の場合，投入の失敗や脱調を招くほか，同期機本体もしくは周辺機器が損傷する恐れもある。特にブラシレス機においては，整流回路が界磁巻線端子に接続されているため，界磁電流が一瞬でも負になると，界磁電流が遮断されて界磁巻線端子間が開放されたの ...

107

第 1 回 C 言語講座 1. コンピュータって? だいたいは演算装置制御装置記憶装置入出力装置から構成されている演算装置 CPU の一部で実際に計算を行う装置制御装置 CPU の一部で演算装置や入出力装置記憶装置の読み書きなどを制御する装置記憶装置プログラムや情報データを一時的

... 昔はメモリが少なかったので、倍精度はあまり使わなかったのですが、メモリが潤沢にある現在では、double 型を使ってしまって構いません。 float 型の場合は%f を使います。因みに、倍精度整数を表現する long 型、というものも存在します。調べると色んなものがあるよ。 ...

6

ストリーミング SIMD 拡張命令2 (SSE2) を使用した、倍精度浮動小数点ベクトルの最大/最小要素とそのインデックスの検出

... その方法の 1 つとして、ベクトル内の要素をすべて比較して最大値を見つけ出す(それには、 N-1 回の比較が必要である)。次に、見つかった最大値をベクトル内の各要素と比較してそのインデックスを見つけ出す。ベスト・ケースは、ベクトルの第一要素が最大値の場合で、比較は N 回で済む。ワースト・ケースは、ベクトルの最終要素が最大値の場合で、比較は 2N-2 ...

22

を用いて実装している.. 対象となる演算. による実装と高速化本研究では反復法ライブラリをベースとしたため, 表に示す演算のみを実装した. ただしこの実装は一般的な用途にも適用可能なものである. 演算の名称 Name of calculation 表演算の一覧 Table list of c

... 計算性能の向上に伴い，高精度で計算を行うことが多くの場面で必要になってきている．4 倍精度で効率良く計算する手法の中に，倍精度変数を 2 つ用いて 1 つの変数の値を保持する倍々精度演算がある．反復解法ライブリ Lis ではこの倍々精度演算が SSE2 を用いて実装されている．本研究ではその内部使われているベクトル演算を AVX 命令 ...

6

インテル® コンパイラーの浮動小数点演算における結果の一貫性

... OpenMP* の並列リダクション操作は、OpenMP* ディレクティブによって指定され、/fp:precise (Windows®) または -fp-model precise (Linux* および OS X*) で無効になりません。一般に、精度に影響する可能性があるため、プログラマーの責任において使用してください。同様に、MPI ライブラリー呼び出しを含む MPI のリ ...

14

HPCS5 5/5/9 5年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Comuting Symosium 5 などの行列とベクトルの演算 Level- 演算は演算回数に対して必要となるデータ量が多くマルチコア計算機において高い実行性能を実

... フェーズを繰り返し適用することで一般の帯幅の帯行列の固有値問題を解く．近年のマルチコア CPU の普及と性能向上により，マルチコア計算機に適した数値解法の重要性はますます高くなっているが，問題を標準固有値問題に変換して解く従来法はデータ再利用性の低い演算を多く含むため，マルチコア計算機 ...

9

演算増幅器

... http://www.kk.iij4u.or.jp/~kondo/bmp/ http://www.umekkii.jp/data/computer/file_format/bitmap.cgi 乱数の利用方法疑似乱数を生成する rand()関数はゲーム制作に良く使われる。例えばある確率で敵がビームを発射したり、RPG で敵から受けたり与えたりするダメージの量をある程度の幅を持たせてランダムにするとい ...

9

る連続なアクセスができるなどの利点がある. 倍々精度浮動小数は, 符号部 1 bit, 指数部 11 bit, 仮数部 14 (52 2) bit からなる. これは符号部 1bit, 指数部 15 bit, 仮数部 112 bit からなる IEEE754 準拠の 4 倍精度と比べて指数部が 4

... DD-SSE2 は 70%， DD-AVX2 は 50%の時間が SpMV で，実行時間の多くは SpMV である．これらの結果から，iso(100)における DD-AVX2 のベクトル演算は DOUBLE と比べ約 2 倍の時間がかかる．性能はメモリ性能に制約を受け SIMD 化の効果はないこと， DD-AVX2 における ...

7

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

... 演算回数が増大するため、本来無限桁である実数を有限桁で打ち切って計算することによる誤差の累積の影響が大きくなる地球シミュレータで375,000次元の行列の全固有値・固有ベクトルを直接法で計算精度は数ケタ（ SC06、Yamada et. al.） 倍精度演算では有効な精度の結果が得られない可能性あり ...

18

コンピュータの仕組みを知る上での基礎知識以下の内容が理解できれば貴方もコンピュータ通の仲間入り! n 進法演算とは (2 進 8 進 10 進 16 進 ) 私たちが何気なく使用している10 進数はコンピュータの世界にとっては極めて扱いにくいものなのですご存知の通りこのn 進数とは上の桁に

... 画像圧縮の場合、一般的には逆圧縮（完全に再現可能な圧縮方式）方式としてハフマンコード圧縮が採用されています。これは発生頻度の高いデータを尐ないビットに置き換える方式（コード化する）です。大量の画像を扱う医用の世界では、画像診断を目的としている関係で画像劣化は致命的となりますので、圧縮する場合は可逆が必須となります。医 ...

8

線形代数演算ライブラリBLASとLAPACKの基礎と実践1

... 行列 - 行列の積のコンパイルと実行先ほどのリストを ”dgemm_demo.cpp” などと保存する。 $ g++ dgemm_demo.cpp -o dgemm_demo -lblas -lapack でコンパイルができる . 何もメッセージが出ないなら , コンパイルは成功である。実行は以下のようになっていればよい。 Octave や Matlab にこの結果をそのままコピー & ...

93

線形代数演算ライブラリBLASとLAPACKの基礎と実践1

... BLAS, LAPACK の現状 : 高速な BLAS, LAPACK について ATLAS:R. Clint Whaley 氏による , オートチューニング機構で高速化した BLAS 。それまでの 2001 年より多くのコンピュータの BLAS 環境を劇的に改善した , パイオニア的存在。ハンドチューニングした BLAS よりは数 % から数 10% 低速程度 ...

77

bcg法は倍精度演算

関連した話題