テクスチャへの代入

GPUによる描画処理では多数のバーテックスシェーダーおよび多数のフラグメントシェー

ダーが並列実行する。しかもシェーダープログラムはプログラミング可能であるから、そ

れをうまく活用すれば描画に限らず様々な並列計算ができるのではないかと期待できる。

ここで述べるテクスチャとフラグメントシェーダーを用いる並列計算はその自由度が高

く、CUDA^やOpenCLにおける計算方法の先駆けになった。

テクスチャは全てのシェーダープログラムから共通に参照可能な配列のように見える。特

にテクスチャからRGBA値を取得する（サンプリングする）方法を線形補間（GL LINEAR^）

ではなく、最近傍（GL NEAREST）に設定する場合には、テクスチャ内の個々の生のRGBA

値をそのまま読み出すことができるため、配列要素を読み出すイメージに非常に近い。

前章のテクスチャデータをは読み出し専用であるが、もしテクスチャへデータを書き込

むことができるならば、配列要素データを読み込み、配列要素へデータを書き込む一連の

操作ができる訳であるから、2次元配列のデータ並列演算ができるだろうことは想像に難

くない。実際、可能である。テクスチャへの書き込みは、元々はより高度な3D CG^を実

装するため¹に導入されたのだが、これを用いれば任意のデータ並列演算ができることに

気づいた研究者に利用されるようになっていく。その演算性能が圧倒的であったため、そ

の後、CUDA^やOpenCL^などのGPGPU専用のプログラミング環境が開発された。

この章ではGPGPU^草創期のOpenGLによるデータ並列計算の方法を振り返る。

ホストプログラム

バーテックスシェーダープログラム

フラグメントシェーダープログラム

画像出力

CPU

GPU

ラスタライザ

テクスチャ attribute 変数

フレームバッファオブジェクト (FBO) (a)

(b) (c)

図4.1: テクスチャへデータを代入する経路

図4.1はテクスチャへデータを書き込む仕組みの概念図である。

OpenGLではフレームバッファを仮想化/抽象化した機能を有するフレームバッファオ

ブジェクト（以下、FBO）が利用できる。これを用いてテクスチャをフレームバッファに

見せかける。手順は以下の通りである。

1. ^まず、FBO^{をひとつ生成する。}

2. FBOをテクスチャと接続する（図4.1の(a)の矢印）。

3. フラグメントシェーダーの出力をFBO^{に接続する（図}4.1^の(b)^の矢印）

4. 通常の描画処理を行う。これによって、フラグメントシェーダーの計算した各画素

のRGBA値は、本来の画像バッファへは格納されず、テクスチャの対応する画素へ

格納される。

5. テクスチャデータをCPUのメモリへ読み出し（図4.1の(c)の矢印）、ホストプロ

グラムでその内容を確認する。

4.1.1 GPGPUのためのプログラムの全体構成

これ以降は画像描画を行わないため、2^章の図2.3で設定したプログラムの全体構成を

図4.2のように変更する。ここに、

initSystem()^、initData() は、これまでとほぼ同じ役割の関数である。

compute() は、これまでのdisplay()と同様の処理を行うが、描画を行わないため、関

数名を変えた。

showResults() は、計算結果を表示するために新たに導入する関数である。

ここまで用いてきたglutDisplayFunc()^、glutMainLoop()は描画専用の関数であるた

め、これ以降は用いない。

なお、いくつかの情報は複数の関数で共有する必要があるため、既に導入済みの大域変

数 sp（シェーダー実行可能プログラムへのポインタ）、大域定数NUM POINTS（頂点数）

に加え、大域変数width、height（テクスチャの幅、高さ）、texZp（出力用テクスチャ

へのポインタ）を導入した（図4.2の上方を参照）。

プログラミング作法として大域変数の乱用は避けるべきであることは言うまでもないが、

この例題では引数を関数間でだらだらと引き回すよりも大域変数を用いた方がよいと判断

した。

4.1.2 GPGPUのためのinitSystem()

この章で用いるinitSystem()は図4.3の通りである。ここまでのinitSystem()（図

3.44）からの変更点を中心に述べる。

1. ^{関数呼び出し}glutInit()、glutInitDisplayMode()、1^行飛んでglutCreateWindow("Test

Window") は変更しない。

2. ^{関数呼び出し}

glutInitWindowSize(width,height)

では、フレームバッファの大きさをテクスチャの大きさと正確に揃える必要がある

ため、幅、高さとして大域変数 width^、height^{を参照している。}

3. 関数呼び出し

✓ ✏

#include "All.h"

// 以下の大域変数は複数の関数で共有する。

Shader *sp; // シェーダープログラムオブジェクトへのポインタ

const int NUM_POINTS = 3; // 頂点数

const int width = 5; // テクスチャの幅 const int height = 7; // テクスチャの高さ

RWTexture2D *texZp; // 出力用テクスチャへのポインタ

void initSystem() {

/* ここにシステムパラメータの設定等の初期化処理 */

}

void initData() {

/* ここに入力データなどの初期化処理 */

}

void compute() // display()に相当

{

/* ここにGPU実行処理 */

}

void showResults() // 新たに導入

{

/* ここに結果の出力等の処理 */

}

int main() {

initSystem();

initData();

compute();

showResults();

return 0;

✒} ✑

図4.2: GPGPUのためのホストプログラムのひな形

✓ ✏ void initSystem(int argc, char *argv[])

{

glutInit(&argc,argv);

glutInitDisplayMode(GLUT_RGB|GLUT_SINGLE);

glutInitWindowSize(width,height);

glutCreateWindow("Test Window");

glClearColor(0.0, 0.0, 0.0, 0.0);

#if defined(WIN32) glewInit();

#endif

GLuint fb;

glGenFramebuffers(1, &fb);

glBindFramebuffer(GL_FRAMEBUFFER, fb);

sp = new Shader("shader.vert","shader.frag");

sp->use();

✒} ✑

図4.3: GPGPUのためのinitSystem() glClearColor(0.0, 0.0, 0.0, 0.0)

は出力用テクスチャの各要素の初期値を0.0 に設定している。もちろん必要に応じ

て0.0 以外に設定してもよい。

4. ^{関数呼び出し}

glGenFramebuffers(1, &fb)²

は、図4.1で紹介したフレームバッファオブジェクトを生成し、OpenGLコンテキ

ストに登録する。

5. 関数呼び出し

glBindFramebuffer(GL FRAMEBUFFER, fb)³

は、これ以降のフレームバッファへの設定は、参照番号 fb のフレームバッファオ

ブジェクトをターゲットにして行うことを宣言している。参照番号を用いて各種設

定を行う方法は既にシェーダー実行可能プログラム、バッファ、テクスチャについ

2void glGenFramebuffers(GLsizei n, GLuint *ids);

3void glBindFramebuffer( GLenum target, GLuint framebuffer);

✓ ✏ void initData()

{

Position2D pos[NUM_POINTS];

pos[0].x = -0.5; pos[0].y = -0.5;

pos[1].x = +0.5; pos[1].y = +0.5;

pos[2].x = +0.5; pos[2].y = -0.5;

ArrayBuffer ab((float*)pos,2,NUM_POINTS);

sp->bindArrayBuffer("position",&ab); // これより上は前章までと同じ texZp = new RWTexture2D(0,NULL,width,height);//入出力兼用テクスチャ

sp->bindTextureW(texZp); // 出力用に設定

✒} ✑

図4.4: テクスチャ出力のためのinitData()

て解説したが、フレームバッファオブジェクトについても同様に行う仕様になって

いる。

6. シェーダープログラムのコンパイル＆リンク、およびuse()^{の呼び出しはこれまで}

と同じである。

4.1.3 テクスチャ出力のためのinitData()

この節で用いるinitData()の内容は、図4.4の通りである。以下、解説する。

1. ^{冒頭から関数呼び出し}

sp->bindArrayBuffer("position",&ab) ^までの6^{行は、前章の}initData()^（図

3.45）と同じである。三角形を描画する設定である。

2. ^{関数呼び出し}

texZp = new RWTexture2D(0, NULL, width, height)

は出力用テクスチャオブジェクトを生成し、そのアドレスをポインタtexZp^へ代入す

る。RWTexture2Dクラスについては後述する。第1引数はテクスチャの装置番号⁴、

第2引数は初期データの格納されているメモリエリアの先頭アドレス、第3^、第4^引

数はテクスチャの幅、高さを指定する。装置番号は0^{以上の整数であり、}0^から順に

✓ ✏ struct RWTexture2D {

GLuint texID; // ^参照番号 GLint num; // ^装置番号

RWTexture2D(int tnum, void* data, int w, int h); // ^{コンストラクタ} void readData(void*, int w, int h); // GPU^データをCPU^へ転送

✒}; ✑

図 4.5: クラスRWTexture2Dの定義

付番せねばならない。第2^引数がNULL ^{の場合には、}CPU^からGPU^{へデータ転送}

を行わない。よって出力用テクスチャでは NULL を用いる。実装の詳細は次項に述

べる。

3. ^{関数呼び出し}

sp->bindTextureW(texZp)

はテクスチャをフレームバッファに接続する。詳細は次項に述べる。

4.1.4 入出力兼用テクスチャクラス RWTexture2D

OpenGLのテクスチャの取り扱いは相当に複雑である。それをできるだけ簡単に利用で

きるように、入出力兼用テクスチャのクラスRWTexture2D を設計する。入出力を兼用に

したのも複雑さを一度に軽減するためであり、また後にひとつのテクスチャを入力用/^出

力用で次々と切り替えていくために兼用にしている。

入力部分は前章の内容そのままであるから、出力部分を追加実装すればよい。ここでは、

出力部分の実装について解説する。

まず、クラスは図4.5にように設計した。

コンストラクタの実装は図4.6の通りである。これは最後の関数呼び出しを除いて図3.24

と全く同じである。最後の関数呼び出し：

glFramebufferTexture2D(GL_FRAMEBUFFER,

GL_COLOR_ATTACHMENT0+num,

GL_TEXTURE_2D, texID, 0)

5は、参照番号texIDの2^{次元テクスチャ（}GL TEXTUR 2D）を、num番目の装置⁶として

5void glFramebufferTexture2D(GLenum target, GLenum attachment, GLenum textarget, GLuint texture, GLint level);

6くどいようだが、正確に言えば装置番号ではなく、color attachmentの番号（色接続点番号？）である。

装置番号とcolor attachiment番号は独立に設定できるのだが、煩雑なのでこの講義テキストでは装置番号にまとめている。

✓ ✏ RWTexture2D::RWTexture2D(int tnum, void* data, int w, int h){

num = tnum;

glGenTextures (1, &texID);

glBindTexture(GL_TEXTURE_2D,texID);

glTexParameteri(GL_TEXTURE_2D, GL_GENERATE_MIPMAP, GL_FALSE);

glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_NEAREST);

glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_NEAREST);

glTexImage2D(GL_TEXTURE_2D, 0, GL_RGBA, w, h, 0, GL_RGBA, GL_FLOAT, data);

glFramebufferTexture2D(GL_FRAMEBUFFER,

GL_COLOR_ATTACHMENT0+num, GL_TEXTURE_2D, texID, 0);

✒} ✑

図 4.6: ^クラスRWTexture2Dのコンストラクタの実装

✓ ✏

void RWTexture2D::readData(void* data, int w, int h){

glReadBuffer(GL_COLOR_ATTACHMENT0+num);

glReadPixels(0, 0, w,h, GL_RGBA,GL_FLOAT,data);

✒} ✑

図4.7: クラスRWTexture2DのreadData()の実装

当該フレームバッファ⁷に割り当てる。なお、第5引数にはミップマップのレベルを指定

するが、この講義ではミップマップは用いないため、0^でよい。

次にメンバー関数readData()は、このテクスチャに対応するGPU^{メモリ上のデータ}

をCPU^{メモリ上の第}1引数のアドレスへ転送する関数である。readData()^{の実装は図}

4.7の通りである。関数呼び出し

glReadBuffer(GL COLOR ATTACHMENT0+num)⁸

は、GPUからCPUへデータを読み出す際の読み出し元を指定する。この場合は num番

目の装置である。numの値はコンストラクタで初期設定する（図4.6参照）。関数呼び出し

glReadPixels(0, 0, w,h, GL RGBA,GL FLOAT,data)⁹

は、読み出し元から配列 data へ実際にデータを読み出す。

7直近のglBindFrameBuffer()で宣言されたフレームバッファのことで、この例題ではinitSystem()^で作られたフレームバッファオブジェクトのこと。

✓ ✏ void Shader::bindTextureR(const char* vname, RWTexture2D* tp){

glActiveTexture(GL_TEXTURE0+(tp->num));

glBindTexture(GL_TEXTURE_2D,tp->texID);

GLint p = glGetUniformLocation(program, vname);

if(p < 0) {

cerr << "texture2d name error: "<< vname << endl;

exit(1);

}

glUniform1i(p, tp->num);

}

void Shader::bindTextureW(RWTexture2D* tp){

glDrawBuffer(GL_COLOR_ATTACHMENT0+(tp->num));

✒} ✑

図4.8: ^クラスShader^のbindTextureR/W()^の実装

✓ ✏

void compute(void) {

glClear(GL_COLOR_BUFFER_BIT);

sp->run(GL_TRIANGLES,NUM_POINTS);

✒} ✑

図4.9: 三角形領域を計算するcompute()の実装

さらに、RWTexture2Dの関連する関数として図4.8の二つのメンバー関数をShaderク

ラスへ追加実装しておく。

関数bindTextureR()はテクスチャを入力用として宣言するものであり、前章の図3.4

のbindTexture()と全く同じ内容である。

関数bindTextureW()はテクスチャを入力用として宣言するものである。関数呼び出し：

glDrawBuffer(GL COLOR ATTACHMENT0+tp->num)¹⁰

は、フラグメントシェーダーの出力先をフレームバッファオブジェクトの tp->num ^番目

の装置へ接続する関数である。tp->num番目の装置は、既に特定のテクスチャと接続され

ているから、結果、この関数呼び出しをもってフラグメントシェーダーの出力先とテクス

チャが接続されたことになる。

ドキュメント内 _openglcl (ページ 111-124)