2.3 リソースの見積もり
2.3.2 RD エリア容量
UNIX の場合
64 ビット版 Text Search Plug-in の場合:48 バイト 64 ビット版以外の Text Search Plug-in の場合:32 バイト
Windows の場合
32 バイト固定
(i) 共用メモリ
登録・検索同時実行を実行する場合,BES またはシングルサーバ単位に次のサイズの共用メモリが必要で す。
使用メモリ[キロバイト] = max((rd_serve×8192×↓lock_size/8↓)/1024 +↑(32+16×
rd_serve)/8192↑×8,16)
• rd_serve:1 サーバ内の IXFREEWORD インデクス用 RD エリア数
• lock_size:IXFREEWORD プラグインの環境設定項目「1RD エリア当たりの排他制御用共用メモ リサイズ」の設定値[キロバイト]
(j) 検索時最大ワークメモリサイズ
検索高速化インデクス(V2)機能を使用する場合
検索高速化インデクス(V2)機能を使用する場合の,検索時最大ワークメモリサイズ(phn_mem_search,
または phx_mem_search)に指定するメモリ使用量の目安(最低限必要な値)を次に示します。
使用メモリ[キロバイト] = (ターム数×2)※×64+( NOT 検索指定数×登録データ件数/8)/1024 注※ (ターム数×2)の最大値は 200 です。
メモリ使用量は検索条件によって異なります。検索時最大ワークメモリサイズの指定値が大きいほど,検 索性能が向上します。そのため,ここで示した値より大きな値を検索時最大ワークメモリサイズに指定す ることをお勧めします。
(1) SGML プラグインおよび n-gram インデクスプラグインの場合
(a) ユーザ用 RD エリア容量
SGMLTEXT 型列を定義した表を格納するユーザ用 RD エリアの容量は,次の値で見積もってください。
ユーザ用 RD エリアの見積もり式は,マニュアル「HiRDB システム導入・設計ガイド」を参照してくだ さい。
設定個所 変数 設定値
各列のデータ長 di 26[バイト]
(b) ユーザ LOB 用 RD エリア容量
HiRDB のユーザ LOB 用 RD エリアの容量の見積もりでは,次に説明する SGMLTEXT データ格納用 RD エリアと n-gram インデクス情報格納用 RD エリアの容量を計算します。
SGMLTEXT データ格納用 RD エリア
次の値を設定して,SGMLTEXT データを格納するユーザ LOB 用 RD エリアの容量を見積もってくだ さい。ユーザ LOB 用 RD エリアの容量の見積もり式は,マニュアル「HiRDB システム導入・設計ガ イド」を参照してください。
設定個所 変数 設定値
LOB 列の行の総数 b 2 + 登録文書数
各 BLOB データのデータ長 Cj 次の説明を参照してください
C1 のサイズ
C1 = 2,629,632[バイト]
C2 のサイズ
C2 = 1,318,912[バイト]
Cj のサイズ
一般の場合
Cj = ↑(docsize×2.5)/8192↑×8192 + 8192(j > 2)[バイト]
DocumentBroker を使用している場合
Cj = ↑(docsize×2.5)/8192↑×8192 + 8192 + docbrodtdsize(j > 2)[バイト]
Preprocessing Library for Text Search を使用して XML 文書を登録する場合
Cj = ↑(docsize×1.5)/8192↑×8192 + 8192(j > 2)[バイト]docsize:1 文書当たりのサイズ[バイト]
docbrodtdsize:DocumentBroker に定義した DTD サイズ[バイト]
n-gram インデクス情報格納用 RD エリア
次の値を設定して,n-gram インデクス情報を格納するユーザ LOB 用 RD エリアの容量を見積もって ください。ユーザ LOB 用 RD エリアの容量見積もり式は,マニュアル「HiRDB システム導入・設計 ガイド」を参照してください。
注意事項
• 差分インデクスまたは分割遅延登録を使用する場合は,指定した差分インデクスサイズまたはイ ンデクス分割遅延登録用領域サイズを加算したサイズとなります。
• 1 つの RD エリアの最大サイズは 64GB です。64GB を超える場合は表分割してください。
• インデクスのサイズは,登録テキスト(削除更新で発生した無効部分を含む)の 3〜5 倍となり ます。
• インデクス容量の上限は設計値であり,性能を考慮し,上限以下で分割することを推奨します。
• 1RD エリア当たりのインデクスで管理できる 1 つの文字および文字列を登録できる上限は約 21 億個です。例えば,半角数字を多く含むテキストを登録するシステムでは,表分割をしない場 合,1 つのインデクスには,すべての文書に含む 0〜9 のどれかで合計約 21 億文字(2GB)を 超えることが想定されるときには,表分割が必要となります。
設定個所 変数 設定値
LOB 列の行の総数 b 8
各 BLOB データのデータ長 Cj 次の説明を参照してください
C1 のサイズ
C1 = max((↑(24×doccnt)/8192↑+↑(4×doccnt)/(512×8192)↑
+↑(4×doccnt)/(1024×8192)↑)×8192 + 8192, 128000 + 8192)
C2 のサイズ
概念検索を使用する場合
C2 = 4875×8192 + 8192概念検索を使用しない場合
C2 = 3750×8192 + 8192
C3 のサイズ
通常インデクスの場合または英文検索用インデクス(ENGLISH)の場合
C3 = max(↑(doccnt×docsize×3)/8192↑×8192 + 8192,200×1024×1024)
インデクス作成ルール追加機能(INDEX_ALL)を使用した場合
C3 = max(↑(doccnt×docsize×7)/8192↑×8192 + 8192,200×1024×1024)
インデクス作成ルール追加機能(INDEX_MEDIUM)または英文検索用インデクス
(ENGLISH_STANDARD)を使用した場合
C3 = max(↑(doccnt×docsize×5)/8192↑×8192 + 8192,200×1024×1024)
文字単位インデクス作成機能(INDEX_GRAM1)を使用した場合
C3 = max(↑(doccnt×docsize×2)/8192↑×8192 + 8192,200×1024×1024)
検索高速化インデクス(V2)機能(INDEX_V2)を使用した場合
• 通常インデクスの場合
C3 = max(↑(doccnt×docsize×4)/8192↑×8192 + 8192,250×1024×1024)
• インデクス作成ルール追加機能(INDEX_ALL)を使用した場合
C3 = max(↑(doccnt×docsize×9)/8192↑×8192 + 8192,250×1024×1024)
• インデクス作成ルール追加機能(INDEX_MEDIUM)を使用した場合
C3 = max(↑(doccnt×docsize×7)/8192↑×8192 + 8192,250×1024×1024)
• 英文検索用インデクス(ENGLISH)を使用した場合
C3 = max(↑(doccnt×docsize×5)/8192↑×8192 + 8192,250×1024×1024)
• 英文検索用インデクス(ENGLISH_STANDARD)を使用した場合
C3 = max(↑(doccnt×docsize×8)/8192↑×8192 + 8192,250×1024×1024)
C4 のサイズ
C4 = 160×8192 + 8192
C5 のサイズ
C5 = 160×8192 + 8192
C6 のサイズ
CREATEMODE=0 の即時登録用インデクスおよび CREATEMODE=1 の初期分割登録用インデクス の場合
C6 = 0
CREATEMODE=2 の分割遅延登録用インデクスの場合(DELAY_SIZE 設定値のインデクス分割遅延 登録用領域サイズ)
C6 = C1×2 + 1024×1024
ただし,C1中の doccnt は分割遅延登録文書数です。
CREATEMODE=3 の分割遅延登録・更新系 SQL 同時実行用インデクスの場合(DELAY_SIZE 設定値 の遅延登録時に情報を退避する領域サイズ)
C6 = 16×delaydoccnt + 12×8192
C7 のサイズ
統合統計情報を反映していない場合
C7 = 0統合統計情報を反映した場合(1 回目)
C7 = ↑反映する統合統計情報ファイルサイズ(バイト)/8192↑×8192 + 8192
統合統計情報を反映した場合(2 回目以降)
C7 = 1 回目に反映したサイズ+↑(反映する統合統計情報ファイルサイズ(バイト)−1 回目に反 映したサイズ)/4188↑×4188
C8 のサイズ
UCS4 インデクスでない場合
C8 = 0UCS4 インデクスの場合(初期作成)
C8 = 50×1024×1024
UCS4 インデクスの場合
次のサイズを Available Work Area Size(使用可能ワーク領域サイズ)※1に確保してください。
C8 = 200×1024×1024 + doccnt×1 文書中の UCS4 文字数※2×7
検索高速化インデクス(V2)機能(INDEX_V2)を使用した場合
•
UCS4 インデクスの場合
次のサイズを Available Work Area Size(使用可能ワーク領域サイズ)※1に確保してください。
C8 = 350×1024×1024 + doccnt×1 文書中の UCS4 文字数※2×7 注※1
インデクス情報の取得ユティリティを使って取得したインデクス情報に表示されます。インデクス 情報の取得ユティリティについての詳細は,「3.2.9 phnidxls(インデクス情報の取得ユティリ
ティ)
」を参照してください。また,HiRDB のデータベース構成変更ユティリティを使用すると,RD エリアが拡張されます。pdmod(データベース構成変更ユティリティ)については,マニュア ル「HiRDB コマンドリファレンス」を参照してください。
注※2
UCS4 で表現できる文字の中で,UCS2 を超える範囲。
0x00010000〜0x7fffffff doccnt:登録文書数
docsize:平均登録文書長[バイト]
delaydoccnt:分割遅延登録文書数
(c) データディクショナリ用 RD エリアの容量
Text Search Plug-in で,SGMLTEXT 型や NGRAM インデクス型を表に適用する場合は,次の値を設定 して HiRDB のデータディクショナリ用 RD エリアの容量を見積もってください。データディクショナリ 用 RD エリア容量の見積もり式は,マニュアル「HiRDB システム導入・設計ガイド」を参照してください。
•
表の格納ページ数の設定項目と設定値
設定項目 設定値
ユーザ定義型の名称長の平均値 8[バイト]
プラグインオプション指定長の平均値 72+DTD 名称長+正規化パラメタ名称長
[バイト]
ユーザ定義型の総数 1[個]
1 データ型当たりの属性数の平均値 1[個]
データ型識別子の長さの平均値 8[バイト]
ユーザ定義型で定義された属性数 1[個]
プラグインの総数 2[個]
プラグイン名称の長さの平均値 8[バイト]
抽象データ型/インデクス型名称の長さの平均値 8[バイト]
インデクス型の総数 1[個]
インデクス型識別子の長さの平均値 4[バイト]
抽象データ型名称の長さの平均値 8[バイト]
プラグインインデクスの総数 1[個]
インデクス型識別子の長さの平均値 4[バイト]
抽象データ型名称の長さの平均値 8[バイト]
抽象データ型で定義された属性の総数 1[個]
プラグインインデクス適用関数名称の長さの平均値 10[バイト]
1 プラグインインデクス当たりの適用関数の数 30[個]
LOB 列を定義した表の総数 ユーザ LOB 列に加えて SGMLTEXT 型列を定義した表
の数
1 プラグイン当たりのパラメタ名称の長さの平均値 30[バイト]
プラグインライブラリパス名称の長さの平均値 255[バイト]
プラグインの注釈の長さの平均値 255[バイト]
1 インデクス型当たりの適用関数の数 30[個]
サブタイプとして定義された抽象データ型の総数 0[個]
抽象データ型の総数 SGMLTEXT は 1 個として加算
•
インデクスの格納ページ数の設定項目と設定値
設定項目 設定値
作成するユーザ定義データ型の数 1[個]
ユーザ定義データ型名称の長さの平均値 8[バイト]
設定項目 設定値
1 ユーザ定義データ型当たりの属性数の平均値 1[個]
ユーザ定義データ型属性名称の長さの平均値 30[バイト]
プラグイン名称の長さの平均値 8[バイト]
作成するプラグイン数 2[個]
インデクス型名称の長さの平均値 8[バイト]
プラグイン関数の数の平均値 30[個]
複数ある場合は各プラグインの適用関数の数との平均
プラグイン関数名称の長さの平均値 20[バイト]
1 プラグイン関数当たりのパラメタ数の平均値 6[個]
1 プラグイン関数当たりのパラメタ名称の長さの平均値 8[バイト]
(d) レジストリ用 RD エリア容量
Text Search Plug-in が使用する HiRDB のレジストリ用 RD エリアの容量は,次の値で見積もってくだ さい。レジストリ用 RD エリア容量の見積もり式は,マニュアル「HiRDB システム導入・設計ガイド」
を参照してください。
•
レジストリ管理表の格納ページ数
設定個所 変数 設定値
レジストリ管理表のコンテキスト数 a 3
レジストリコンテキスト名長 c 16[バイト]
アクセスパスワード長 d 12[バイト]
レジストリ管理表のキー値数 e レジストリ管理表に登録したキー名称の数
レジストリキー名称長 f DTD 登録名称長+正規化パラメタ登録名称長[バイト]
レジストリキー値長 g DTD 長+正規化パラメタ長[バイト]
•
レジストリ管理表のインデクス格納ページ数
設定個所 変数 設定値
レジストリコンテキスト名長 a 16[バイト]
レジストリキー名称長 f DTD 登録名称長+正規化パラメタ登録名称長[バイト]
(e) レジストリ LOB 用 RD エリア容量
Text Search Plug-in が使用する HiRDB のレジストリ LOB 用 RD エリアの容量は,次の値で見積もって ください。レジストリ LOB 用 RD エリア容量の見積もり式は,マニュアル「HiRDB システム導入・設計 ガイド」を参照してください。