6. データ変換定義シート
6.3. 項目説明
6.3.2. データ変換動作定義
項目名(パラメタ名) 概要 詳細説明
変換エラー時の扱い 変換エラー時の扱いを指定します。 以下から選択して指定します。
(省略値は“中断”です。)
・中断
処理を中断します。
・継続
後続の変換処理を継続します。
メモリサイズ データ変換機能で利用するメモリサイズをメガ バイト(MB)で指定します。
指定サイズを超えるメモリが必要となる場合、ワ ークディレクトリで指定した作業ディレクトリ に、一時ファイルが作成されます。
本パラメタは以下の変換機能で有効になります。
・ソート
・集計
以下の範囲で指定します。
(省略値は“100”です。)
100 ≦ メモリサイズ ≦ 3072(MB)
文字コード変換 エラー発生時の動作
コード変換でエラーが発生した場合の動作を指 定します。
以下から選択して指定します。(省略値は“中断”です。)
・中断
処理を中断します。
・継続
代替文字を使用して処理を継続します。
文字コード変換 エラー発生時の 代替文字
コード変換でエラーが発生した場合の 代替文字を指定します。
半角文字および全角文字の代替文字を“XX:YYYY”の形 式で指定します。
本キーワードを省略した場合、それぞれ半角および全角 のアンダースコアに対応するコードが採用されます。
“XX”および“YYYY”に設定する値は、代替文字を出力 データのコード系の16進数で表現した値です。
“XX”に指定したコードは英数字属性(CHARなど)の代替
文字、“YYYY”に指定したコードは日本語属性(NCHAR など)の代替文字になります。
指定例は、「7E:81A0」となります。
項目名(パラメタ名) 概要 詳細説明 Unicode変換
エラー発生時の 代替文字
Unicode系を出力コードとする場合のコード変換
エラー時の代替文字を指定します。
1バイトおよび2バイトの代替文字を“Unicode系の形 式:1 バイト系文字用代替文字:2バイト系文字用代替文 字”の形式で指定します。
本キーワードを省略した場合、それぞれ半角および全角 のアンダースコアに対応するコードが採用されます。
・UCS-2
1 バ イ ト 系 お よ び 2 バ イ ト 系 の 代 替 文 字 を
“TYPE:XX:YYYY”の形式で指定します。
“TYPE”には“ucs2”を指定します。
“XX”に指定したコードは英数字属性(CHAR など)
の代替文字となります。0x00~0x7Fまでの
“点(cell)”のみを16進で指定します。
(設定される代替文字は、0x00XX~0x007Fで設定さ れます)
“YYYY”に指定したコードは日本語属性(NCHAR な
ど)の代替文字になります。
0x0080~0xD7FF,0xE000~0xFFFF を文字コードの
“区(row)”、“点(cell)”の順に指定します。
・UTF-8
バ イ ト 系 お よ び 2 バ イ ト 系 の 代 替 文 字 を
“TYPE:XX:TTMMBB”の形式で指定します。
“TYPE”には“utf8”を指定します。
“XX”に指定したコードは英数字属性(CHAR など)
の代替文字となります。
0x00~0x7Fまでを16進で指定します。
“TTMMBB”に指定したコードは日本語属性(NCHAR など)の代替文字になります。
2バイト文字を指定する場合
“TT” : 0xC2~0xDFの範囲を16進で指定 “MM” : 0x80~0xBFの範囲を16進で指定 “BB” :“00”を指定
3バイト文字を指定する場合
“TT” : 0xE0~0xEFの範囲を16進で指定 “MM” : 0xA0~0xBFの範囲を16進で指定 “BB” : 0x80~0xBFの範囲を16進で指定 (16進の表記は大文字/小文字の区別はありません。) データが使用しているUnicode系の形式とキーワードで 指定した形式が異なる場合は、データが使用している
Unicode系のタイプに対応する文字に変換して使用しま
す。
例:出力先のUnicode系の形式がUCS-2で本キーワード に“utf8:3F:C2BB00”が指定されている場合、それぞ れの文字(0x3Fと0xC2BB00)に対応するUCS-2のコー ドに変換して使用します。
数値演算のNULLの 扱い
数値演算式における空の扱いを指定します。
本パラメタは以下の演算・変換機能で有効になり ます。
・四則演算
・項目条件判定で指定した算術演算
・集計
以下から選択して指定します。
(省略値は“NULLとする”です。)
・0として演算
数値演算式における算術演算において、空を0とみ なして演算を行います。
・NULLとする
数値演算式における算術演算において、演算対象に 空が含まれる場合、演算結果はすべて空を返しま す。
変 換 時 の文字 コード の扱い
データ変換で扱う文字コードを指定します。
演算式にプラグインを指定し、文字コードを指定 したい場合は選択してください。
以下から選択して指定します。
・SJMS :Sjis-ms
・S90 :S90(EUC)
・UTF8 :utf8(Unicode)
(省略時は入出力の文字コードから最適なコード系を 自動設定します。詳細は表下部の留意事項を参照)
項目名(パラメタ名) 概要 詳細説明 環境変数 プラグインとして実行する実行形式モジュール
が使用する環境変数名を指定します。
255文字以内の英数字および記号で指定します。
環境変数は以下の形式で指定してください。
XXX=/fff XXX=yes
複数の環境変数を指定するときには、
環境変数ごとに改行してください。
同じ環境変数がある場合には最後に記述した値が 有効になります。
【「変換時の文字コードの扱い」の留意事項】
「変換時の文字コードの扱い」について、以下に示す留意事項があります。
1) 「変換時の文字コードの扱い」は、変換前データ、変換後データの「データ形式」が共に以下のいずれかの場合のみ有効です。
・ 一般
・ 一般(繰り返しあり)で、「項目繰り返し(可変)」が設定されていない場合
2) 「変換時の文字コードの扱い」を省略した場合、以下の動作となります。
・ 入出力の文字コードが統一されている場合、その文字コードで変換を実施します。
・ 入出力の文字コードが異なっている場合、出力側の文字コードで変換を実施します。
・ 出力側がShift-JIS,EUC,UTF-8以外である場合、WindowsはShift-JIS, UNIX系はUTF8で変換を実施します。
ただし、UNIX系ではJEFcore系、IBM系、UTF16、UTF84、U90HPのようにUTF8に変換できない文字が出力側に存在する場合は Shift-JISで変換を実施します。
【入力と出力の文字コード系の留意事項】
データ変換定義シートの変換前データと変換後データで使用するフォーマット定義において、文字コードに関して、以下に示す留意 事項があります。
1) Information Integrator のデータ変換・編集機能は、入力コード系と出力コード系が同じ場合でも、出力のコード系がShift-JIS、
EUC(S90)、またはUTF-8以外の場合(入力/出力コードがJEFの場合等)、内部処理でShift-JISコードに変換してからデータ変 換・編集を行います。その場合、入力データの中にShift-JIS(注)で表現できない文字が含まれていると、データ変換・編集処 理が処理中断、または代替文字に置き換えて処理を継続します。
運用を開始する前に、利用するコード系/文字コードの範囲を確認してください。Shift-JISで表現できない文字が存在する場 合の対策としては、Information Integratorのコード変換テーブルをカスタマイズしてください。
コード変換テーブルのカスタマイズ方法は、「システム設計ガイド」の"第10章 文字コード変換の準備"、および「コマンドリ ファレンス」の"ifihscust(文字コード変換テーブルカスタマイズ) "を参照してください。
また、処理を中断するか、代替文字に置き換えて処理継続するかは、データ変換定義のデータ変換動作定義の指定に従います。
(注) Shift-JISで表現できる文字
・ JIS非漢字
・ JIS漢字
・ 拡張文字
- NEC特殊文字 - NEC/IBM選定文字 - IBM拡張文字
・ 外字(1880文字以内)
2) 入力コードと出力コードがShift-JISの場合、データ変換定義で以下の演算式を指定して、Shift-JISの拡張文字の中の重複し た文字が入力データに含まれている場合、入力と出力で異なるコード(例:0x8790→0x81e0)となります。
・ 全角/半角変換
・ 大文字/小文字変換
・ カタカナ/ひらがな変換
・ トリム
・ パディング
・ 濁点/半濁点変換
3) データ構造定義のデータ形式が以下の場合、内部処理でShift-JISコードに変換してからデータ形式の操作を行います。
<内部処理でShift-JISコードに変換するデータ形式>
・ 伝票形式
・ 一般(繰り返しあり)で、「項目繰り返し(可変)」が設定されている場合 データ形式の操作はOSにより以下のように異なります。
[Windows(32bit)の場合]
入力のデータ形式が上記の場合で、かつ、入力コードがShift-JISコード以外の場合、まず入力コードからShift-JISコードへ 文字コード変換します。この際、データ変換定義で指定するパラメタ(注1)は有効となりません(注 2)。その後、Shift-JIS コードから出力コードに文字コード変換を行いますが、この文字コード変換ではデータ変換定義で指定するパラメタ(注1)は 有効です。
また、出力のデータ形式が上記の場合で、かつ、入力コードがShift-JISコード以外の場合、まず入力コードからShift-JISコ ードへ文字コード変換します。この際、データ変換定義で指定するパラメタ(注 1)は有効です。その後、Shift-JISコードか ら出力コードに文字コード変換を行いますが、この文字コード変換ではデータ変換定義で指定するパラメタ(注1)は有効とな りません(注2)。
Shift-JISコードで表現できない文字が含まれている場合の注意事項は、上記の1)と同等です。ただし、注2に該当(パラメタ
が有効とならないパターン)する場合の対策は、Interstage Charset Managerによるコード変換テーブルのカスタマイズです。
[UNIXまたはWindows(64bit)の場合]
入力のデータ形式が上記の場合で、かつ、入力コードがShift-JISコード、EUC(S90)コード、または、UTF-8コード以外の場合、
まず入力コードからShift-JISコードへ文字コード変換します。この際、データ変換定義で指定するパラメタ(注1)は有効と なりません(注2)。その後、Shift-JISコードから出力コードに文字コード変換を行いますが、この文字コード変換ではデータ 変換定義で指定するパラメタ(注1)は有効です。
また、出力のデータ形式が上記の場合で、かつ、出力コードがShift-JISコード、EUC(S90)コード、または、UTF-8コード以外 の場合、まず入力コードからShift-JISコードへ文字コード変換します。この際、データ変換定義で指定するパラメタ(注1)
は有効です。その後、Shift-JISコードから出力コードに文字コード変換を行いますが、この文字コード変換ではデータ変換定 義で指定するパラメタ(注1)は有効となりません(注2)。
Shift-JISコードで表現できない文字が含まれている場合の注意事項は、上記の1)と同等です。ただし、注2に該当(パラメタ
が有効とならないパターン)する場合の対策は、Interstage Charset Managerによるコード変換テーブルのカスタマイズです。
<注1:データ変換定義の文字コード変換に関するパラメタ>
・ 文字コード変換-エラー発生時の動作
・ 文字コード変換-エラー発生時の代替文字
・ Unicode変換-エラー発生時の代替文字
<注2:注1以外に有効とならない設定情報>
・ ifihschgtbl(文字コード変換テーブル切替え)
・ ifihscust(文字コード変換テーブルカスタマイズ)