数 1-数 2
4.3.6 異表記展開指定
異表記オプション 展開モード 説明
4.指定した文字列
ひらがな拗音展開 Y ひらがなの拗音の展開をします。
英単語派生表記展開※ S 半角英文字の文字列を派生語に展開します。
英単語語尾表記展開※ I 英単語を語尾の変換系に展開します。
注※ このオプションを使用するには,Text Search Enhancer for English が必要です。
これら展開モードは単独で指定するだけではなく,組み合わせて指定することもできます。例えば,全角 文字のアルファベット大小文字展開,および全角半角文字展開をする場合は,「AE」と指定します。展開 モードの指定がない場合は,「AKE」が指定されたと仮定されます。なお,「BCL」を指定した場合は,「K」
を指定したときと同じ展開となります。
展開モードは,順不同で指定できます。必要な組み合わせを指定してください。
異表記展開指定時の注意事項
長大な英文に対してアルファベット大小文字展開を実行したり,長大なカタカナ文字列に対してカタカ ナ異表記展開を実行したりすると,展開数の増加によって,多大なリソースが必要になったり,レスポ ンスが低下したりすることがあります。
異表記展開指定をする場合は,次のような点に留意してください。
• エンドユーザが自由に検索条件を指定できるようなシステムの場合,環境設定時に,環境定義ファ イルで最大同義語異表記展開数を設定しておくことをお勧めします。これによって,異表記展開数 が多大になった場合にエラーで中断させることができ,システムのリソース消費量を制限できます。
• 長大なカタカナ文字列に対して,カタカナ異表記展開を必ず実行するような運用の場合は,拗音統 一機能を使用してカタカナ展開数を削減してください。拗音統一機能は,インデクス定義時に定義 します。また,環境設定時に,環境定義ファイルで最大同義語異表記展開数を設定して,リソース 消費量の上限値を設定してください。
• 英文に対して,アルファベット大小文字展開を必ず実行するような運用の場合は,異表記展開指定 ではなく,大小文字統一機能を使用することをお勧めします。大小文字統一機能は,インデクス定 義時に定義します。
英文に対して大小文字展開を指定すると,それぞれの単語に対して大小文字展開が実行され,その すべての組み合わせの OR 検索が実行されます。展開数は,「1 単語当たり三つの展開形式+指定文 字列」の 4 パターンとなり,「4 の n 乗(nは単語数)」になります。ただし,指定された文字が展 開パターンと一致する場合は 3 パターンとなり,展開数は「3 の n 乗(nは単語数)」になります。
展開例を次に示します。
指定した英文
long long ago ,there were three little pigs.
アルファベット大小文字展開の結果
long long ago ,there were three little pigs.
Long long ago ,there were three little pigs.
LONG long ago ,there were three little pigs.
long Long ago ,there were three little pigs.
:
この場合の展開数は「展開数= 3×3×3×3×3×3×3×3 = 38= 6,561 パターン」となります。
さらに,全角半角異表記展開を同時に指定した場合は,それぞれの展開結果をすべて全角とすべて 半角の 2 パターンに展開するため,展開数が 2 倍になります。
展開数の増加は,リソースの増加およびレスポンスの低下につながるので,このような検索は避け てください。
• 長大なカタカナ文字列に対して,カタカナ異表記展開を必ず実行するような運用の場合は,拗音統 一機能を使用してカタカナ展開数を削減してください。拗音統一機能は,インデクス定義時に定義 します。また,環境設定時に,環境定義ファイルで同義語異表記展開用最大メモリサイズを設定し て,リソース消費量の上限値を設定してください。
長大なカタカナ文字列に対してカタカナ異表記展開を指定すると,カタカナ文字列のそれぞれの部 分に対してカタカナ異表記展開が実行され,そのすべての組み合わせの OR 検索が実行されます。
なお,カタカナ異表記展開は,アルファベット大小文字展開や全角半角展開のように明確な規則に 従った展開でなく,XML Extension で設定されているルールに基づいて展開されます。このため,
カタカナ文字列によって展開数は異なります。
展開例を次に示します。
指定したカタカナ文字列
バイクバイクバイクバイクバイク
カタカナ異表記展開の結果
「バイク」は「ヴアイク」,「ヴァイク」,「ヴアィク」,「ヴァィク」,「バイク」,「バィク」の 6 パター ンに展開されるため,それぞれ「バイク」の部分を 6 パターンに展開した組み合わせが検索条件に なります。したがって,例のように「バイク」が 5 回つながっているようなカタカナ文字列の展開 数は,「展開数= 6×6×6×6×6 = 65= 7,776 パターン」になります。
展開数の増加は,リソースの増加およびレスポンスの低下につながるので,このような検索は避け てください。
• 展開速度を落とさずに検索を実行するには,部分展開検索モードを指定して検索を実行してくださ い。この検索モードを使用するかどうかは,環境定義ファイルで指定します。指定方法については,
「2.6.2(2) 設定できる項目」を参照してください。なお,部分展開検索モードで検索を実行する と,システムのリソース消費量が増加します。このため,検索最大ワークメモリサイズ
(phj_mem_search)の設定値を見直す必要があります。検索最大ワークメモリサイズで指定したメ モリサイズを超えた場合には,「メモリ不足エラー」,「検索用ワークファイルを使用する」のどちら かを指定できます。
指定例
SOUNDEX_EXP( "COMPUTER","AE" ) 異表記展開の例を次に示します。