• 検索結果がありません。

STEP 4. 性能編

4.2 集計のパフォーマンス到達率と Data Explosion(データ爆発)

100% のパフォーマンス到達率の場合

パフォーマンスの到達率を 100% に設定した場合は、考えられるすべての組み合わせの集計を作 成するわけではありませんが、最も多くの集計を作成できる設定値です。前の手順で、100%を設 定した場合は、次のように 23個の集計がデザインされています。

このようにパフォーマンスの到達率を 100% に設定してもすべての組み合わせの集計を作成し ない理由は、Data Explosion(データ爆発)にあります。

Data Explosion(データ爆発)

集計値(デザインされた集計の個数ではなく、属性の各メンバーごとの集計値)は、属性の数が増 え、属性のメンバー数が増えると、指数関数的に、爆発的に大きくなります。これは、次のように 各メンバーの数を考えると分かりやすいと思います。

属性単体では、集計値の数は少なくても、組み合わせ集計の数は、メンバー数のかけ算の数(区分 と年なら 8(区分)x 3(年)=24)になります。前の手順の集計デザイン ウィザードでは、[カ ウント]ボタンをクリックして、メンバー数を数えていたのは、集計値の数を計算するためです。

商品区分が8種類の

場合は8個の集計値 年が3年の場合は

3個の集計値 商品区分が8種類で年が3年の場合の

組み合わせ集計の数は24個(8 x 3)の集計値

区分が8種類

年が9年分 商品が123種類

日付が3,287日分

集計値の数は、属性のメンバー数(N)のかけ算(N1 x N2 x N3 x N4 x …)で計算できるから です。これについて、次の図のような 3 つの階層(商品、年度、店舗)がある場合を考えてみま す。

大分類名称は 18種類、年は 10年分、地域名称は 4種類の場合は、この 3つの属性の組み合わ せ集計は 18 x 10 x 4 720個で済みます。これに対して、階層の下位レベルでの組み合わせ では、商品名称が 43,276種類、年月日(日付)が 3,650日分(10年分)、店舗が 130店だっ た場合には、この 3つの属性の組み合わせ集計は 43,276 x 3,650 x 130 = 20,534,462,000 個(約205億)もの集計値になります。

このように属性の組み合わせ数が増えて、メンバー数が増えると、集計値が指数関数的に、爆発的 に大きくなるので、このような状況を Data Explosion(データ爆発)と呼んでいます。

商品名称 (43,276)

小分類名称 (319)

中分類名称 (98)

大分類名称 (18)

商品階層の属性

(カッコ内はメンバ数)

年月日 (3,650)

月度 (120)

年度 (10)

年度階層の属性

店舗名称 (130)

支店名称 (9)

地域名称 (4)

店舗階層の属性

下位レベル

上位レベル 18 x 10 x 4 =

720 個の集計値 上位レベル同士の組み合わせな

ら集計値は少なくなる

43,276 x 3,650 x 130

= 20,534,462,000 下位レベル同士の組み合わせは

データ爆発になる

集計値

属性のメンバ数 データ爆発