• 検索結果がありません。

データベース 講義資料 第 12 回 物理的データ格納方式 九州工業大学

N/A
N/A
Protected

Academic year: 2021

シェア "データベース 講義資料 第 12 回 物理的データ格納方式 九州工業大学"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

データベース 講義資料 第 12 回 物理的データ格納方式

九州工業大学 情報工学部 講義担当:尾下真樹

1. 物理的データ格納方式

リレーションナルデータベースでは、データベースに格納されるデータは、リレーション(表形式のデータ構造)としてモデル 化される。リレーションはあくまで概念的なモデルであり、実際には、リレーションは何らかの方法でハードディスク上に配置 されて格納されることになる。一般にデータベースシステムでは大量のデータを扱う必要があるため、全てのデータはメモリ上 には入りきらず、ハードディスク上に格納される必要がある。しかし、ハードディスクへの読み書きは、メモリへの読み書きに 比べると、ハードウェアの制約上、多くの処理時間がかかる。従って、高速な処理を実現するためには、ハードディスクに対し て効率的にデータを読み書きできるような、データの格納方法や検索方法の工夫が必要となる。リレーショナルデータモデルは 概念的なモデルであり、このような格納・検索方法は規定されていないため、各データベースシステムで工夫されることになる。

1.1. データ格納方法

ハードディスク上にリレーションを格納する際には、リレーション中の各データ(インスタンス、タプル)を一つのレコードと し、レコードを連続的に配置することになる。このとき、ハードディスク上での配置順序を特に考慮せず、追加されたデータを 順番に追加していく順序なしの格納と、キー属性値にもとづいて大小関係を保つように整列して格納する順序付きの格納の大き く2通りの格納方法がある。順序なしの格納の場合、挿入の処理が単純である代わりに、検索に時間がかかる。一方、順序付の 格納の場合、データの追加を行う際にはソートを行った上で適切な位置に挿入する必要があるため、挿入の処理が複雑になる代 わりに、主キー属性にもとづく検索を効率的に行える。これら以外に、順序なしの格納の特殊な例として、ハッシュを使った格 納方法がある(詳細は後述) 。

1.2. データ検索方法

データベースを利用するときには、指定された条件にもとづいてリレーションからデータを検索する処理が必要である。データ の格納方法に応じて、利用可能な検索方法は異なる。データが順序なしで格納されている場合は、基本的に全てのデータを確認 して、条件に合うかどうかを検索するスキャン法を用いることになる。一方、順序付きで格納されている場合は、探索範囲の中 央のデータの属性値と検索条件を比較することで探索範囲を半分に狭める処理を繰り返していく、 探索法を用いることができる。

検索を効率的に実現するための方法として、リレーションに対してインデックスを付加することができる。インデックスを付加 することによって、追加の格納領域が必要になる代わりに、リンデックスを付加した属性での検索を効率的に実現することがで きる。インデックスは、順序付き格納・順序なし格納どちらのリレーションに対しても付加することができる。順序付き格納さ れたリレーションについても、インデックスを付加することで、より効率的に検索を行ったり、キー属性以外の属性でも検索を 行ったりすることができる。

インデックスの更新や検索を効率的に行う方法として、ツリー(多段インデ ックス)がある。ツリーの例として、B

+

-ツリーがある。B

+

-ツリーは、下位 ノードへの参照を格納する中間ノードと、データ(もしくはデータへの参照)

を格納する葉ノードから構成され、どの部分でもツリーの高さが同じ平衡木 となる(常に平衡木となるように更新処理が行われる) 。ツリーの最下段のみ が葉ノード、それ以外の段は全て中間ノードとなる。中間ノードに p 個、葉 ノードに q 個の参照・データが格納であるとすると、 中間ノードに p /2~ p 個、

葉ノードに ( q -1)/2~ q 個の参照・データが格納されるように、ツリー更新時

にノードが分割・統合される。データを検索するときには、一番上のルートノードから、検索条件のキー属性値(ツリーの作成 に用いられている属性値)にもとづいて、中間ノード・葉ノードを辿っていくことで、データを探索できる。データを挿入する ときには、検索と同様の方法でデータを格納するべき葉ノードを探索し、葉ノードに領域が空いていれば、その葉ノードにデー タを追加する。葉ノードに領域が空いていなければ、葉ノードを 2 つに分割する。このとき、ノードを分割したことによって、

上の中間ノードに領域も足りなくなったら、上の中間ノードも分割する。さらに上の中間ノードにも、同様の処理を繰り返し行 う。同様に、データを削除した場合には、葉ノード・中間ノードに格納される最少個数のデータを下回ると、2 つのノードを 1 つのノードに統合する処理を、下から上に繰り返し行っていく。

ハッシュ法は、順序なしのデータ領域をいくつかの領域(バケット)に分け、何らかのハッシュ関数を用いて、各データをどの バケットに格納・検索するかを決定するものである。ハッシュ関数は、キー属性値を入力としてハッシュ値(バケット番号)を 返す関数であれば、どのような関数でも構わない。検索処理では、検索条件の属性値に対応するバケット内からスキャン法を用 いてデータを検索することになる。データ数に対してバケット数が十分にあり、データが全バケットに均等に分布していれば、

効率的に検索を行える。ただし、ハッシュ法は、等号検索にしか用いることができず、範囲検索には用いることはできない。

60 15 26

(60,柴田)

(15,伊達)(26,上杉)

48

(48,織田)

39 45

(39,徳川)(45,豊臣)

26 48

45

1 B

+

-ツリーの例

参照

関連したドキュメント

大気に関わるものでは樹木や雪氷・氷床堆積物 の代替記録からそれなりに分解能の高い資料

これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と

LLVM から Haskell への変換は、各 LLVM 命令をそれと 同等な処理を行う Haskell のプログラムに変換することに より、実現される。

と言っても、事例ごとに意味がかなり異なるのは、子どもの性格が異なることと同じである。その

(2011)

であり、最終的にどのような被害に繋がるか(どのようなウイルスに追加で感染させられる

あれば、その逸脱に対しては N400 が惹起され、 ELAN や P600 は惹起しないと 考えられる。もし、シカの認可処理に統語的処理と意味的処理の両方が関わっ

a.と同一の事故シナリオであるが,事象開始から約 38 時間後に D/W ベン トを実施する。ベント時に格納容器から放出され,格納容器圧力逃がし装置 に流入する