• 検索結果がありません。

クラスタ分類法による初期条件の設定

N/A
N/A
Protected

Academic year: 2021

シェア "クラスタ分類法による初期条件の設定"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

クラスタ分類法による初期条件の設定

(株)建設技術研究所

○青山 定敬

日大生産工 工藤 勝輝 藤井 寿生 西川 肇

はじめに

衛星データを使って作成される土地被覆分 類画像データは,洪水シミュレーションモデ ルや植生図の作成等,様々な分野で利用が期 待されるデータである。

衛星データを使った土地被覆分類手法は,

一般に最尤法に代表される教師付き分類法と

K-means法やISODATA法に代表される教師

なし分類法(クラスタ分類法)に大別される。

教師付き分類法は,分類者があらかじめ土 地被覆の地物毎に画像の特徴量を表す統計デ ータを抽出し,これに基づき該当する最適な 地物に分類する方法である。この方法による 分類は,分類精度があらかじめ抽出する教師 データの統計量の精度に依存し,教師データ 取得者の熟練度によって答えが左右されると いう問題がある。

一方,教師なし分類法はコンピュータが自 動的に土地被覆を分類するため,人の熟練度 とは関係なく分類できるが,分類の初期条件 設定によって答えが左右されるという問題が ある。この場合,分類クラスタ数をあらかじ め設定するk-means法よりも,分類クラスタ 数を画像の特徴によって自動的に設定する

ISODATA法の方がより人を介さずに分類画

像を作成することができる。

本研究は,クラスタ分類法のISODATA法 を土地被覆分類画像作成等の実利用に用いる ことを目的とし,ISODATA法における最適 な初期条件設定方法について検討した結果を 報告する。

使用ソフト及びデータ

ISODATA

法による分類は,初期条件とし

てクラスタの最小サイズ(最小限の画素数),

クラスタ間の限界距離を設定することで,自 動的に分類クラス数及びそれに応じた分類画

像を作成する方法であり,クラスタ間距離が 限界距離内に入っているクラスタや最小サイ ズに満たないクラスタは,他の隣接するクラ スタと統合し,最適なクラスタに分類される。

本研究で使用するISODATA法による分類 画像作成ソフトウェアは,初期パラメータが 分類結果に与える影響を把握するため,著者 自作のものを用いた。

また,分類画像を作成するための衛星リモ ートセンシングデータは,RESTECがインター ネットで公開しているALOSのAVNIR-2オルソ ライトサンプル画像(山梨,2008年5月22日観 測,処理レベル1B2R)を使用し,研究用に甲 府駅南側周辺を横200画素×縦200画素に切り 出した画像を用いた。分類画像作成に使用し たバンドは,バンド1~4の4バンドである。

シミュレーション条件

(1)初期クラスタ設定

ISODATA法では,あらかじめ各クラスタ

の輝度値を設定しなければならない。

分類結果は,この設定方法に依存する。

本研究では,各バンドにおいて輝度をあら かじめ設定した区分数に従い,等間隔で区分 したクラスタを設定するという方法を採用し た。この場合,区分範囲は,各バンドの最小 値から最大値の範囲を用いた。

2次元座標における初期クラスタ設定の概 念図を図1に示す。

この初期クラスタの設定方法は,各バンド 間をマトリックスで区分する全クラスタを対 象とし,かつ最小値から最大値の範囲のみを 対象とすることでよりきめ細かくクラスタを 設定できるという特徴がある。この方法では 例えば,4バンドをそれぞれ10分割した場合 の初期クラスタ数は,10000(=10

4

)クラス タになる。

Initial Condition Setting in Cluster Classification Method

Sadayoshi AOYAMA, Katsuteru KUDOH, Hisao FUJII and Hajime NISHIKAWA

−日本大学生産工学部第42回学術講演会(2009-12-5)−

― 155 ― 3-47

(2)

50 100 150 200 250 50

100 150 200 250

分割数:6 分割数:8

バンド1の輝度

バンド2の輝度

バンド2の 分割範囲 バンド1の

分割範囲

初期クラスタ数=8×6=48

クラスタ設定輝度

図2 初期クラスタ設定概念図

(2次元の場合)

各バンドの初期クラスタの設定輝度は,各 バンドの輝度の最小値と最大値,そして分割 数を基に,次式により設定した。

L=(最大輝度-最小輝度+1)/N (1) Di=L×i+L /2+最小輝度 (2)

ここで,Di:クラスタ番号iにおけるクラ スタ設定輝度,

L

:分割範囲,

N

:分割数,i:

各バンドのクラスタ番号で0~(N-1)の範 囲で設定。

本研究では初期クラスタをデータ全体に網 羅的に設定することから,分類結果に対する クラスタ分離アルゴリズムの違いによる影響 を排除するため,クラスタ分離処理は行わな いことにした。

(2)初期パラメータ設定

ISODATA法において初期条件を変化させ

た場合,分類クラス数及び分類精度がどのよ うに変化するかを調べた。評価する分類クラ スは実際の土地被覆状況との違いについて評 価しやすいという理由で,水域を選定した。

調査は次の3パターンについて実施した。

ケース1:最小サイズを変化させた場合 ケース2:限界距離を変化させた場合 ケース3:初期クラスタ数を変化させた場合 ここで,限界距離はユークリッド距離を用 いた。

検討結果

(1)最小サイズによる影響

限界距離を10と13,各バンドの区分数を10 とした場合の最小サイズによる分類結果(水 域ピクセル数)への影響を図3に示す。

0 5000 10000 15000

0 200 400 600

最小サイズ

ピク

限界距離10 限界距離13

図3 最小サイズによる影響

(2)限界距離による影響

最小サイズを10,各バンドの区分数を10と した場合,限界距離の違いによる分類結果(水 域ピクセル数)への影響を図4に示す。

0 3000 6000 9000 12000

0 5 10 15 20

限界距離

ピクセ

図4 限界距離による影響

(3)初期クラスタ数による影響

初期クラスタ数をできるだけ細かく(数多 く)設定する方が分類精度は高くなると考え,

最小サイズを10,限界距離を10とした場合の 初期クラスタ数による分類結果(水域ピクセ ル数)への影響を図5に示す。

0 500 1000 1500

2 4 6 8 10

1バンド当たりの区分数

ピク

図5 初期クラスタ数による影響

まとめ

本研究で得られた結果は次のとおり。

(1)最小サイズは,これが大きい場合は分 類精度が悪くなるが,小さいほど分類精度が 高くなり,ある一定の値以下では分類精度は 限界距離等の他の影響により決まることが示 された。このため,精度の良い分類を行うに は,最小サイズはできるだけ小さい値を採用 することが望ましい。

(2)初期クラスタ数による分類精度への影 響は,他の要因よりも強くないという結果を 得た。このため,初期クラスタ数を数多く設 定せずとも十分な分類精度を得ることが可能 であることが分かった。

(3)最小サイズを小さい値とした場合,分 類精度に最も影響を及ぼすのは限界距離であ る。このため,

ISODATA

法の初期設定に当 たっては,限界距離の設定に特に注意を払い,

複数の限界距離による分類作業の実施と確認 が望ましいと考える。

おわりに

本研究では初期クラスタの設定は各バンド の最小値と最大値の範囲内で等分としたが,

密度分布等の他の設定方法についても検討が 必要と考える。今後は実利用に向け,本研究 を発展させるものとする。

― 156 ―

参照

関連したドキュメント

Rによるクラスター分析〔K-means法〕 1.クラスタ分析概要 クラスタ分析とは? 複数の対象(もの,変数など)を,そ の 属性 によって 類似度( similarity)

検出モードには,任意の質量数を選択しその質量数の時間変化を表示するマスクロマトグラム法

結論

MPISP ~et_communicator 機能:指定されたクラスタにおけるデフォル トのコミュエケータを取得する 入力:仮想クラスタ ID

本研究では, ラフ集合を用いた複数の決定表の分類について考察し, 考えられる – 方法 について述べたが,

近年の情報技術の発達に伴い,大規模データに対する

このセクションでは、Net-It Central サイトの公開開始および終了日を設定することができま

概要:本論文では,学習分類子システム Learning Classifier System: LCS において,学習する分類子数 を削減するために,Compact