• 検索結果がありません。

or演算子を含んだ関数ノード群を持つGPによる拡張決定木の生成

N/A
N/A
Protected

Academic year: 2021

シェア "or演算子を含んだ関数ノード群を持つGPによる拡張決定木の生成"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

演算子を含んだ関数ノード群を持つ

による拡張決定木の生成

新美 礼彦

田崎 栄一郎

桐蔭横浜大学 工学部 制御システム工学科

はじめに

遺伝的プログラミングをデータマイニングに用いると、進 化計算による確率的な操作により意外な知識を発見することが 期待できる。遺伝的プログラミングでは、染色体表現に構造表 現を用いることにより、使用できる知識表現が決定木からルー ルまで幅広く適用可能である。しかし、適応度関数により個体 を評価する都合上、決定木のように知識全体をカバーできるよ うな形式が主に利用されてきた。一般的な遺伝的プログラミン グによる決定木の記述では、属性による分割条件を で接 続して、ルールとして評価していく。 しかし、遺伝的プログラミングでは、遺伝子表現に置き換え られ適応度関数が定義できれば実装可能である。これは、他の 知識表現も遺伝的プログラミングに実装可能なことを示してい る。そこで本論文では、今までわれわれが行ってきた に よる決定木・ルール表現を検討することにした。まず相関ルー ルなどを参考に、 結合によるルール表現を作成する。そ こに 結合を組み込むことにより、より柔軟な表現による 決定木・ルールの表現を検討した。これらはすべて遺伝的プロ グラミングの関数ノードの定義を置き換えることにより実装し ている。そのため遺伝的プログラミングによる学習の枠組みの 変更は最小限になっている。 検討した決定木、ルール表現による学習の違いを検討する ために、これらの関数ノードと自動関数定義を組み込んだ遺伝 的プログラミングによる学習の統合を行った。これを の の評価データからの決定木生 成問題に適用し、従来の関数ノード定義による学習法による結 果と比較・検討した。

遺伝的プログラミング

遺伝的プログラミング は、生 物進化論の考えに基づいた学習法であり、そのアルゴリズムの 流れは遺伝的アルゴリズム と同様 である。 伊庭 その特徴は染色体表現が と異なり、関 数ノードと終端ノードを用い構造表現ができるように拡張し 連絡先 〒 神奈川県横浜市青葉区鉄町 桐蔭横浜大学 工学部 制御システム工学科 田崎 栄一郎 てあることである。 では、関数ノードと終端ノードを用い て の 式形式で個体を表現する。今回は、決定木を表 現するためにツリー構造を用いた。このため、関数ノードに 条件文、終端ノードをそれぞれの属性値とクラス名を用いて 決定木を表現した。また、本論文では、生成される決定木をコ ンパクトにするため、自動関数定義 を用いた。

による決定木・ルール表現

決定木からルールを抽出する手法からの考え方を用いて、 で決定木を表現するときに関数ノードとして を使うこ とが可能である。 これを拡張して、データベースからの属性と比較できるように 以下の定義を用いることもできる。 新美 新美 その他にも以下のような演算子を用いたルール表現が考えら れる。 一般的な相関ルールでは、条件部分が で結合した形で 表されている。 喜連川 寺邊 これを 形式で表現 すると、相関ルールで定義されていない部分の扱いが困難にな る。そのため、相関ルールを で学習するのは、難しいと考 えられる。また、 により決定木で を表現するには、 同じ部分構造を何度も持たなければならない。それに対して、 は単純に決定木の経路を伸ばしていくだけでよい。この ことから、 を用いた決定木表現では、 を表現した部 分による決定木のサイズの増加のほうが、 を表現した部 分による決定木のサイズの増加よりも起こりやすいことが考え られる。

(2)

を用いた

ここでは、 を含んだルールを によって表現しやすく するため、 と によるルール表現を以下のような関数 ノードとして定義する。 において、多様なルールの表現法を実装するのは比較的 容易である。 や 、 などの実装は、関数ノード の定義を変更するだけで行うことが可能である。関数ノード の定義を変えるだけなので、 による学習の枠組みを変える 必要がない。したがって、場合によっては適応度関数やその他 のパラメータに関しても、そのままのものが使える可能性が ある。 今回の変更でも、関数ノードの定義のみ変更でよく、適応度 関数やパラメータを変更する必要がない。この定義では の時に比べて や を含んだルールを表現しやすくなっ ているので、生成される決定木のサイズの縮小が期待される。 しかし、定義する関数ノードが増えることにより組み合わせの 増加が起こるため、学習速度に関しては、あまり改善を期待で きない。

データベースからの決定木生成問題への

適用

ルール表現の違いによる の学習の違いを検討するために、 評価用データを用いた実験を行った。評価用データには、 の から を使用し た。 これにより、他の手法と比較して提案した手 法がどの程度有効かを検証した。評価データは の つの属性値を持つ などの の属性と の つのクラスからなるデータである。 の全デー タ 件のうち 件を学習用に使用した。 学習データから により決定木を生成した。 のパラ メータは、事前に行った を用いた実験の時と同じもの を用いた。(結果は表 )なお表では、個体のサイズ、木の深 さに関しては、未使用の 定義部分を除いてある。 単体より と でルールを学習した方が、精 度の高いルールを生成することができた。 と の両 方を使用する場合、定義する関数ノードが増えるので、組み合 せの増加が起きる。このため、学習が遅くなり、最良個体獲得 までの世代数が長くなってしまったものと思われる。決定木の サイズ、深さについては を用いたものから改善するこ とができた。 表 各手法による生成決定木の比較 訓練 全体 サイズ 深さ 獲得 世代数 のみ 参考

おわりに

本論文では、遺伝的プログラミングによる決定木ルール表現 を検討し、 形式のルール表現のほかに と を 用いた表現を遺伝的プログラミングに実装した。また、実装 したルール表現の有効性を検証するために、 の から データを用いて、決定 木を構築し、その評価を行った。 その結果、決定木のサイズの改善を行うことができた。ま た、 と を用いたものでは、精度の改善も認められ た。拡張したルール表現は、遺伝的プログラミングの関数ノー ドの定義を置き換えることにより実装している。そのため遺伝 的プログラミングによる学習の枠組みの変更は最小限になって いる。このことより、 や を用いたルール表現も遺伝 的プログラミングでは有効であるといえる。 今後は、他の検証用データを用いた評価を行うとともに、 、 、 や などによるルール表現につい ても利用できるか検討を行い、どのルール表現を使用するかに 関する指針を検討していく予定である。

参考文献

伊庭 伊庭斉志 遺伝的プログラミング 東京電機大学出 版局 喜連川 喜連川 優 データマイニングにおける相関ルー ル抽出技法 人工知能学会誌 新美 新美 礼彦 田崎 栄一郎 無効ノード削除と連続値属 性の適応操作を加えた遺伝的プログラミング 第 回 人 工知能学会全国大会論文集 新美 新美 礼彦 田崎 栄一郎 相関ルールアルゴリズムと 組み合わせた遺伝的プログラミングによる学習 第 回 人工知能学会全国大会論文集 寺邊 寺邊 正大 片井 修 椹木 哲夫 鷲尾 隆 元田 浩 相 関ルールにもとづく属性生成手法 人工知能学会誌

参照

関連したドキュメント

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

第四章では、APNP による OATP2B1 発現抑制における、高分子の関与を示す事を目 的とした。APNP による OATP2B1 発現抑制は OATP2B1 遺伝子の 3’UTR

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

が前スライドの (i)-(iii) を満たすとする.このとき,以下の3つの公理を 満たす整数を に対する degree ( 次数 ) といい, と書く..

に関して言 えば, は つのリー群の組 によって等質空間として表すこと はできないが, つのリー群の組 を用いればクリフォード・クラ イン形

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

このように、このWの姿を捉えることを通して、「子どもが生き、自ら願いを形成し実現しよう