• 検索結果がありません。

分類は 含まれている原子の種類と数を使用する

N/A
N/A
Protected

Academic year: 2021

シェア "分類は 含まれている原子の種類と数を使用する"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

Rを用いた薬の分類

電子情報学類生命情報コース 3306番武田徳明

1.概要

Rを用いて医薬品の分類を行う。分類は 含まれている原子の種類と数を使用する。

2.実験方法

今回Rの分類にはサポートベクターマシ ンとナイーブベイズという関数を使用する。

これに特徴ベクトルである原子の数を学習 させ、クラスラベルの薬の種類を予測する。

今回は ksvm naiveBayes という二つ の 識 別 関 数 を 使 用 し 、 大 ま か な 分 類 の level0と細かな分類のlevel1のそれぞれで 分類を行う。

3.実験に用いたデータ

今 回 の 実 験 で 使 用 デ ー タ は KEGG DRUG(http://www.genome.jp/kegg/drug/d rug_ja.html)の日本の一般医薬品の分類と いうページから薬の種類と原子の数を抜き 出し、使用した。

4.実験データの例

表1:薬の種類と原子の個数の表 name level0 level1 C H O

アスピリン (JP15); アセチルサリチル酸 精神神経用薬 かぜ薬(内用) 9 8 4

アスピリンアルミニウム (JP15) 精神神経用薬 かぜ薬(内用) 18 15 9

アセトアミノフェ (JP15);パラセタモール 精神神経用薬 かぜ薬(内用) 8 9 2 上記のように特徴ベクトルを原子の種類 と数、クラスラベルを薬の種類として表を 作成した。データのサイズは縦382×横24 である。

5.実験結果

表2:分類の正答率

level0 level1

ksvm 38.50% 16.20%

naiveBayes 3.40% 4.20%

ksvmnaiveBayesを用いた分類の結果は 表2のようになった。

6.考察

ksvmnaiveBayesでは全く違う分類の 仕方をしているようである。全体として ksvm は数の多いクラスラベルに予測結果 が偏り、naiveBayesはやや少ないクラスラ ベルに分類が偏った。

元々これらの学習器は2クラス分類の精 度は非常に高いものであるが、多くの種類 の分類になるほど精度は落ちていくようで ある。

さらに今回は特徴ベクトルに原子の数を 使用したが、同じクラスラベルの薬でも目 立った特徴のようなものは見当たらず、こ れも正答率を下げる原因になったしまった。

いくつかの特徴と組み合わせて予測を行え ば正答率が上がるかもしれないが、今回は 時間の関係上これ以上のことは出来なかっ た。

参照

関連したドキュメント

ダウンロードした書類は、 「MSP ゴシック、11ポイント」で記入で きるようになっています。字数制限がある書類は枠を広げず入力してく

人の生涯を助ける。だからすべてこれを「貨物」という。また貨幣というのは、三種類の銭があ

(a)第 50 類から第 55 類まで、第 60 類及び、文脈により別に解釈される場合を除くほか、第 56 類から第 59 類までには、7に定義する製品にしたものを含まない。.

2リットルのペットボトル には、0.2~2 ベクレルの トリチウムが含まれる ヒトの体内にも 数十 ベクレルの

である水産動植物の種類の特定によってなされる︒但し︑第五種共同漁業を内容とする共同漁業権については水産動

一 六〇四 ・一五 CC( 第 三類の 非原産 材料を 使用す る場合 には、 当該 非原産 材料の それぞ

使用済自動車に搭載されているエアコンディショナーに冷媒としてフロン類が含まれている かどうかを確認する次の体制を記入してください。 (1又は2に○印をつけてください。 )

 分析実施の際にバックグラウンド( BG )として既知の Al 板を用 いている。 Al 板には微量の Fe と Cu が含まれている。.  測定で得られる