種類のいずれかの値を持ち、

類似度を数値化します。

• 距離 (0 から無限大 )

• 相関 (-1 to 1)

MPP で使用できる類似度 (Similarity)

Euclidian

Squared Euclidian Manhattan

Chebyshev Differential

Pearson Absolute

Pearson Centered

Pearson Uncentered

類似度

類似度の指標は適切なものを選択する必要があります

例

• カテゴリデータへ Euclidian 距離を当てはめるのは適切ではない。

• 高度に歪んだ分布に対して相関の類似度を当てはめると、誤った結果をも

たらすことがある。

クラスタ分析 (1/6)

k-Means：あらかじめクラスタ数(k)を指定して、Entity を分類します。

Hierarchical

：階層型クラスタツリーを作成します。

Self Organization Map

：自己組織マップで

Entity

を分類します。

クラスタ分析 (2/6)

Finish

クラスタ分析 (3/6)

サイズ調整します

次々ページで説明

クラスタ分析 (4/6)

選んだ部分が拡大されます

クラスタ分析 (5/6)

Propertiesを選択します

Entity clusters color thresholdを

調整して、大まかなクラスターに色分けされていることを確認します。

次に、

Create Classification

で

クラスター数を確認し、

押します。

クラスタ分析 (6/6)

ダブルクリックすると

各クラスタに分類された

結果が表示されます

クラスター分析結果の画面上で右クリックし、

“Properties”

を選択してください。

Row HeadersをCompoundに

設定すると、分析結果の右側に化合物情報が表示されます。

Color Range

を設定することで、強度比の色を変えることが出来ます。

Renderingタブ中のRow Header Width

をスライドさせることで、

表示させる化合物情報の幅を設定することが出来ます。

表示色やレイアウトを変更したいのですが、、、

Entity List

の作成データファイルの

読み込み

ピークアライメント

（Entityの作成）

Entityのフィルター

（ノイズ除去）

グループ定義

データの準備

PCA

（主成分分析）

階層型クラスタ分析統計的有意差によるEntity 抽出

検定、

ANOVA

解析

分けて見つける

IDBrowser

（化合物の推定）

Class Prediction

（判別分析）

推定する

Entity Listの出力 ChemStation, MassHunter

での解析

詳細のクロマトグラム・マススペクトルを解析する

ChemStation, MassHunter

でデータを取る。

実験計画を検討する。

目的、仮説など。

条件を満たす

Entity

を探す

（Venn図）

ID Browserによる化合物推定

MPP でライブラリサーチを行う機能です。 (Mass Hunter も同じ機能を有しています）

Entityのマススペクトル

ライブラリのマススペクトル

Entityとライブラリのマススペクトルの同時表示

化学構造式

（データベースインストール時のみ使

用可能）

検索結果

効率よく entity (=compound) を ID するには、、、

ID Browserは、現在開いているentity listの全entityをMETLIN+組成式計算でIDします。

Entity数が数十であれば計算時間は10秒程度で済みますが、左図の様に100-1000以上のentityとなると化合物を１つIDする度に全entityを読み込ませていては、解析が非効率なものとなります。

そこで、マウスをドラッグさせて興味のある化合物のみを選択し（緑色に変わります）、

Create entity listのアイコンをクリックすることで ID Browserに持ち込む化合物を絞ることが効率の良い解析のコツになります。

この化合物のみIDしたい

Next Finish ID Browser の設定

デフォルトの設定では

１）

は

METLIN

で

5ppm

以内の

精度で保持時間を加味せず質量のみで検索２）組成式は右図の構成元素で計算

となっております。

検索結果と組成式結果が違うということを避けるために、DBのToreranceは

2ppm

程度にした方が良いでしょう。

ID Browser の実行結果

検索、及び組成式計算が終了すると、

Compound List

が表示されます。

ここには組成式、CAS番号、化合物名などが表示されます。

また、このCompound ListはMassHunter Qual.のものと同じもので、

Cef

ファイルの中には化合物名、組成式、

CAS

番号などの情報が含まれています。

よって、

MassHunter Qual.

上から

Find by Molecular Feature

、

Find by Formula

等の機能を

使用してCompound Listを作成した後、Identify compounds > Search DatabaseやGenerate Formula を行い、

Compound List

に名前や組成式を付けた状態で

File > Export > as cef

を実行して

MPPの標準形式である.cefファイルを作成すると、

MPP

の

Entity

に保持時間、質量だけでなく名前や

情報も

annotation

として付いてくるので

entity

の絞込みが楽になります。

後述する

Pathway

解析は、

CAS

番号を基に代謝マップに当てはめていくので、

に

CAS

番号が含まれていない場合は

Manual Identification機能を使い、CAS番号を入力します。（次ページ参照）

Manual Identification の実行

ID Browser上でCompoundを選び、右クリックをすると Add/Edit Manual Identification が選択できます。

ここで現れるウィンドウでCAS IDを指定するとその番号がCompound Listに張り付くので、

Save and Returnを実行すれば、

マニュアルでIDした結果をパスウェイ解析に

持ち込むことができます。

Class Prediction (判別分析)

sample class prediction model作成のためには

再現性の良いEntityを選ぶ

ことが重要です

Class Prediction (判別分析1/8)

Class Prediction (判別分析2/8)

アルゴリズムを選択して

Nextをクリックします

Class Prediction (判別分析3/8)

Class Prediction (判別分析4/8)

Class Prediction (判別分析5/8)

判別したい未知サンプルを

選択します

Class Prediction (判別分析5/8)

Class Prediction (判別分析6/8)

Class Prediction (判別分析7/8)

Class Prediction (判別分析8/8)

Class Prediction (判別分析)

判別モデルを選択します

例：Naïve Bayes

Class Prediction (判別分析)

判別したい未知サンプルを

選択します

Class Prediction (判別分析)

判別モデルのアルゴリズム (1) -Decision Tree ( 決定木 )-

Entity Sample 1 Sample 2 Sample 3

Entity1 [email protected] 2200 1000 2500

Entity2 [email protected] 1800 1500 2900

Entity 1

>2000?

Entity 2

>2000?

Sample 2

Sample 3 Sample 1

No

Yes No

Yes

判別モデルのアルゴリズム (2)

-Support Vector Machine ( サポートベクターマシン , SVM)-

Condition 1

Condition 2

ドキュメント内 MPP easy guide (ページ 105-138)

種類のいずれかの値を持ち、

類似度を数値化します。

• 距離 (0 から無限大 )

• 相関 (-1 to 1)

MPP で使用できる類似度 (Similarity)

Euclidian

Squared Euclidian Manhattan

Chebyshev Differential

Pearson Absolute

Pearson Centered

Pearson Uncentered

類似度

類似度の指標は適切なものを選択する必要があります

例

• カテゴリデータへ Euclidian 距離を当てはめるのは適切ではない。

• 高度に歪んだ分布に対して相関の類似度を当てはめると、誤った結果をも

たらすことがある。

クラスタ分析 (1/6)

：階層型クラスタツリーを作成します。

：自己組織マップで

を分類します。

クラスタ分析 (2/6)

クラスタ分析 (3/6)

サイズ調整します

次々ページで説明

クラスタ分析 (4/6)

選んだ部分が拡大されます

クラスタ分析 (5/6)

調整して、大まかなクラスターに 色分けされていることを確認します。

次に、

で

クラスター数を確認し、

押します。

クラスタ分析 (6/6)

ダブルクリックすると

各クラスタに分類された

結果が表示されます

クラスター分析結果の画面上で 右クリックし、

を 選択してください。

設定すると、分析結果の右側に 化合物情報が表示されます。

を設定する ことで、強度比の色を変える ことが出来ます。

をスライドさせることで、

表示させる化合物情報の幅を 設定することが出来ます。

表示色やレイアウトを変更したいのですが、、、

の作成 データファイルの

読み込み

ピークアライメント

（Entityの作成）

（ノイズ除去）

グループ定義

データの準備

（主成分分析）

階層型クラスタ分析 統計的有意差によるEntity 抽出

検定、

解析

分けて見つける

（化合物の推定）

（判別分析）

推定する

での解析

詳細のクロマトグラム・マススペクトルを解析する

でデータを取る。

実験計画を検討する。

目的、仮説など。

条件を満たす

を探す

（Venn図）

ID Browserによる化合物推定

MPP でライブラリサーチを行う機能です。 (Mass Hunter も同じ機能 を有しています）

効率よく entity (=compound) を ID するには、、、

この化合物のみIDしたい

Next Finish ID Browser の設定

デフォルトの設定では

１）

は

で

以内の

精度で保持時間を加味せず質量のみで検索 ２） 組成式は右図の構成元素で計算

となっております。

検索結果と組成式結果が違うということを 避けるために、DBのToreranceは

調整して、大まかなクラスターに色分けされていることを確認します。

クラスター分析結果の画面上で右クリックし、

を選択してください。

設定すると、分析結果の右側に化合物情報が表示されます。

を設定することで、強度比の色を変えることが出来ます。

表示させる化合物情報の幅を設定することが出来ます。

の作成データファイルの

階層型クラスタ分析統計的有意差によるEntity 抽出

MPP でライブラリサーチを行う機能です。 (Mass Hunter も同じ機能を有しています）

精度で保持時間を加味せず質量のみで検索２）組成式は右図の構成元素で計算

検索結果と組成式結果が違うということを避けるために、DBのToreranceは

ここで現れるウィンドウでCAS IDを指定するとその番号がCompound Listに張り付くので、