類似度を数値化します。
• 距離 (0 から無限大 )
• 相関 (-1 to 1)
MPP で使用できる類似度 (Similarity)
Euclidian
Squared Euclidian Manhattan
Chebyshev Differential
Pearson Absolute
Pearson Centered
Pearson Uncentered
類似度
類似度の指標は適切なものを選択する必要があります
例
• カテゴリデータへ Euclidian 距離を当てはめるのは適切ではない。
• 高度に歪んだ分布に対して相関の類似度を当てはめると、誤った結果をも
たらすことがある。
クラスタ分析 (1/6)
k-Means:あらかじめクラスタ数(k)を指定して、Entity を分類します。
Hierarchical
:階層型クラスタツリーを作成します。
Self Organization Map
:自己組織マップで
Entityを分類します。
クラスタ分析 (2/6)
Finish
クラスタ分析 (3/6)
サイズ調整します
次々ページで説明
クラスタ分析 (4/6)
選んだ部分が拡大されます
クラスタ分析 (5/6)
Propertiesを選択します
Entity clusters color thresholdを
調整して、大まかなクラスターに 色分けされていることを確認します。
次に、
Create Classificationで
クラスター数を確認し、
OK押します。
クラスタ分析 (6/6)
ダブルクリックすると
各クラスタに分類された
結果が表示されます
クラスター分析結果の画面上で 右クリックし、
“Properties”を 選択してください。
Row HeadersをCompoundに
設定すると、分析結果の右側に 化合物情報が表示されます。
Color Range
を設定する ことで、強度比の色を変える ことが出来ます。
Renderingタブ中のRow Header Width
をスライドさせることで、
表示させる化合物情報の幅を 設定することが出来ます。
表示色やレイアウトを変更したいのですが、、、
Entity List
の作成 データファイルの
読み込み
ピークアライメント
(Entityの作成)
Entityのフィルター
(ノイズ除去)
グループ定義
データの準備
PCA
(主成分分析)
階層型クラスタ分析 統計的有意差によるEntity 抽出
t-
検定、
ANOVA解析
分けて見つける
IDBrowser
(化合物の推定)
Class Prediction
(判別分析)
推定する
Entity Listの出力 ChemStation, MassHunter
での解析
詳細のクロマトグラム・マススペクトルを解析する
ChemStation, MassHunter
でデータを取る。
実験計画を検討する。
目的、仮説など。
条件を満たす
Entityを探す
(Venn図)
ID Browserによる化合物推定
MPP でライブラリサーチを行う機能です。 (Mass Hunter も同じ機能 を有しています)
Entityのマススペクトル
ライブラリのマススペクトル
Entityとライブラリのマススペクトルの同時表示
化学構造式
(データベースイン ストール時のみ使
用可能)
検索結果
効率よく entity (=compound) を ID するには、、、
ID Browserは、現在開いているentity listの 全entityをMETLIN+組成式計算でIDします。
Entity数が数十であれば計算時間は10秒程度で 済みますが、左図の様に100-1000以上のentityとなると 化合物を1つIDする度に全entityを読み込ませて いては、解析が非効率なものとなります。
そこで、マウスをドラッグさせて興味のある 化合物のみを選択し(緑色に変わります)、
Create entity listのアイコンをクリックすることで ID Browserに持ち込む化合物を絞ることが 効率の良い解析のコツになります。
この化合物のみIDしたい
Next Finish ID Browser の設定
デフォルトの設定では
1)
DBは
METLINで
5ppm以内の
精度で保持時間を加味せず質量のみで検索 2) 組成式は右図の構成元素で計算
となっております。
DB
検索結果と組成式結果が違うということを 避けるために、DBのToreranceは
2ppm
程度にした方が良いでしょう。
ID Browser の実行結果
DB
検索、及び組成式計算が終了すると、
Compound Listが表示されます。
ここには組成式、CAS番号、化合物名などが表示されます。
また、このCompound ListはMassHunter Qual.のものと同じもので、
Cef
ファイルの中には化合物名、組成式、
CAS番号などの情報が含まれています。
よって、
MassHunter Qual.上から
Find by Molecular Feature、
Find by Formula等の機能を
使用してCompound Listを作成した後、Identify compounds > Search DatabaseやGenerate Formula を行い、
Compound Listに名前や組成式を付けた状態で
File > Export > as cefを実行して
MPPの標準形式である.cefファイルを作成すると、
MPP
の
Entityに保持時間、質量だけでなく名前や
ID情報も
annotationとして付いてくるので
entityの絞込みが楽になります。
後述する
Pathway解析は、
CAS番号を基に代謝マップに当てはめていくので、
DBに
CAS番号が含まれていない場合は
Manual Identification機能を使い、CAS番号を入力します。(次ページ参照)
Manual Identification の実行
ID Browser上でCompoundを選び、右クリックをすると Add/Edit Manual Identification が選択できます。
ここで現れるウィンドウでCAS IDを指定すると その番号がCompound Listに張り付くので、
Save and Returnを実行すれば、
マニュアルでIDした結果をパスウェイ解析に
持ち込むことができます。
Class Prediction (判別分析)
sample class prediction model作成のためには