• 検索結果がありません。

遺伝子リストの絞込み 統計検定( Statistical Analysis )統計検定(Statistical Analysis)

ドキュメント内 548BGeneSpring12.5 (ページ 40-49)

統計検定は、繰り返し実験から得られた様々な統計量を基に確率的な有意差で発現変動し ている遺伝子を抽出することができます。

実験デザインと利用する検定の対応

統計検定は2群比較、多群比較などで利用する手法が異なります。下記に実験デザインと 利用する検定の対応表を示しました。

Unpaired test 例)薬剤効果を比較するグループ間で個人が一致しないとき

1パラメータ

2条件

1パラメータ

3条件

2パラメータ

2条件以上

パラメトリックテスト

(等分散)

T-test unpaired

Moderated t-test ANOVA 2-way ANOVA

パラメトリックテスト

(不等分散)

T-test unpaired unequal variance

ANOVA

unequal variance -N/A

ノンパラメトリックテ スト

Mann Whitney

unpaired Kruskal Wallis -N/A

Paired test 例)薬剤効果を比較するグループ間で個人が一致しているとき

1パラメータ

2条件

1パラメータ

3条件以上

パラメトリックテスト T-test paired Repeated measures ノンパラメトリックテ

スト

Mann Whitney

paired Friedman

41 t-testによる検定

t-testは繰り返し実験を行った2条件の遺伝子の発現差を検定する手法です。有意差の指標

であるp-valueが低いほど2条件で発現量が同じ確率が低くなります。p-valueが低くなる要

因は主に下記の2つになります。

1. 検定する遺伝子の2条件間の平均値が大きく離れている 2. 検定する遺伝子の条件内の再現性が良い

例:ある遺伝子のBox plot

t-testのオプション

統計検定はインプットした遺伝子(エンティティ)の数だけ繰り返されます、これにより 統計検定の回数が増えると偽陽性が検出される確率もその分増えることになります。偽陽 性の増加を制限するために、GeneSpringには多重検定の補正(Multiple testing correction)オ プションが選択可能です。デフォルトではFDRに設定されています。

t-testとFold changeを組み合わせると有効

繰り返し実験の数が少ない場合や、非常に再現性が高い場合などは平均値の差が1.1倍でも 検出する場合があります。この場合は後述のFold changeと組み合わせます。

※t-testとFold changeを同時に行うFilter on Volcano plot機能も搭載されています。

P=0.91 P=0.01

遺伝子A(発現差なしと判断) 遺伝子B(発現差ありと判断)

42 統計検定(t-test)の操作手順

1. ワークフローのAnalysisからStatistical Analysisを選択 2. 検定するエンティティリストとインタープリテーションを選択

3. 比較する条件と検定の種類を設定

※注意:結果で表示されるFold changeの計算は、Condition1/Condtion2です、Condition2にコ ントロールに該当するコンディションを指定すると結果がわかりやすくなります。

4. 多重検定の補正を設定する

43 5. 結果を閲覧する

値を変更した後は、必ずEnterキーを押して設定を反映させてください。

Result Summary(左上)

p-valueとFC(Fold change)で段階的にフィルターした結果を表示しています。

たとえば、P < 0.05とFC > 2.0に該当するセルを選択すると、右側にあるVolcano plotに該 当するエンティティが緑でハイライトされます。ハイライトしたエンティティはSave custom list で保存することができます。

※検定の際Multiple testing correctionを使用した場合はCorrected p-valueになります。

※Expected by chanceは予測される偽陽性(Type I Error)の数です。

p-values(左下)

検定を通過したエンティティです Volcano Plot(右)

縦軸に有意差(-log10 p-value)、横軸に発現差(log2 Fold change)をプロットしたグラフで す。縦軸はp-valueを-log10 に変換しているため、縦軸が高いほうがp-valueが低いエンテ ィティになります。

6. 名前(変更可能です)を確認してFinish

7. 入力したエンティティリストの下層に検定済みの新しいリストが保存されます。

p-valueのCutoffを 変更可能

44

ANOVAによる検定

ANOVAは3条件またはそれ以上の比較で、いずれかの条件で発現差がある遺伝子を検定す

る手法です。1way-ANOVAや1元配置の分散分析と同義です。有意差の指標であるp-valueが 低くなる要因は主に下記の2つになります。

1. 検定する遺伝子の条件内のばらつきが小さい

2. 検定する遺伝子のサンプル全体の平均値から各条件の平均値のばらつきが大きい

ANOVAは条件内のばらつきよりも、サンプル全体の平均値から各条件の平均値のばらつき

が十分大きい遺伝子が得られます。

ANOVAのオプション1

統計検定はインプットした遺伝子の数だけ繰り返されます、これにより統計検定の回数が 増えると偽陽性が検出される確率もその分増えることになります。偽陽性の増加を制限す るために、GeneSpringには多重検定の補正(Multiple testing correction)オプションが選択可 能です。デフォルトではFDRに設定されています。

ANOVAのオプション2

ANOVAは複数の条件を同時に比較することができ、どこか1条件でも変動していると発現

差ありとみなされます。どの条件で変動しているかを確認するには、ANOVAを通過した後 の遺伝子リストに対してPost Hoc testを行うことで確認できます。

ANOVAとFold changeを組み合わせると有効

繰り返し実験の数が少ない場合や、非常に再現性が高い場合などは平均値の差が1.1倍でも 検出する場合があります。この場合は後述のFold changeと組み合わせます。

P=0.45 P=0.008

遺伝子A(発現差なしと判断) 遺伝子B(発現差ありと判断)

45 統計検定(ANOVA)の操作手順

1. ワークフローからStatistical Analysisを選択

2. 検定を行うエンティティリストとインタープリテーションを選択 3. 検定の種類を選択する

4. Post Hoc testを選択する

各コンディションでいくつのエンティティに違いがあるかを検定することができます。TukeyHSDが 良いでしょう

5. 多重検定の補正方法を選択

6. ANOVAの結果に指定した条件からのFold changeを付加する事ができます

※ここではFold changeでのカットオフはかかりません。

46 7. 結果を確認

値を変更した後は、必ずEnterキーを押して設定を反映させてください。

Result Summary(左上)

段階的にp-valueでフィルターした結果を表示しています。

※検定の際Multiple testing correctionを使用した場合はCorrected p-valueになります。

※Expected by chanceは予測される偽陽性(Type I Error)の数です。

p-values(左下)

検定を通過したエンティティです。

Post-hoc Analysis Report(右)※Post Hoc testを選択した時のみ表示されます。

ANOVAを通過したエンティティについて、Post Hoc testを行った結果を表示します。

各コンディションをすべて比較し、発現差があるエンティティ数を青いセル、発現差がない エンティティを赤いセルで表示します。興味のあるセルを選択してからSave custom listをク リックするとエンティティリストとして保存されます。複数のセルを選択すると、Unionでマー ジしたエンティティリスト、Intersectionで重複部分のみのエンティティリストが保存されます。

8. 名前(変更可能です)を確認してFinish

9. インプットしたエンティティリストの下層に結果が保存されます

p-valueのCutoffを 変更可能

47

Fold changeFold change

Fold changeは発現量の変化が大きいエンティティを抽出することができます。

1. ワークフローのAnalysisからFold changeをクリックする 2. エンティティリストとインタープリテーションを指定する

3. 比較するコンディションを指定する

Select pairing optionで比較方法を2種類選択可能です

All against single conditionの場合は特定のコントロールを選択する。

Pairs of conditionsの場合は比較するペアを選択する。

※注意:Fold changeの計算は、Condition1/Condtion2 です、Condition2 にコントロールに該当 するコンディションを指定すると結果がわかりやすくなります。

また、画像赤枠のボタンでCondition1⇔Condition2を切り替えることができます。

48 4. 結果のプレビューが表示される

5. 名前を確認してFinish

6. 比較したペアごとにUPとDOWNのエンティティリストが保存されます

発現差のカットオフは 変更可能

複数ペアがある場合は カットオフ可能

Fold change後のエンテ

ィティ数を表示

49

解析 2 クラスタリングなど

ドキュメント内 548BGeneSpring12.5 (ページ 40-49)