GeneSpring GX11.0.2
ビギナーズガイド
Agilent 1色法
2条件の比較
繰り返し実験あり
適用 ・薬剤非投与と投与の解析・Wild typeとKnock outの解析 ・正常細胞と病態細胞の解析 など
ビギナーズガイドは、様々なマイクロアレイの実験デザインがあるなかで、実験デザインの 種類ごとに適切なデータ解析の流れを、実例とともに紹介するガイドブックです。
生理食塩水投与 エストラジオール投与 コントロール群 薬剤投与群 24時間後、子宮組織からTotal RNA抽出 エストラジオール投与による子宮組織の遺伝子発 現はどのように変化するだろうか?
解説用のデータについて
このガイドではNCBI GEOのGSE23072を使用しています。解析手順とグラフイメージ
エクスペリメ ントの作成 • データインポート • ノーマライズ QCとフィル タリング • 低品質サンプルの除去 • 低品質プローブの除去 発現差解析 • 統計検定 • 平均値の変化 生物学的な解 釈 • GO解析プロジェクトの作成
• Projectメニュー/New projectから新しいプロ ジェクトを作ります。作成したプロジェクトには アレイプラットフォーム、生物種に関係なくエ クスペリメントを作成することができます。 プロジェクト名を入力 プロジェクト エクスペリメント アレイ1 アレイ2 アレイ3 エクスペリメント アレイ4 アレイ5 アレイ6 データの階層構造の概念図エクスペリメントの作成
• プロジェクトの作成後、下記のウィンドウが 開きます。または、ProjectメニューのNew experimentからも同様の操作ができます。 エクスペリメント名の入力 プラットフォームの選択 Agilent Single Colorワークフローの選択 Advancedを選択
データインポート
• Choose Filesボタンから、インポートしたいFE のテキストファイルを指定します。 Shiftキーを押しながら、イン ポートしたいサンプルを選択 し、開くボタンをクリックフラグの設定
• 各プローブに付加されたFEのQC情報を基に 各プローブにPresent・Marginal・Absentの評 価を行います。 • デフォルトがAgilent推奨です。 シグナル検出できな いプローブは Marginal データの品質が悪いプ ローブはAbsentノーマライズオプション
• アレイ間の誤差を補正するノーマライズの設 定を行います。 整数で1以下の値は 全て1に補正します ノーマライズ法を選択 Agilentでは75Percentileで Percentile Shiftを推奨しています。ノーマライズの概要
Percentile shiftとは
• 各サンプルの75パーセンタイルを揃えることで、 アレイ間の誤差を補正します。 • 補正後は75パーセンタイルが0になります。 75パーセンタイル 各サンプル 各サンプルの75パーセ ンタイル値を揃える 各サンプル ノーマライズ前 ノーマライズ後ベースライン補正
• 2条件の比較の場合は、ベースライン補正を使用 しないほうが、元データに近い値を閲覧できます。 • Do not perform~にチェックしてください。 • その後、Finishをクリックするとエクスペリメント作 成が始まります。 ここでは使用しませんが、ベースライン補正の詳細はベーシックトレー ニングテキスト等をご参照ください。 http://www.chem.agilent.com/ja-JP/general/pages/generic35455.aspx GeneSpringGX11/ドキュメント以下にあります。初めて解析する際の注意
• GeneSpringGXで初めてアレイ解析をする際 はテクノロジーのダウンロードが必要です。下 記のポップアップが表示された場合は、「はい」 をクリックしてダウンロードを行ってください。 • ダウンロードにはネットワークの速度により、時 間がかかる場合があります。 ※テクノロジーとは、アレイに搭載されているプローブの 遺伝子名や染色体の位置情報等をまとめたデータです。実験条件の入力
エクスペリメントグルーピング
• どのアレイがコントロールサンプルで、どのア レイが薬剤投与サンプルかを入力します。
Samples Treatment type
GSM568946_US22502532_251486821582_S01_GE1-v5_95_Feb07_1_1.txt Control GSM568947_US22502532_251486821582_S01_GE1-v5_95_Feb07_1_2.txt Control GSM568948_US22502532_251486821582_S01_GE1-v5_95_Feb07_1_3.txt Control GSM568952_US22502532_251486821583_S01_GE1-v5_95_Feb07_1_3.txt Estradiol GSM568953_US22502532_251486821583_S01_GE1-v5_95_Feb07_1_4.txt Estradiol GSM568954_US22502532_251486821584_S01_GE1-v5_95_Feb07_1_1.txt Estradiol
入力手順
• Add Parameterをクリック • パラメータ名と条件を入力する パラメータ名を入力 条件を入力する この場合は ControlとEstradiolインタープリテーションの作成
• 各アレイにはマウスの個体差や実験誤差が含 まれるので、各条件の繰り返し実験を平均値 化してから薬物投与の効果を評価します。 • 繰り返し実験があると統計検定が可能になり ます。繰り返しが無いと統計検定ができません。インタープリテーションとは
• 繰り返し実験があれば同じ群で平均値化する などして、ユーザーが解析したいデータを表示 する設定項目です。 コントロール群 薬剤投与群インタープリテーションの設定
アレイ1 アレイ6 アレイ5 アレイ3 アレイ2 アレイ4 平均値比較
平均値インタープリテーションの作成手順 1
• WorkflowメニューからCreate Interpretationを クリック
インタープリテーションの作成手順 2
• Treatment typeにチェック
• 適宜設定してNext
表示したくない条件があった らチェックを外す
インタープリテーションの作成手順 3
• Finishをクリック
数値の表示について
• GeneSpringGXで通常表 示される数値は全てLog2 の値です。 • このデモデータの場合 Percentile shiftした値が0 になります。 75 Percentileスキャッタープロットの表示
• 横軸にコントロール、縦軸に薬物投与のデー タをプロットします。中心線から大きく離れた 点が大きく変動した遺伝子になります。 高い 低い 薬剤投与群 の発現量 コントロール群 の発現量 低い 高い 薬剤投与して発現量 が上がった遺伝子 薬剤投与して発現量 が下がった遺伝子 このライン上は 発現変動なしあらかじめ注目している遺伝子を探す
• Ctrlキー+Fで検索ウィンドウが開くので遺伝 子名を入力して下さい。 エストロゲンに反応するTrim25 遺伝子を入力 Trim25がハ イライトされるグラフの画像をファイルとして取得する
• グラフ上を右クリックして開くメニューから
Export As Imageを選択すると、ファイル名を 決定して保存することができます。
3D PCA
• 3D空間でX軸を見た場合に、コントロール群と 薬剤投与群が左右に分かれていれば、サンプ ルへの影響は薬剤投与が一番大きいというこ とになり、良いデータだと言えます。 • 実験誤差や、個体差の影響が薬剤投与よりも 大きい場合は、影響の大きい要因がX軸に表 示されます。 Ctrlキーを押しながらドラッ グすると、3Dの方向を変え られます。 X軸を水平にする コントロール群 薬剤投与群Quality Control Metrics Plot
• QCの情報をプロットした図です、全てのサンプ ルが似たようなプロットになっていれば問題な いといえます。
信頼できないサンプルがあった場合
• 3D PCAやQC Metricsで信頼できないサンプ ルがあった場合は除去できます。 サンプルを左に移してOKボタ ンを押すと、エクスペリメントか ら削除されます。フィルタリング
低発現プローブの除去
• 全てのサンプルで発現していないプローブを除 去します。
低発現プローブの除去 1
フィルタをかけるリストを 選択 Raw Dataを選択 Filter by Percentileを選択 6サンプル中1サンプルでも 20Percentile以上ならフィルタ 通過させます。低発現プローブの除去 2
• フィルタ結果の表示 フィルタを通過した数が 閲覧できます。 保存する際のリストの名 前を入力できます。低発現プローブの除去 3
悪いフラグの除去 1
許容できるフラグを設定 Present:シグナル検出 Marginal:シグナル非検出 Absent:データの質が悪い 6サンプル中1サンプルでも上記の フラグ設定値以上ならフィルタ通過 フィルタをかけるリストを選択悪いフラグの除去 2
• フィルタ結果の表示 フィルタを通過した数が 閲覧できます。 保存する際のリストの名 前を入力できます。変動遺伝子の抽出
Volcano plot
• Volcano Plotは統計検定と平均値の変化の2 つの手法を使い、発現変動している遺伝子を 抽出します。
変動遺伝子の抽出
フィルタをかけるリストを選 択する。
Treatment typeを選択する。 Condition1にEstradiol Condition2にControlを選択 T-Test unpairedを選択する要注意!!
T-Testの設定
Asymptoticを選択する T値が正規分布に従うと仮 定する検定 FDRを選択する 多重検定による偽陽性の 増加を防ぐ。結果の閲覧
減少 増加 平均値の差 P値 P値とは コントロール群と薬剤投与群 の発現量が同じ確率を表す。 低い方がよい。 低い 高い 増加 減少 フィルタを通過した数 数が多すぎる場合など Change cut-offからカット オフ値を変更できます。 今回は、p<0.01、平均値 3倍以上で設定しました。フィルタ結果
薬剤投与して発現量 が上がった遺伝子
薬剤投与して発現量 が下がった遺伝子
発現UpとDownを分けたい場合
Filter on Entity List
Regulationを選択 Equalsを選択 Upと入力 Upした遺伝子が ハイライトされる 名前を付けて保存フィルタ結果
発現が減少した遺伝子をリストアップしたい場合はも う一度フィルタをかけて、downを入力すればピック アップできます。
遺伝子リストをテキストファイルに
エクスポートする
エクスポートしたい リストを右クリック エクスポートし たい値にチェッ クを入れる エクスポートしたいアノテー ションを右側に移動する OKをクリックすると指定した場所にテキストファイルが保存されます。ジーンオントロジー(GO)解析
• GO解析は、自分がピックアップした遺伝子リス トとGOコンソーシアムが定義した機能別リスト の間で遺伝子の内訳がよく似ているリストを検 索します。 注意:アノテーションの有無によりGO解析ができないアレイも存在します。 GeneSpringGX GOの機能別リスト GOのresponse to stimulusと似ている!GO解析手順
解析したいリストを選択 Cell Cycle 系の遺伝子 が多い 遺伝子の個数 右クリックメニューのExport as text でこの表をエクスポートできます。保存結果
GO解析の結果が 保存される。
選択したリストの遺 伝子が表示される。
Down regulated遺伝子のGO解析
~development関連の 遺伝子が多い