• 検索結果がありません。

Chip-seq 解析

ドキュメント内 GenomeJack Browser Appendix (ページ 40-45)

 次世代シーケンサから得られたChIP-seqデータの解析と可視化を行います。

使用するデータ

解析に使用するデータは以下の通りです。

データ名 概要

SRR020051 HeLa細胞に対してPHF8抗体を用いたChIP-seqデータ

SRR020053 HeLa細胞に対してIgG抗体を用いたChIP-seqデータ(Control) これらの配列データはヒト由来です。そのため、GenomeJack等で使用するリ ファレンスはhg19を使用します。

ノート:

• PHF8はH3K4me3を脱メチル化し、転写を活性化するヒストン修飾因子

として知られています。

手順

解析の手順は以下の通りです。

1. 準備

2. Bowtieを用いた配列データのマッピング

3. SAMtoolsを用いたファイルの整形

4. MACSによるChIP-seqのピーク解析

5. GenomeJackを用いた解析結果の可視化

3.2.1 準備

 本解析ではBowtie2、SAMtools、MACSを使用します。

 Bowtie、SAMtools、MACSをダウンロード、インストールします。

• Bowtie2

RNA-seq解析の準備を参照してください。

• SAMtools

Bowtieの出力ファイルの形式をMACの入力形式に変換する際に使用し

ます。

3.2. Chip-seq解析 38

http://sourceforge.net/project/

showfiles.php?group_id=246254

• MACS

Bowtieによるマッピング結果から、転写因子の結合部位を予測する

ChIP-seq解析用のソフトウェアです。

https://github.com/taoliu/MACS/

ノート:

• 各実行ファイルがあるディレクトリにPATHを通す必要があります。

3.2.2 Bowtie を用いた配列データのマッピング

1. SRR020051.fastqとSRR020053.fastqをhuman genomeにマッピングします。

bowtie2 -x path/to/hg19 -U SRR020051.fastq -S SRR020051.sam

マッピング結果はSAMファイル形式で出力されます。

2. SRR020053.fastqも同様に解析します。

bowtie2 -x path/to/hg19 -U SRR020053.fastq -S SRR020053.sam

3. SAMtoolsを用いたファイルの整形

以下の手順で、SAM形式をBAM形式に変換します。GenomeJackではBAMのソー ト、及びインデックスの作成を推奨しております。

samtools view -bhS -o SRR020051.bam SRR020051.sam samtools sort SRR020051.bam SRR020051.sorted samtools index SRR020051.sorted.bam

samtools view -bhS -o SRR020053.bam SRR020053.sam samtools sort SRR020053.bam SRR020053.sorted samtools index SRR020053.sorted.bam

ノート:

• view : SAM形式からBAM形式に変換を行います。

• sort : BAMをマッピングの開始位置でソートを行います。

3.2. Chip-seq解析 39

GenomeJack Browser Appendix,リリース3.1

• index : BAMにインデックスを付加します。

3.2.3 MACS による ChIP-seq のピーク解析

1. SRR020053をcontrolとしてSRR020051のピークを検出します。

macs2 -t SRR020051.sorted.bam -c SRR020053.sorted.bam -f BAM -n SRP010008 -g hs

ピーク全体の情報はSRP010008_peaks.bedに、ピークの頂点の情報は SRP010008_summits.bedに書き出されています。

また、SRP010008_MACS_wiggle/treat/にあるwig.gzファイルを解凍すれば、グラ フ形式で解析結果を可視化できます。

3.2.4 GenomeJack を用いた解析結果の可視化

1. SRP010008_peaks.xlsをGenomeJackで可視化します。

例えば、以下の図で、遺伝子PEX10の転写開始点の上流にピークがあることが分 かります。PHF8抗体を用いたChIP-seqデータを使用したため、遺伝子PEX10の転 写開始点の上流にPHF8が結合していると予測することができます。

3.2. Chip-seq解析 40

GenomeJack の環境を移行する

 GenomeJackはホームページにて提供しているパッケージ、またはWeb Startにより利

用することができますが、データを移行することでパッケージからWeb Start、または

Web Startからパッケージへと環境を切り替えて利用することも可能です。ここでは、

GenomeJackの環境を移行する方法について説明します。

4.1 パッケージから Web Start へ切り替える

 GenomeJackの環境をパッケージからWeb Startへ切り替える方法について説明しま

す。なお、パッケージ、Web Startの両環境をインストールして利用できる状態にあるこ とを前提とします。

1. 作業に入る前に、パッケージのルートディレクトリであるGenomeJACKフォルダ 直下が、次の構成になっていることを確認してください。

41

GenomeJack Browser Appendix,リリース3.1

gj GenomeJack起動時の設定や登録したデータを管理するフォルダです。

lib GenomeJack本体があるフォルダです。

settings GenomeJackで利用する設定ファイルを管理するフォルダです。

temp 一時ファイル用のフォルダです。

その他 GenomeJackの起動スクリプトなどが配置されています。

2. パッケージ中のgjフォルダをWeb Startのルートディレクトリ(デフォルトでは ホームディレクトリ直下のGenomeJACK3.0フォルダ)にコピーしてください。

3. コピー先のgjフォルダ直下にあるgenomeJack.iniの内容を次の通りに修正してく ださい。

"sessionFilePath": "パッケージのルートディレクトリ/gj/genomeJack.session"

"sessionFilePath": "Web Startのルートディレクトリ/gj/genomeJack.session"

4. Web StartでGenomeJackを起動します。パッケージで利用していたデータを表示

することができればWeb Startへの切り替えは成功です。

4.1. パッケージからWeb Startへ切り替える 42

ドキュメント内 GenomeJack Browser Appendix (ページ 40-45)

関連したドキュメント