解析の実際
(Bismark)
インストールするソフトウェア(インストール上の注意)
Bismark (v0.12.5) インストールはダウンロードして解凍するだけです。 BowWe2 (v2.2.3) インストールはダウンロードして解凍するだけです。
SAMTools (v0.1.9) Makefile の curses を ncursesに書き換えてmakeします。 TrimmomaWc (v0.32) インストールはダウンロードして解凍するだけです。
1. Filtering poor quality reads, and reads with adapter sequences (TrimmomaWc) 2. GeneraWon of bisulfite converted genome (Bismark)
3. Genome Alignment (Bismark -‐ BowWe) 4. MethylaWon calls (Bismark)
5. GeneraWon of genome wide tracks for visualizaWon (SAMtools, Genome Browser) 詳細は以下を参照してください。 h7p://www.epibio.com/docs/default-‐source/protocols/ epignome-‐bioinformaWcs-‐user-‐guide.pdf?sfvrsn=2 注意: コマンドやマニュアルは頻繁に変わりますので、最新のもので確認してください。 本日のものは、セミナー時点で動作していますが、いつまで動くかはわかりません。 コマンドの使用は自己の責任で実施してください。
解析の実際
2 (Bismark)
1. Filtering poor quality reads, and reads with adapter
sequences (TrimmomaWc)
アダプターのトリミング
コマンド例
java -‐jar /root/bin/trimmomaWc-‐0.32.jar SE -‐phred33 test.fastq test-‐trim.fastq ILLUMINACLIP:TruSeq2-‐SE:2:30:10 LEADING:3 TRAILING:3 MINLEN:36 &
注;上記と同じコマンドが通るとは限りません。マニュアルをよく読んで、 自分の環境に合わせて書き換えてください。
解析の実際
3 (Bismark)
2. GeneraWon of bisulfite converted genome (Bismark)
bisulfite converted genome の作成 1) 以下のイルミナのiGenome のサイトから自分の実験に 該当する参照配列をダウンロードします。 かなり時間がかかります。 h7p://support.illumina.com/sequencing/sequencing_solware/igenome.ilmn コマンド例 wget lp://igenome:G3nom3s4u@ussd-‐lp.illumina.com/Homo_sapiens/UCSC/ hg19/Homo_sapiens_UCSC_hg19.tar.gz tar zxvf Homo_sapiens_UCSC_hg19.tar.gz /Homo_sapiens/UCSC/hg19/Sequence/Chromosome というフォルダー内に ゲノム配列があることを確認する。
解析の実際
4 (Bismark)
2. GeneraWon of bisulfite converted genome (Bismark)
(続き)
2) bisulfite converted genome を置くファイルを作成する。
mkdir –p Genome/Bisulfude/hg19 3) Homo_sapiens/UCSC/hg19/Sequence/Chromosome/ の中のクロモソームを含む fastaファイルをGenome/Bisulfude/hg19にコピーします。 cp /Homo_sapiens/UCSC/hg19/Sequence/Chromosome/*fa Genome/Bisulfude/hg19
4) bisulfite converted genome の作成
bismark_genome_preparaWon -‐-‐verdose Genome/Bisulfude/hg19 -‐-‐bowWe2 -‐-‐path_to_bowWe /usr/local/bin
-‐-‐verdose にはbisulfite converted genome を置くファイルを、
-‐-‐path_to_bowWeにはbowWe2 が置かれているファイルを指定します。
解析の実際
5 (Bismark)
2. Genome Alignment (Bismark -‐ BowWe2) (続き)
1) Bismark (bowWe2) によるアラインメント Perl のモジュールのGD::Graphを最初にインストールしておかないと、 結果のグラフが出てきません。 あらかじめ、gd とgd-‐devel をインストールしておき、 perl –MCPAN –e shell
cpan> upgrade cpan> install YAML cpan> GD
Cpan> GD::Graph
でperl のモジュールをインストール
zlib, libpng, freetype, jpeg, xpm 関連のライブラリも一緒にインストール
コマンド: bismark -‐q -‐-‐bowWe2 -‐-‐path_to_bowWe /root/bin/ Genome/Bisulfide/hg19 -‐-‐1 test1-‐2.fq -‐-‐2 test2-‐2.fq
-‐q fastq の場合、-‐-‐phred64-‐quals クオリティスコア phred64 を使用している場合 -‐-‐path_to_bowWeにはbowWe が置かれているファイルを指定
Genome/Bisulfide/hg19 bisulfite は、converted genome の場所 RHELとか、CentOS系はこのあたりのパッケージの 依存性が壊れていて、構築にそれなりに工夫が必要 です。詳細は、個別にお問い合わせください。
解析の実際
6 (Bismark)
2. Genome Alignment (Bismark -‐ BowWe2) (続き)
1) Bismark (bowWe2) によるアラインメント (続き)
コマンド例: bismark -‐q -‐-‐phred64-‐quals -‐-‐bowWe2 -‐-‐path_to_bowWe /root/bin/ Genome/Bisulfide/hg19 -‐-‐1 test1-‐2.fq -‐-‐2 test2-‐2.fq
うまくいば、 *.png *.sam *.txt の3つのファイルができているはず。 2) duplicate 除去 コマンド例: deduplicate_bismark –s test1-‐2.fq_bismark_bt2.sam オプション -‐s : シングルエンドの場合、 -‐p:ペアエンドの場合
解析の実際
7 (Bismark)
1) Bismark (bowWe2) によるアラインメント (続き)*alignment_overview.png の結果
1箇所にalign 複数箇所にalign Alignしなかったもの h7p://www.bioinformaWcs.babraham.ac.uk/projects/bismark/Bismark_User_Guide.pdf解析の実際
8 (Bismark)
3. メチル化部位の検出
コマンド使い方: bismark_methylaWon_extrctor [オプション] <ファイル名>.sam 以下でヘルプが見れます。bismark_methylaWon_extractor –help | more コマンド例 bismark_methylaWon_extractor -‐s –comprehensive test1-‐2.fq_bismark_bt2.duplicated.sam -‐s : シングルエンドの場合、 -‐p:ペアエンドの場合 -‐-‐comprehensive 結果の出力形式の指定。ヘルプを参照。 以下のような接頭文字をもつ出力ファイルが3つできる。 CpG_content_....txt CHG_content_....txt CHH_content_....txt これらのデータから、情報を抽出して、 いろいろな統計情報を作れる。
解析の実際
9 (Bismark)
4. メチル化部位の視覚化
コマンド使い方: bismark_methylaWon_extrctor [オプション] <ファイル名>.sam 以下でヘルプが見れます。bismark_methylaWon_extractor –help | more
コマンド例
bismark_methylaWon_extractor -‐s -‐-‐bedGraph –counts test-‐2.fq_bismark_bt2.duplicated.sam
-‐s : シングルエンドの場合、 -‐p:ペアエンドの場合 -‐-‐bedGraph –counts
できた、*.bedGraph ファイルをUCSC Genome Browser などで視覚化 できます。
解析の実際
10 (Bismark)
4. メチル化部位の視覚化(続き)
bedGraphの中身はこんな感じです。 (このあとは,
RやPerlなどでいろいろ処理できます。)
# head test-‐2.fastq_bismark_bt2.deduplicated.bedGraph
track type=bedGraph
chr21 1050344 1050345 0
chr21 1050919 1050920 0
chr21 1050920 1050921 50
chr21 1050987 1050988 100
chr21 1050988 1050989 50
chr21 1051049 1051050 100
chr21 1051238 1051239 100
chr21 1051282 1051283 100
chr21 1051395 1051396 100
メチル化率
大体1千万箇所くらい ありました。解析の実際
11 (Bismark)
4. メチル化部位の視覚化(続き)
bedGraph で以下のような感じで閲覧できます(UCSC Genome Browser)。
ここで取り込んだ
メチル化部位を