• 検索結果がありません。

解 析 の 実 際 2 (Bismark) 1. Filtering poor quality reads, and reads with adapter sequences (TrimmomaWc) アダプターのトリミング コマンド 例 java - jar /root/bin/trimmomaw

N/A
N/A
Protected

Academic year: 2021

シェア "解 析 の 実 際 2 (Bismark) 1. Filtering poor quality reads, and reads with adapter sequences (TrimmomaWc) アダプターのトリミング コマンド 例 java - jar /root/bin/trimmomaw"

Copied!
17
0
0

読み込み中.... (全文を見る)

全文

(1)

解析の実際

 (Bismark)

インストールするソフトウェア(インストール上の注意)    

Bismark  (v0.12.5)    インストールはダウンロードして解凍するだけです。   BowWe2  (v2.2.3)  インストールはダウンロードして解凍するだけです。  

SAMTools  (v0.1.9)  Makefile  の  curses    を ncursesに書き換えてmakeします。   TrimmomaWc  (v0.32)    インストールはダウンロードして解凍するだけです。    

1.  Filtering  poor  quality  reads,  and  reads  with  adapter  sequences  (TrimmomaWc)   2.  GeneraWon  of  bisulfite  converted  genome  (Bismark)  

3.  Genome  Alignment  (Bismark  -­‐  BowWe)   4.  MethylaWon  calls  (Bismark)  

5.  GeneraWon  of  genome  wide  tracks  for  visualizaWon  (SAMtools,  Genome  Browser)     詳細は以下を参照してください。   h7p://www.epibio.com/docs/default-­‐source/protocols/   epignome-­‐bioinformaWcs-­‐user-­‐guide.pdf?sfvrsn=2         注意: コマンドやマニュアルは頻繁に変わりますので、最新のもので確認してください。   本日のものは、セミナー時点で動作していますが、いつまで動くかはわかりません。   コマンドの使用は自己の責任で実施してください。  

(2)

解析の実際

 2  (Bismark)

1. Filtering  poor  quality  reads,  and  reads  with  adapter    

sequences  (TrimmomaWc)  

 アダプターのトリミング    

コマンド例  

java  -­‐jar  /root/bin/trimmomaWc-­‐0.32.jar  SE  -­‐phred33  test.fastq  test-­‐trim.fastq     ILLUMINACLIP:TruSeq2-­‐SE:2:30:10  LEADING:3  TRAILING:3  MINLEN:36  &  

 

注;上記と同じコマンドが通るとは限りません。マニュアルをよく読んで、   自分の環境に合わせて書き換えてください。  

(3)

解析の実際

 3  (Bismark)

2.  GeneraWon  of  bisulfite  converted  genome  (Bismark)  

 

 bisulfite  converted  genome  の作成     1)  以下のイルミナのiGenome  のサイトから自分の実験に   該当する参照配列をダウンロードします。     かなり時間がかかります。   h7p://support.illumina.com/sequencing/sequencing_solware/igenome.ilmn     コマンド例     wget  lp://igenome:G3nom3s4u@ussd-­‐lp.illumina.com/Homo_sapiens/UCSC/   hg19/Homo_sapiens_UCSC_hg19.tar.gz     tar  zxvf  Homo_sapiens_UCSC_hg19.tar.gz     /Homo_sapiens/UCSC/hg19/Sequence/Chromosome  というフォルダー内に   ゲノム配列があることを確認する。        

(4)

解析の実際

 4  (Bismark)

2.  GeneraWon  of  bisulfite  converted  genome  (Bismark)  

         (続き)  

 

2)  bisulfite  converted  genome  を置くファイルを作成する。  

   mkdir  –p  Genome/Bisulfude/hg19     3)  Homo_sapiens/UCSC/hg19/Sequence/Chromosome/  の中のクロモソームを含む   fastaファイルをGenome/Bisulfude/hg19にコピーします。     cp  /Homo_sapiens/UCSC/hg19/Sequence/Chromosome/*fa  Genome/Bisulfude/hg19    

4)  bisulfite  converted  genome  の作成  

 

bismark_genome_preparaWon  -­‐-­‐verdose    Genome/Bisulfude/hg19    -­‐-­‐bowWe2     -­‐-­‐path_to_bowWe  /usr/local/bin  

 

-­‐-­‐verdose  にはbisulfite  converted  genome  を置くファイルを、  

-­‐-­‐path_to_bowWeにはbowWe2  が置かれているファイルを指定します。    

   

(5)

解析の実際

 5  (Bismark)

2.  Genome  Alignment  (Bismark  -­‐  BowWe2) (続き)  

  1)  Bismark  (bowWe2) によるアラインメント     Perl  のモジュールのGD::Graphを最初にインストールしておかないと、   結果のグラフが出てきません。   あらかじめ、gd  とgd-­‐devel  をインストールしておき、   perl  –MCPAN  –e  shell    

cpan>  upgrade   cpan>  install  YAML   cpan>  GD  

Cpan>  GD::Graph  

でperl  のモジュールをインストール  

zlib,  libpng,  freetype,  jpeg,  xpm  関連のライブラリも一緒にインストール    

コマンド: bismark  -­‐q  -­‐-­‐bowWe2  -­‐-­‐path_to_bowWe  /root/bin/       Genome/Bisulfide/hg19    -­‐-­‐1  test1-­‐2.fq  -­‐-­‐2  test2-­‐2.fq    

   

-­‐q  fastq  の場合、-­‐-­‐phred64-­‐quals    クオリティスコア phred64    を使用している場合   -­‐-­‐path_to_bowWeにはbowWe  が置かれているファイルを指定  

Genome/Bisulfide/hg19  bisulfite  は、converted  genome  の場所         RHELとか、CentOS系はこのあたりのパッケージの   依存性が壊れていて、構築にそれなりに工夫が必要   です。詳細は、個別にお問い合わせください。  

(6)

解析の実際

 6  (Bismark)

2.  Genome  Alignment  (Bismark  -­‐  BowWe2) (続き)  

 

1)  Bismark  (bowWe2) によるアラインメント  (続き)  

 

コマンド例: bismark  -­‐q  -­‐-­‐phred64-­‐quals  -­‐-­‐bowWe2  -­‐-­‐path_to_bowWe  /root/bin/     Genome/Bisulfide/hg19    -­‐-­‐1  test1-­‐2.fq  -­‐-­‐2  test2-­‐2.fq    

    うまくいば、   *.png   *.sam   *.txt    の3つのファイルができているはず。     2) duplicate  除去     コマンド例: deduplicate_bismark  –s  test1-­‐2.fq_bismark_bt2.sam     オプション -­‐s  :  シングルエンドの場合、   -­‐p:ペアエンドの場合      

(7)

解析の実際

 7  (Bismark)

1)  Bismark  (bowWe2) によるアラインメント   (続き)  

*alignment_overview.png  の結果  

1箇所にalign 複数箇所にalign Alignしなかったもの h7p://www.bioinformaWcs.babraham.ac.uk/projects/bismark/Bismark_User_Guide.pdf

(8)

解析の実際

 8  (Bismark)

3.  メチル化部位の検出

    コマンド使い方: bismark_methylaWon_extrctor    [オプション]  <ファイル名>.sam     以下でヘルプが見れます。  

bismark_methylaWon_extractor  –help  |  more     コマンド例   bismark_methylaWon_extractor  -­‐s  –comprehensive   test1-­‐2.fq_bismark_bt2.duplicated.sam     -­‐s  :  シングルエンドの場合、   -­‐p:ペアエンドの場合   -­‐-­‐comprehensive      結果の出力形式の指定。ヘルプを参照。     以下のような接頭文字をもつ出力ファイルが3つできる。     CpG_content_....txt   CHG_content_....txt   CHH_content_....txt   これらのデータから、情報を抽出して、   いろいろな統計情報を作れる。

(9)

解析の実際

 9  (Bismark)

4.  メチル化部位の視覚化

    コマンド使い方:      bismark_methylaWon_extrctor    [オプション]  <ファイル名>.sam     以下でヘルプが見れます。  

 bismark_methylaWon_extractor  –help  |  more    

コマンド例  

 bismark_methylaWon_extractor  -­‐s  -­‐-­‐bedGraph  –counts   test-­‐2.fq_bismark_bt2.duplicated.sam  

 

-­‐s  :  シングルエンドの場合、   -­‐p:ペアエンドの場合   -­‐-­‐bedGraph  –counts      

 

 できた、*.bedGraph  ファイルをUCSC  Genome  Browser    などで視覚化   できます。  

     

(10)

解析の実際

 10  (Bismark)

4.  メチル化部位の視覚化(続き)  

 

bedGraphの中身はこんな感じです。 (このあとは,  

RやPerlなどでいろいろ処理できます。)  

 

#  head    test-­‐2.fastq_bismark_bt2.deduplicated.bedGraph  

track  type=bedGraph  

chr21        1050344        1050345        0  

chr21        1050919        1050920        0  

chr21        1050920        1050921        50  

chr21        1050987        1050988        100  

chr21        1050988        1050989        50  

chr21        1051049        1051050        100  

chr21        1051238        1051239        100  

chr21        1051282        1051283        100  

chr21        1051395        1051396        100  

メチル化率

大体1千万箇所くらい   ありました。

(11)

解析の実際

 11  (Bismark)

4.  メチル化部位の視覚化(続き)

 

bedGraph  で以下のような感じで閲覧できます(UCSC  Genome  Browser)。    

 

ここで取り込んだ  

メチル化部位を  

(12)

解析の実際

 12  (Bismark)

4.  メチル化部位の視覚化(続き)  

 

IGVによる視覚化例 

    h7p://nbviewer.ipython.org/urls/dl.dropboxusercontent.com/u/115356/ip/claire/ Larv_BS_Workflow_Example-­‐IGV.ipynb

(13)

解析の実際

 13  (Bismark)

4.  メチル化部位の視覚化(続き)  

 

M-­‐biasの出力結果。メチル化の偏りが確認できる。  

 

  h7p://www.bioinformaWcs.babraham.ac.uk/projects/bismark/Bismark_User_Guide.pdf

(14)

解析の実際

 14  (Bismark)

 

インストールや解析に、はまりどころが結構ある。

 

 

Perl  のモジュールのGD::Graphをインストールしないと  

グラフの出力ができないが、

 

 

RHEL  では、 パッケージの依存性が壊れているようで、  

yum  でエラーが出る。特定のパッケージをウェブ上で検索し、

rpmコマンドをつかってインストールする必要があった。その

後、

perl  -­‐MCPAN  -­‐e  shell  でインストール。  

Ubuntu  などでは未確認。)  

 

 

時間がかかる(時間のオーダー、

1プロセス数時間)。  

メモリもかなり必要(数百ギガのオーダー)。

 

 

 

 

(15)

解析の実際

 15  (Bismark)

 

このあとすること。

(RNA-­‐Seq  や ChIP-­‐Seqでの作業と類似)  

 

1、アノテーション。  

 

 genes.g|、 refFlat.txt    から、情報を抽出して、  

 bash,  perl/Python/Ruby    などでスクリプトを作って注釈をつけま

す。

Methylkit  などRのパッケージ他も、使えます。  

 

2、

 differenWal  methylaWon    

 

 各実験区のbedGraph  をマージして、変動比を出し統計解析。  

 

3、機能解析

 

GO解析とか、パスウェイ解析とか、(DAVIDなどをつかって、、。)  

 

4、モチーフ解析 

WebLogo,  MEME  

 

(16)

解析の実際

次世代シーケンサーによる網羅的メチル化解析

RRBS、Sure  Select  Methyl-­‐Seq)  

 

現状で、定量性を持たせるには、かなりのリード

数が必要。

 

 

データ解析もかなりのパワーを要する。

 

 

現状で、多検体の解析に向くか、どうか、厳しい

ところ。

 

(17)

今回の解析で用いた

 

解析サーバーのスペック

• 

HP  ProLiant  DL980G7    

• 

CPU:80コア メモリ:2TB RHEL6.4  

参照

関連したドキュメント

Here, instead of considering an instance I and trying to directly develop a feasible solution for the P, G ∗ |prec; c ij dπ k , π l 1; p i 1|C max problem, we consider a

As in the previous case, their definition was couched in terms of Gelfand patterns, and in the equivalent language of tableaux it reads as follows... Chen and Louck remark ([CL], p.

Chu, “H ∞ filtering for singular systems with time-varying delay,” International Journal of Robust and Nonlinear Control, vol. Gan, “H ∞ filtering for continuous-time

From this figure it is clear that the counter-propagation network is composed of three layers: an input layer that reads input patterns from the training set and forwards them to

TRACG は,オリジナルの原子炉過渡解析コード(TRAC)[1]の GE Hitachi Nuclear Energy

解析モデル平面図 【参考】 修正モデル.. 解析モデル断面図(その2)

※ CMB 解析や PMF 解析で分類されなかった濃度はその他とした。 CMB

2 次元 FEM 解析モデルを添図 2-1 に示す。なお,2 次元 FEM 解析モデルには,地震 観測時点の建屋の質量状態を反映させる。.