第 10 回シーケンス講習会 RNA-seq library 調製法の特徴と選び方理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設 (GeNAS) 野間将平

(1)

第

_{10回　シーケンス講習会}

RNA-seq library調製法の特徴と選び方

理化学研究所（RIKEN）ライフサイエンス技術基盤研究センター（CLST）機能性ゲノム解析部門（DGT）ゲノムネットワーク解析支援施設（GeNAS）　野間　将平

(2)

概略

l 

シーケンスをする目的は？

l 

よいシーケンスライブラリーとは？

–

  RNA-seq

ライブラリーのムリ・ムダ・ムラ

l 

いろいろな

RNA-seqライブラリーの特徴

–

 

性能比較実験の結果から

(3)

RNA シーケンスをする目的

l 

RNAを研究することで分かること

–  RNA-seq は細胞・組織の”今”の状態を知る l 

ライブラリー作製・シーケンスは解明のための通過点（一手段）

–  RNA抽出が完了した時点で結果は出ている –  そこからいかに情報を失わず、シーケンスに持ち込むか

(4)

減らしたい

RNA シーケンスのムリ・ムダ・ムラ

l  ムリ –  RNAが本来持っていた情報が正確に反映されていない状態 •  結果にバイアスがかかった状態 •  RNAの品質、サンプル量 l  ムダ –  RNAの持つ情報は極力失いたくない

•  とはいえ、Total RNA をそのままシーケンスするとほとんど(9割) がrRNA

•  現行のシーケンサー能力やコストを考慮するとrRNA を効率的に除去する必要がある

–  Oligo dT Beads

–  RiboZero (Epicentre/Illumina)

–  GeneRead rRNA Depletion Kit (QIAGEN) etc…

–  PCR条件の最適化

•  PCR duplicate の割合を減らす

l  ムラ

–  結果が再現しない

(5)

Stranded RNA-seq 手法比較

l 

評価対象

–  TruSeq Stranded RNA (Illumina)

–  ScritSeq v2 (Epicentre)

–  RNA ligase base method (GeNAS)

l 

Human Brain total RNA 1ug を使用して各手法　n=3 でlibrary 調製

l 

rRNA 除去にはRiboZero Goldを使用

–  Non-cording RNAも含まれる

l 

3mix ibrary / lane でHiSeq2500 100PE でシーケンス

l 

Genomic Work Bench (CLC Bio) で解析

(6)

TruSeq Stranded RNA Sample prep

cDNA synthesis /Ligate adapter /

PCR amplification

UUA

1st strand cDNA synthesis with random hexamer

U

AAT A _{First
strand
cDNA}RNA UUA AAT U A 1st strand cDNA _{2nd
strand
cDNA}

5’ 3’ 5’ 3’ 5’ 3’ 5’ 5’ 3’ 3’ 5’ UUA U AAT A 5’ 3’ 3’ 5’ AAT A UUA U Pol Pol

2nd cDNA synthesis with random hexamer

Incorporates dUTP instead of dTTP

Amplify with High-‐ﬁdelity Taq Strand selecFve ampliﬁcaFon

5’ 3’

End repair, adenilaFon Adapter ligaFon

(7)

ScriptSeq v2

h7p://www.arb-‐ls.com/products/scriptseq_v2_rna_seq_library_preparaFon_kit/

(8)

RNA ligase base method

AAAAAAAA

Poly(A )RNA selecFon or rRNA removal Random fragmentaFon by sonicaFon

P

Phosphatase treatment and

PolynucleoFde Kinase treatment

Pre-‐adenylated 3’ linker ligaFon

App

P

5’ linker ligaFon

Reverse transcripFon reacFon

RT primer

PCR and size selecFon (AMPure beads)

P

Sequencing by Illumina GAIIx, HiSeq2000, HiSeq2500

(9)

再現性 

Technical replica

hg19 refseqにmappingしてRPKM算出 Log10(1+RPKM) でプロット各手法とも再現性は高レベル GeNAS

RNA ligase base Epicentre

TruSeq stranded

r=0.99 r=0.99

(10)

手法間での発現量相関

RNA ligase base

T ru Se q st ra nd ed Scri pt Se q TruSeq stranded Scri pt Se q

RNA ligase base

R=0.95 R=0.92

R=0.98

(11)

Strand Specificity

TruSeq RNA Non-stranded TruSeq RNA stranded ScriptSeq v2

RNA ligase base

l  Read1 のFastq をCLC Genomics Workbench 6.0.2にimport

l  hg19, ERCC ref seq にmapping

l  PCR duplicateを除去 l  ERCCに対するreadの方向を比較

53.03%

98.74%

94.47%

99.96%

(12)

Coverage　evenness

A：RNA ligase base B：TruSeq Stranded C：ScriptSeq A B C A B C Coverageスケールはそれぞれ異なる TruSeq Strandedが安定して全体をカバーできている他はcoverageに偏りあり Replicate間で偏り傾向は一致していたので手法に依存したバイアスがある推測される

(13)

検出遺伝子数

TruSeq Stranded (17165)

ScriptSeq (16245) RNA ligase base

(17093) 14301 1726 365 675 701 463 904 TriplicateでRPKM 1<　示したものをカウント

(14)

14

検出遺伝子数

0 5000 10000 15000 20000 25000 30000 35000 40000

1.E-03 1.E-02 1.E-01 1.E+00 1.E+01 1.E+02

G eN A S Illum ina Epicentre 1 一定のRPKM以上で検出された遺伝指数 RPKM Number of gene detected

●RNA ligase base

●TruSeq Stranded

(15)

1 10 1.000E+00 1.000E+01 理論値 RPKM ERC C RPKM G eN AS RPKM Illum ina RPKM EpicentreRPKM

ERCCによる定量性の検証

Read count 10未満を外れ値として除外してプロット RPKMで取ったスピアマン相関係数

RNA ligase base : 0.90 TruSeq Stranded : 0.94 ScriptSeq v2 : 0.91

(16)

手法間の相対比較

l 

手法毎に得手・不得手はある

–  現時点でTruSeq Strandedが相対的に優れている点が多い手法名 Illumina (TruSeq Stranded) Epicentre (ScriptSeq v2) GeNAS

(RNA ligase base)

必要サンプル量 ○ 0.1-1.0ug ○ 0.1-1ug △　　1ug≦

コスト △ 48反応/kit △ 6反応/kit △ 試薬を個別に用意する必要あり

操作性 ○ 2day ◎ 1day △　3day

再現性 ◎ R=0.99 ◎ R=0.99 ◎ R=0.99

Strand Specificity ○ △ ◎　

Coverage evenness ○ △ △

定量性 ◎ ○ ○

◎極めて優れる　○ 優れる　△ 普通

第 10 回シーケンス講習会 RNA-seq library 調製法の特徴と選び方 理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設 (GeNAS) 野間将平

第

10回 シーケンス講習会

RNA-seq library調製法の特徴と選び方

概略

シーケンスをする目的は？

よいシーケンスライブラリーとは？

–

RNA-seq

ライブラリーのムリ・ムダ・ムラ

いろいろな

RNA-seqライブラリーの特徴

–

性能比較実験の結果から

RNA シーケンスをする目的

RNAを研究することで分かること

ライブラリー作製・シーケンスは解明のための通過点（一手段）

減らしたい

RNA シーケンスのムリ・ムダ・ムラ

Stranded RNA-seq 手法比較

評価対象

Human Brain total RNA 1ug を使用して各手法 n=3 でlibrary 調製

rRNA 除去にはRiboZero Goldを使用

3mix ibrary / lane でHiSeq2500 100PE でシーケンス

Genomic Work Bench (CLC Bio) で解析

TruSeq Stranded RNA Sample prep

cDNA synthesis /Ligate adapter /

PCR amplification

ScriptSeq v2

RNA ligase base method

再現性

Technical replica

手法間での発現量相関

Strand Specificity

53.03%

98.74%

94.47%

99.96%

Coverage evenness

検出遺伝子数

検出遺伝子数

ERCCによる定量性の検証

手法間の相対比較

手法毎に得手・不得手はある

第 10 回シーケンス講習会 RNA-seq library 調製法の特徴と選び方理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設 (GeNAS) 野間将平

_{10回　シーケンス講習会}

  RNA-seq

Human Brain total RNA 1ug を使用して各手法　n=3 でlibrary 調製

再現性 

Coverage　evenness