© 2014 Illumina, Inc. All rights reserved.
NGSアプリケー
ション紹介
(MiSeqシステム)
イルミナ株式会社
サービス・サポート部
仲
健太
多岐にわたるNGSの応用分野
遺伝学
癌
遺伝性疾患
生殖医療
法医学
製薬
感染症
農業
基礎研究
全ゲノム解析
エクソーム解析
トランスクリプトーム解析
遺伝子発現プロファイル解析
メチル化解析
メタゲノム解析
微生物ゲノム解析
ターゲットリシーケンシング
ChIP-Seq解析
Small RNA解析
多サンプルアンプリコンシーケンス
アンプリコンシーケンス
ライブラリQC
HiSeq2500 1000 Gb / ラン 6日 / ラン MiSeq ~15 Gb / ラン ~3日 (55時間) / ラン NextSeq 500 120 Gb / ラン 1日 / ランNGSの代表的なアプリケーション
研究の目的と実験デザイン
研究の目的
なにを読むのか
– 生物種:ヒト、動物、植物、微生物 – メタゲノムどう読むのか
– リシーケンス – アセンブルどこを読みたいのか
– 全ゲノム – 遺伝子領域目的は何か
– SNP & indel探索、1塩基変異 – 染色体構造、コピー数変化 – 発現プロファイリング – ピーク検出どういう精度を得たいのか
– ざっくりと傾向をつかむ – ある程度の精度で詳細に観察ランのデザイン
リード長の選択
– 35bp, 50bp, 75bp, 100bp….(任意)ライブラリーの選択
– シングルリード(片側読み) – ペアエンド(両端読み: 200-500bpインサート) – メイトペア(両端読み: 2-5kbインサート)データの厚み
– 10x、20x、30x….実験をする上での制約
コスト
– プロジェクトの予算(試薬)時間
– ランにかかる日数とこなすべきプロジェクト数サンプル
– 数、量、クオリティ など検証
– その他の手法は?ライブラリー調製からデータ解析
1.
DNAシーケンス解析
1.
疾患パネル紹介
2.
メタゲノム解析
2.
RNAシーケンス解析
第2部
NGSを利用した実験の組み立て方
TruSeq Nano DNA
TruSeq DNA
PCR-Free
Nextera XT
Nextera Mate Pair
TruSeq Custom
Amplicon Low Input
TruSeq Exome
TruSeq Rapid Exome
Nextera Rapid Capture
Custom Enrichment
TruSight Myeloid
TruSeq RNA
TruSeq Stranded
mRNA
TruSeq Stranded
Total RNA
TruSeq Targeted
RNA Panel
TruSeq Small RNA
TruSeq ChIP
TruSight Tumor 15
Nextera DNA
TruSeq Amplicon
Caner Panel
TruSeq RNA
Access
TruSight
疾患パネル
イルミナが提供する主なライブラリー調製キット
DNA用
RNA用
TruSeq Synthetic
Long-Read
TruSight RNA
Pan-Cancer
データ解析
データ解析
アプリケー
ションの選択
DNA
全ゲノム
ターゲット
RNA
mRNA
Total RNA
解析ツールの
選択
BaseSpace
(イルミナ)
サードパー
ティ
BaseSpace 概念図
配列データ、解析データの保存・共有・譲渡
配列データ、解析データの 保存、共有、 所有データの譲渡 所有または共有された データを使用して アプリを実行データを
BaseSpaceに
アップロード
クリックによる解析が可能 ラン・解析データの管理 データの共有データ解析計算量例
(250 iCredit)
アプリケーション
条件
iCredit
サンプル数
微生物 Kraken (16S) 100K 300 PE 0.025 10,000サンプル SPAdes(de novo) 500Gb 300 PE 4.5 55サンプル アンプリコンシーケンス Amplicon DS 3M 150SE 0.25 100サンプル エクソームIsaac Enrichment 8Gb 75SE 6 41サンプル BWA Enrichment 8Gb 75SE 9 27サンプル トランスクリプトーム
RNA Express 10M 75SE 0.125 2,000サンプル TopHat Cufflinks 30M 75SE 6 41サンプル TopHat Cufflinks 50M 75PE 13 19サンプル 全ゲノム解析
Isaac WGS 120Gb 150PE 27 9サンプル BWA Whole Genome 120Gb 150PE 144 1サンプル
BaseSpaceで提供されているアプリケーション
全ゲノムシーケンス
ターゲットシーケンス
トランスクリプトーム
メタゲノム解析
バクテリア de novo アセンブル
その他
1. DNAシーケンス
・疾患パネル紹介
DNAライブラリー調製の主な方法
gDNA
超音波による断片化 + アダプター ライゲーション トランスポソーム による断片 + PCRによるアダプター付加 2つのプローブによる 伸長とライゲーション + PCRによるアダプター付加TruSeq
Nextera, TruSight
TruSeq Amplicon
クラスター形成、シーケンス
キャプチャー
物理的な断片化
酵素による断片化
アンプリコン生成
全ゲノム
ターゲット
アンプリコン
キャプチャー
全ゲノム
ターゲット
物理的な断片化方法
RNA
(Except for TruSeq PCR-free)
標的領域濃縮方法
構築したライブラリー PCR, クラスター形成 & シーケンス 1 3 サンプルライブラリーをプール 変性した2本鎖のDNAライブラリー ビオチンプロー ブ ビオチン化プローブをターゲット領域にハイブリダ イゼーション ストレプトアビ ジンビーズ ストレプトアビジンビーズを用いて濃縮 ビーズからの溶離TruSight疾患パネル
One
疾患関連4813遺伝子をターゲトとしたエク
ソーム解析
Cardio
遺伝性心臓疾患174遺伝子をターゲット
癌パネル
癌の素因に関係する94遺伝子をターゲット
遺伝性疾患パネル
重篤な小児遺伝性疾患に関与する552遺伝
子をターゲット
TruSight Cancer – 94 遺伝子
よくある癌、稀な癌の
遺伝的素因
を同定
癌との関連が報告されている284 SNPsが解析できる
臨床応用
– 患者サンプルを用い、稀な複数の癌に対するコスト効率のよい遺伝的素因
テスト
(1種類の稀な癌パネルであればコストが高くかかってしま
う)
– 同定した変異から、家族への検査の必要性を決定
– 癌種ごとに、治療法の可能性を提供
研究
– 癌サンプルをコスト効率よく迅速に区分け(既知遺伝子に基づくサンプルの情報引き出し) – 現在の手法は多くのDNA量を必要とし、ワークフローに時間がかかる• Somatic (体細胞変異)ではなく、Germline (生殖細胞変異/SNP)にフォーカス
• サンプルは、
正常細胞を想定
(癌細胞ではない)
• 例) 癌患者の血液サンプル
• 例) 健康者の血液サンプル
TruSight Cancer Panelがターゲットにしている癌
遺伝性腫瘍・家族性腫瘍
遺伝性腫瘍の病名
原因遺伝子
その他にできやすいがんの例
リンチ症候群 (遺伝性非ポリポーシス大腸がん; HNPCC) MSH2, MLH1 子宮体がん、卵巣がん、胃がん、小腸がん、卵巣がん、腎盂(じんう)・尿管がん 家族性大腸ポリポーシス 胃がん、十二指腸がん、デスモイド腫瘍 (家族性大腸腺腫症) APC 遺伝性乳がん・卵巣がん症候群 BRCA1, BRCA2 前立腺がん、膵臓がん リー・フラウメニ症候群 TP53 乳がん、急性白血病、脳腫瘍、副腎皮質腫瘍 網膜芽細胞腫 (もうまくがさいぼうしゅ) RB1 骨肉腫、肉腫 多発性内分泌腫瘍症(MEN)1型 MEN1 下垂体・膵ランゲルハンス島・副甲状腺腫瘍または過形成 多発性内分泌腫瘍症(MEN)2型 RET 甲状腺髄様がん、副甲状腺機能亢進症、褐色細胞腫TruSight Cancer Panelはこれら
全ての遺伝子
を含んでいます。
独立行政法人国立がん研究センターがん対策情報センター http://ganjoho.jp/public/cancer/data/genetic-familial.html
One Inherited Disease Cancer Tumor
TruSight Portfolio
17の遺伝性心臓疾患に関与する174 遺伝子のエクソン領域をカバー
遺伝的要因と関連する心疾患にフォーカス
コンテンツはImperial College of Londonとの共同研究
Cardio
心疾患の遺伝的要因を包括的なテストで解析
新しいプロセス
– 心疾患の遺伝的要因の包括的な遺伝子セットで解析
利点
– 迅速な治療選択肢を提供
1週間
–
家族スクリーニングの必要性も判定
(遺伝性の有
無)
心疾患の
臨床表現
型を示す
TruSight
心疾患パ
ネルで解
析
心疾患に関
与する変異
を同定
治療法の
選択
YES: 毎年
の健康診
断で
チェック
家族に同
じ変異が
あるかを
テスト
NO: とく
になし
Cardio遺伝性心疾患
臨床的関連のある遺伝子をカバー
59 47 21 16 15 15 13 11 11 10 9 7 6 4 4 3 3 0 10 20 30 40 50 60 70 Dilated Cardiomyopathy Hypertrophic Cardiomyopathy Familial atrial fibrillation Familial Aortic Anuerysm Long QT Syndrome Structural heart disease Brugada Syndrome AVRC Noonan Syndrome Non-compaction Cardiomyopathy Restrictive Cardiomyopathy Familial Hypercholesterolemia CPVT Short QT Syndrome Loeys-Dietz Syndrome Marfan Syndrome Aortic Valve DiseaseOne Cancer Cardio Tumor
TruSight Portfolio
552遺伝子のコーディングエクソン、イントロン-エクソン境界、
病原性変異を含む既知の領域をカバー
重度の小児疾患に寄与する遺伝子にフォーカス
Stephen Kingsmore博士、Carol Saunders博士、Hilger Ropers博士らによる設計
– マーシー子供病院(CMH)小児ゲノム医療センター
– マックスプランク研究所
Inherited
Disease
TruSight
Inherited Diseases
– 552 遺伝子
小児疾患(遺伝性疾患)の特徴付け
新しいプロセス
– 網羅的な遺伝子セットで解析
利点
– スピード(数ヶ月 > 1週間)
– コスト効率
– 網羅性
臨床症候を 示す子供 特定疾患 と同定で きず 単一遺伝子 疾患のテスト を実施 該当なし 別の単一 遺伝子疾患 のテストを 実施 該当なし 臨床症候を 示す子供 特定疾患 と同定で きず TruSight 遺伝性疾 患で解析 疾患同定 の可能性 現在のプロセス – 疾患が同定できるまで、繰り返し単一遺伝子疾患の テストを実施 Dr. Stephen Kingsmore: 現在LDT(ラボ開発テスト)としてこの製品を実行に移している (小児患者の疾患診断のための最初のテストとして利用One
Inherited Disease Cancer TumorTruSight Portfolio
4813 遺伝子をカバー
TruSight Exomeに追加コンテンツを搭載した、疾患関連遺伝子解析用のパネル
CardioTruSight
One
TruSight Exome
希少疾患パネル
(2,761 genes)
HGMD + OMIM
(1,966 genes)
GeneTests.org
(69 genes)
Other TruSight
(17 genes)
TruSight Oneシーケンスパネル
包括的な疾患関連遺伝子のエクソーム解析
疾患関連遺伝子のエクソームをターゲットとした
日本におけるTruSight One解析例
弊社ウェブページ「研究者の声」より抜粋
先天性疾患の原因変異探索の研究デザイン例
疾患状態
家族内集積がある
遺伝性疾患
家族内集積なし
孤発性疾患
仮説
常染色体劣性遺伝
De Novo 変異
スクリーニング
親子兄弟
親子兄弟
検証実験
別家系1~2組
別家系の発症者2~3名
アンプリコン疾患パネル
TruSeq Amplicon
Cancer Panel
血液および固形腫瘍に関与する48遺伝子の
ホットスポットをターゲット
TruSight Tumor 15
固形癌に関与する15の遺伝子をターゲット
としたマルチプレックスPCRパネル
TruSight Tumor 26
肺癌、大腸癌、メラノーマ、胃癌、卵巣癌
に関与する26遺伝子をターゲット
TruSight Myeloid
骨髄性悪性腫瘍に関連する54遺伝子をター
ゲット
TruSight Lymphoid
リンパサンプルにおける変異の検出
TruSight ALL
急性リンパ性白血病に関連する約60遺伝子
をターゲット
TruSight Myeloma
骨髄腫関連遺伝子をターゲット
Coming soon Coming soon Coming soonリスク予測
スクリー
ニング
診断
薬剤応答
転移/再発
ICGC: International Cancer Genome Consortium
国際共同研究(国際が
んゲノムコンソーシア
ム)
50種類のがんについて
それぞれ500症例(500
ペア、1000人分)のゲ
ノム解読が目的
現在12,807人ドナーが
登録
https://dcc.icgc.org/
TCGA : The cancer genome atlas pan-cancer
analysis project
米国NIH
20種類以上のがんを対象と
したオミックス解析
– 変異
– CNV
– 遺伝子発現
– DNAメチル化
– microRNA
– RPPA
– 臨床データ
イルミナがん関連シーケンスコンテンツセットの概要
TruSight Cancer
• 94 遺伝子 • 濃縮ベース • 遺伝リスクの探索 • 平均カバレッジ 500xTruSight 腫瘍パネル
• 15もしくは26 遺伝子 • アンプリコンベース • 体細胞変異の探索 • 最高の検出限界 • 最高のカバレッジTruSeq Amplicon Cancer
• 48 遺伝子 (血液腫瘍を含む) • アンプリコンベース • 体細胞変異の探索 • 低コスト、ハイスループット
腫瘍
寛解
再発
不
均一性
TruSight RNA Pan Cancer
• 1385 遺伝子 (血液腫瘍を含む)
• 融合遺伝子、バリアント、発現プロファイルの評価 • MiSeqでも1ランあたり8サンプルの解析が可能
イルミナがんパネルの比較
TruSight Tumor 15 TruSight Tumor 26 TruSight Myeloid TruSeq Amplicon Cancer TruSight Cancer利用形態
体細胞変異 体細胞変異 体細胞変異 体細胞変異 生殖細胞変異がん腫
肺癌、卵巣癌、 大腸癌、結腸直 腸癌、メラノー マ、乳癌 肺癌、卵巣癌、 大腸癌、結腸直 腸癌、メラノー マ 骨髄性悪性 乳癌、卵巣癌、 大腸癌、白血病 肺癌、胃癌、大 腸癌、卵巣癌、 メラノーマスタート量
20ng 30-300ng 50ng 150-250ng 50ng検出変異頻
度
5% 5%以下 5% 5% NA遺伝子数
15 遺伝子 26 遺伝子 54 遺伝子 48 遺伝子 94 遺伝子ターゲット
44 kb 21 kb 141 kb 35 kb 255 kb手法
アンプリコン アンプリコン アンプリコン アンプリコン 濃縮リード長
151bp x2 121bp x2 150bp x2 150bp x2 150bp x2カバレッジ
20,00x以上 7,000x 500x 1,000x 100x対象とする遺伝子の比較
TruSight Tumor 15
TruSight Tumor 26
FOXL2
ALK
CDH1
FBXW7
GNAS
SMAD4
APC
CTNNB1 FGFR2
PTEN
SRC
STK11
MAP2K1
MSH6
ABL1
ERBB4
HNF1A
KDR
PTPN11
ATM
FGFR1
HRAS
MLH1
RB1
CDKN2A FGFR3
IDH1
MPL
SMARCB1
CSF1R
FLT3
JAK2
NOTCH1
SMO
JAK3
NPM1
VHL
TruSeq Amplicon Cancer (48 genes)
AKT1
EGFR
GNAQ
KRAS
PDGFRA
BRAF
ERBB2
KIT
MET
PIK3CA
NRAS
TP53
RET
GNA11
カスタムパネル製品
製品名
TruSeq Custom Amplicon
Low Input
TruSeq Custom Amplicon
v1.5
gDNAインプット量 10 ng 50 ng FFPEインプット量 10 ng ~ 250 ng アッセイ時間 6.5時間 10時間 キットサイズ 16, 96+サンプル 96+サンプル アンプリコン数 16 ~ 1,536 16 ~ 10,000* アンプリコンサイズ 150, 175, 250 bp 150, 175, 250, 425 bpTruSeq Custom Amplicon Low Input
10ngインプット量からのアンプリコンシーケンス
NEW !
*イルミナコンシェルジュサービスのご利用によりデザイン可能価格も大幅改定!
例)200アンプリコン、16サンプルのライブラリー調製からシーケンスまで
ライブラリー調製キット;286,000円、シーケンス試薬キット;178,000円
サンプルコスト
わずか29,000円
(*インデックスキットも含む)TruSeq Custom Amplicon Low Input
10ngインプット量で、5%アリル頻度を検出
gDNAサンプル
0.0% 5.0% 10.0% 15.0% 20.0% 25.0% 0.0% 10.0% 20.0% 30.0% Sample 1: 10ng 0.0% 5.0% 10.0% 15.0% 20.0% 25.0% 30.0% 35.0% 0.0% 10.0% 20.0% 30.0% Sample 1: 5ng高品質FFPEサンプル
物理的な断片化
酵素による断片化
アンプリコン生成
+ Capture + Capture
アプリケー
ション
全ゲノム Exome 全ゲノム Exome / Target Target製品名
TruSeq DNA TruSeq
Exome Nextera DNA
TruSeq Rapid
Exome TruSeq Custom Amplicon
TruSight One TruSight Panels
TruSeq Amplicon Cancer (48 genes)
TruSight Tumor (26 genes) TruSight Myeloid
DNAインプッ
ト量
100-1000 ng 100 ng 1-50 ng 50 ng 30-300 ngFFPE対応
No No No No Yes / Noカスタム対応
No No No Yes Yesイルミナが提供するライブラリー調製手法
ターゲットシーケンス解析ワークフロー
ライブラリー調製
シーケンス
アライメント
変異コール
アノテーション
フィルタリング
Enrichment
VariantStudio
サンプルから答えまで、一連の工程をサポート
Nextera Rapid
Capture Exome
TruSight One
アライメント&変異コール用解析アプリの選択
BWA Enrichment v2.1
① Project WindowでLaunch Appを選択する
解析レポートでライブラリーの品質を確認
標的領域にアライメントされたリード割合
X10、X20以上でカバーされる標的領域の割合
製品スペック (x10以上のカバー領域>80%)
Nextera Rapid Capture Exomeの場合
Broad Instituteが開発した多機能ゲノムブラウザ
ゲノムへのアライメントとバリアントを可視化
IL1F10遺伝子領域のアライメントとバリアント
拡大/縮小
「IL1F10」と入力
アノテーション
– 変異した塩基に関する情報付加
どの変異が疾患と関連したものなのか?
フィルタリング
– 疾患に関連しない変異を除外
NHLBIExome Variant Server
30,000~
エクソン領域
10,000
~
疾患関連遺伝子
100~
有害な変異
10~
稀
アノテーション&フィルタリング用解析アプリの選択
VariantStudioの実行
① Project WindowでLaunch Appを選択
② Variant Studioの実行
ソフトのインストールが必要 ・64-bit Wndows OS (Wndows 7以降) ・インターネット接続が必要 ・メモリ2GB以上 ・25 MB以上の空き領域VariantStudioが提供する変異アノテーション情報
結果閲覧したい変異解析結果(VCF ファイル)を選択
Annotation & Classificationタブから”Annotate”を選択
dbSNP 各人種集団でのアレル頻度 タンパク質構造への影響度 (SIFT、Polyphen) COSMIC: 癌由来の体細胞変異データベース ClinVar:臨床的表現型に関連のある変異データベース など
VariantStudioでのフィルタリング
フィルタリング
疾患の遺伝様式に基づいた絞り込み
疾患に関わることが報告
されている変異を絞り込
み
アレル頻度での絞り込み
アライメント
(BWA)
変異コール
(GATK)
VCF
アノテーション
レポートの
出力
BWA Enrichment
エクソーム解析ワークフローのまとめ
VariantStudio
VCFの入力
アノテーション
フィルタリング
メタゲノム解析=微生物を集団で解析する
16s rRNA解析
微生物ゲノムの16s rRNA遺伝子のみをシー
ケンスする
16s遺伝子はウィルスを除くすべての微生物
に存在する
16s rRNAの配列は多様性を持つため、その
配列の解析からサンプルに含まれる微生物を
同定可能
ショットガン解析
微生物の全ゲノム・転写物をシーケンスする
遺伝子の機能予測やウィルスの解析まで期待
できる
16S rRNAは1,542塩基長の原核生物 の
リボソームRNAの一部である。 (真核
生物の場合は18Sとなる)
16S rRNA遺伝子は保存領域と可変領
域を有しており、保存領域をターゲッ
トとしてプライマーをデザイン するこ
とで、可変領域の増幅およびシーケン
スが可能。
16S rRNA 遺伝子配列とは?
16S rRNA領域の増幅用プライマーの注意点
V1とV2領域を挟むF27-R338
プライマーセットは、細菌
への特異性が高い一方で腸
内細菌叢の主要コミュニ
ティである
Bifidobacterium属
(ビフィズス菌など)の検
出感度が低い
V4領域を囲む F515-R806プ
ライマーセットは細菌や古
細菌など多様性高いコミュ
ニティを感度良く検出する
ことができる一方、
皮膚常
在菌のPropionibacterium属
(アクネ菌など)の増幅が
困難
“Experimental and analytical tools for studying the human microbiome” Kuczynski et al., Nat Rev Genet. 2011 Dec 16;13(1):47-58
参考になる大規模な国際プロジェクト
プロジェクト
期間
内容
Earth Microbiome Project
(EMP)
2010-地球上の様々な環境サンプルを収集し
約200,000サンプルを解析し、細菌叢ゲ
ノムリファレンスを構築。
MetaHIT
2008-2012
健常者、肥満者、IBD患者の糞便を解析。
NIH Human Microbiome Project
(HMP)
2008-2013
健康な242名の様々な組織からサンプリ
ングし、細菌叢ゲノムリファレンスを
構築。
NIH The Integrative Human
Microbiome Project (iHMP)
2013-早産、炎症性腸疾患、2型糖尿病を対象
とした疾患コホートを立ち上げ
菌叢解析の研究例
Aymé Spor, Omry Koren & Ruth Ley, Unravelling the effects of the environment and host genotype on the gut microbiome. Nature Reviews
Microbiology 9, 279-290 (April 2011)
• 菌叢の多様性が低い傾向
• Chatelier E. et al, Nature (2013)
肥満
• マーカー遺伝子の同定
• Junjie Qin et al, Nature (2012)
糖尿病
•マーカー菌種の同定
•Zeller G et al, Mol Syst Biol. (2014) •Zackular J et al. Can Prev Res. (2014)
大腸癌
• 肝癌誘発菌種の同定
• Yoshimoto et al. Nature (2013)
肝癌
• 人工甘味料による耐糖能異常 • Suez J. et al., Nature. (2014)
細菌共生バランス失調と疾患
Human microbiomes and their roles in dysbiosis, common diseases, and novel therapeutic approaches.
Belizário JE and Napolitano M, Front Microbiol. 2015 Oct 6;6:1050. 肥満 メタボリック症候群 糖尿病 C. difficile 感染 大腸癌 炎症性腸疾患 精神疾患 アレルギー ニキビ 乾癬 アトピー 外胚葉異形成症 皮膚がん 虫歯 歯周病 歯肉炎 早産 絨毛羊膜炎 慢性絨毛炎症 TORCH症候群 細菌性膣症 性行為感染症 膣カンジダ症
16S rRNA解析 ワークフロー
V3-4領域の配列を利用して、 460 bpのアンプリコンを生成するオリゴプライマーペアを発注 プライマー 合成 V3-4領域を少ないサイクル数で増幅し、 Nextera XTキットでライブラリー調製 96インデックスを利用した場合、1サンプルあたり100,000リードで、 V3-4領域を十分なカバレッジにより精確にシーケンス Greengenesデータベースを利用した分類を行い、 属あるいは種のレベルでグラフィカルに表示 ライブラリー 調製 シーケンス MiSeq データ解析 MSR/ BaseSpaceMiSeqを利用したプロトコール
–
V3-V4領域を含む460 bの領域
をPCR
増幅
– シーケンス条件: 2x250–2x300
– 解析:MSRまたはBaseSpace
応用可能なプロトコール
– ユーザー独自のPCRプライマーが設計
可能なアダプター配列情報
– ユーザー独自のPCRプライマーを用い
る際の Tm値設定 ガイド
16S rRNA解析のための検証済プロトコール
プロトコール(pdf): http://jp.support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/16s/16s-metagenomic-library-prep-guide-http://www.earthmicrobiome.org/emp-standard-protocols/
Earth Microbiome Project 標準プロトコル
• 16S 菌叢解析用のサンプル調製キットは存在しない
• お客様ご自身でオリゴの合成 ~ PCRを実施いただく必要がある
16S rRNA遺伝子のV4領域(254bp)を対象に、32サンプルを1ランで、150塩基ペアエン
ドで解析
Qiime (J G caporaso, J Kuczynski, J stombaugh, et al., 2010) を用いて門(Phylum)のレベル
で分類
32サンプルを1度に同時解析
Dog Owner 1 Owner 2 Soil Human Samples Malawi
We thank Jeeff Gordon for the Malawi human fecal samples and Rob Knight for donation of the family study human/canine host-associated samples from different body sites and soil samples.
イルミナウェビナーシリーズ:
16S rRNA
遺伝子から始める腸内細菌菌叢解析
16S rRNA解析・メタゲノム解析BaseSpaceアプリ
Kraken Metagenomics
メタゲノム系統解析 16S rRNA菌叢解析
データシート:TruSeq PCRフリーDNAサンプル調製キット
– Pub. No. 770-2013-J001 20MAR2013
–
http://jp.illumina.com/content/dam/illumina-marketing/apac/japan/documents/pdf/datasheet_truseq_dna_pcr-free_sample_prep-j.pdf
データシート:Nextera DNAサンプル調製キット
– Pub. No. 770-2011-J021 07DEC11
–
http://jp.illumina.com/content/dam/illumina-marketing/apac/japan/documents/pdf/datasheet_nextera_dna_sample_prep-j.pdf
データシート:TruSeq Custom Amplicon Low Inputライブラリー調製キット
– Pub. No. 770-2015-J012 11DEC2015)
–
http://jp.illumina.com/content/dam/illumina-marketing/apac/japan/documents/pdf/datasheet_tru_seq_custom_amplicon_low_input.pdf
データシート:Nextera メイトペアサンプル調製キット
– Pub. No. 770-2012-J052 05MAR2013
–
http://jp.illumina.com/content/dam/illumina-marketing/apac/japan/documents/pdf/datasheet_nextera_mate_pair_sample_prep-j.pdf
DNAライブラリー調製を詳しく学ぶには
RNA-Seq:キットの選択
Yes No No Yes Yes ストランド 情報に 興味があるTruSeq Stranded Total RNA Ribo-Zero Plant
TruSeq Small RNA Sample Prep Kit TruSeq RNA Sample Prep Kit v2
TruSeq Stranded mRNA Sample Prep Kit
TruSeq Stranded Total RNA Ribo-Zero H/M/R
TruSeq Stranded Total RNA Ribo-Zero Gold
TruSeq Stranded Total RNA Ribo-Zero Globin TruSeq RNA Access Library Prep Kit ncRNAにも 興味がある 植物に 興味がある Small RNAに 興味がある Yes Yes 細胞質だけでなく ミトコンドリアの rRNAも除去したい No Yes FFPEサンプル を使用したい 血液サンプル を使用したい No No Yes
ストランド情報
:
– 2本のDNA鎖のどちらの鎖からRNAが生成
されたのかを示す
ストランド情報の重要性
– 鋳型となる鎖がわかれば、ゲノムに特異的
にマッピングすることができるため、結果
として効率よく配列を読むことができ、サ
ンプルとコストを抑えることかできる
– 遺伝子調節の重要な役割を示すアンチセン
スRNAの発現を検出することが可能
ATPH遺伝子発現(青色)の解析 Total RNAキットで解析した場合、ncRNA の偽遺伝子の発現(赤色)を解析できる ストランド情報も参照すると、反対の向き でこのncRNA偽遺伝子が発現していること がわかるncRNA偽遺伝子が発現
ストランド情報
センスとアンチセンスに分けることで、転写産物の定量が精密に観察できる
オーバーラップした遺伝子上でも、明確な定量が可能
ストランド情報を維持したライブラリー作製原理
1st Strand cDNAの合成 RNA 2nd Strand cDNA合成 の際に dUTP を使用 アダプター付加 1stStrand cDNA High Fidelity PCR酵素を利用することで、 dUTPを使った2ndStrand cDNAは増幅されず、 1stStrand cDNA側からのみ増幅
DNAの
増幅
2nd Strand cDNA 3’RNAライブラリー調製の主な方法
Total RNA
TruSeq mRNA
TruSeq RNA Access
TruSeq Total RNA
クラスター形成、シーケンス
キャプチャー
PolyAを含むmRNA
rRNA除去
TruSeq RNAライブラリー調製の手順
AAAAA NNNNNN NNNNNN A A T T A A T T A A A A T T AAAAA P P P PTotal RNA から poly Aを含む mRNA を回収
RNA の断片化 ランダムプライマーを用いた cDNA 合成 末端修復、リン酸化、Aテイル付加 インデックス付アダプターのライゲーション ビーズによるサイズ選択 PCR
RNAライブラリー調製の主な方法
Total RNA
TruSeq mRNA
TruSeq RNA Access
TruSeq Total RNA
クラスター形成、シーケンス
キャプチャー
PolyAを含むmRNA
rRNA除去
TruSeq Total RNAライブラリー調製の手順
Ribo-ZeroによるリボソームRNAの除去 RNA の断片化 ランダムプライマーを用いた cDNA 合成 dUTPを利用した2本鎖 cDNA 合成 末端修復、リン酸化、Aテイル付加 インデックス付アダプターのライゲーション ビーズによるサイズ選択 PCR B B B B B B B B B B B B B Total RNA リボソームRNA ビオチン標識プローブ ストレプトアビジン ビーズ複数の Ribo-Zero に対応
TruSeq Stranded Total RNA with Ribo-Zero
Ribo-Zero キット
内容
Human/Mouse/Rat
ヒト、マウス、ラットの rRNA除去
(細胞質)
Gold
ヒト、マウス、ラットの rRNA除去
(細胞質 + ミトコンドリア)
Plant
植物の rRNA除去
(細胞質 + 葉緑体)
パラフィンブロックの中には莫大な量の価値ある
データが埋もれている
FFPE由来のRNAは、ホルマリン固定の過程で断片
化されたり化学的に修飾されたりするため、解析
が最も困難なものサンプルのひとつ
FFPE
Fresh/Frozen
FFPEサンプル;トラスクリプトーム解析における大
きな課題
RNAライブラリー調製の主な方法
Total RNA
TruSeq mRNA
TruSeq RNA Access
TruSeq Total RNA
クラスター形成、シーケンス
キャプチャー
PolyAを含むmRNA
rRNA除去
断片化、cDNA合成、アダブター付加
mRNAを網羅できるが、 ncRNAも拾うため、大量の シーケンスデータが必要 RNAの分解が進んでいる 場合、Poly-Aではキャプ チャーできないTruSeq RNA Accessライブラリー調製の手順
RNA の断片化 ランダムプライマーを用いた cDNA 合成 dUTPを利用した2本鎖 cDNA 合成 末端修復、リン酸化、Aテイル付加 インデックス付アダプターのライゲーション PCR ターゲット領域の濃縮 PCRRNAライブラリー調製の違いによるデータ比較
TruSeq Stranded Total RNA – 5億 リード TruSeq Stranded Total RNA 6000万リード TruSeq RNA Access 5000万リード ブローブ領域 RefSeq GenesTruSeq Stranded Total RNA TruSeq RNA Access
コーディング領域(
mRNA
)
TruSeq mRNA
TruSeq RNA Access
TruSeq Total RNA
解析対象RNA種
mRNA mRNA mRNA & ncRNA手法
Poly-Aによる回収 コーディング領域を濃縮 rRNAの除去ストランド情報
No Yes Yes Yes製品名
TruSeq RNAv2
TruSeq Stranded
mRNA TruSeq RNA Access
TruSeq Stranded Total RNA
Total RNA
インプット量
100-1000
ng 100-4000 ng 10-20 ng 100-1000 ng
FFPE対応
No No Yes Yesアッセイ時間
2日間 2日間 2.5日間 2日間ハンズオン時間
12時間 9時間 11時間 8時間トランスクリプトーム解析ワークフロー
ライブラリー調製 シーケンス アライメント 発現量比較
TopHat
Cufflink
サンプルから答えまで、一連の工程をサポート
TruSeq mRNA
TruSeq RNA Access
TruSeq Total RNA
パスウェイ解析
cDNAをシーケンスすることで塩基配列を取得(リード)
リードの塩基配列を参照配列に対してアライメント
アライメントされたリードをカウント
トランスクリプトーム解析の考え方
FKBP8 遺伝子発現
Brain
UHRR
RPS3 遺伝子発現
13,025 リード
8,037 リード
3,115 リード
31,109 リード
Brain
UHRR
RNA-Seq解析のアライメントは、スプライスジャンクションの考慮が必要
RNA-Seq解析のアライメント
リファレンス ゲノム アライメントされたリード エクソン発現量の比較解析をする場合は、サンプル間のデータ量を揃える必要が
ある
→正規化
FPKM(
F
ragments
p
er
k
ilobase of exon per
m
illion mapped sequence reads)
FPKM =
エクソン1kbあたりにマッピングされたリード数
マッピングされた全リードにおける100万リードあたり
FPKM ≒
1細胞あたりおよそ1コピー程度の発現量
RNA-Seq解析の発現量比較
サンプル1;5000万リード サンプル2;6000万リード 遺伝子1 遺伝子2カウントされた遺伝子・トランスリプト 新規転写産物の数について 発現量の違いがみられた遺伝子・トラ ンスクリプトの数 サンプル間の相同性 スキャッタープロット 発現差のある遺伝子 特定遺伝子の表示