• 検索結果がありません。

初めてのRNA-Seq解析/ROSALIND(ONRAMP社)を使用したNGSデータクラウド解析

N/A
N/A
Protected

Academic year: 2021

シェア "初めてのRNA-Seq解析/ROSALIND(ONRAMP社)を使用したNGSデータクラウド解析"

Copied!
42
0
0

読み込み中.... (全文を見る)

全文

(1)

初めてのRNA-Seq解析

~ROSALINDを使用したNGSデータクラウド解析~

フィルジェン株式会社 バイオインフォマティクス部

([email protected])

(2)

RNA-seq解析

次世代シークエンサー(NGS)を使用して、生物学的サンプル中のRNAの存在と量を明らかにする手法 大量のデータの処理が必要 コマンドラインや多くのパラメータ設定など バイオインフォマティクス知識が必要 解析のために 高度なスペックのPCが必要 多くの解析ツール使用すると 時間がかかる はこれらの課題をクリア

(3)

ROSALINDとは

・バイオインフォマティクススキルを使用せずに、 データセットを分析して解釈するために設計された ゲノム解析プラットフォーム ・RNA-Seq解析やChIP-Seq、Small RNA-seq をはじめとしたサービスを展開 BioIT-World 2018で

「People's Choice - Best of Show」賞を受賞

バイオインフォマティクススキルは不要 NGSデータクラウド解析サービス ライフサイエンス業界向けの 革新的な製品ソリューションの中で最高のものを表彰 実験設計から解釈までをパイプライン化 サンプルの情報入力とシークエンスデータの インポートだけでパスウェイ・疾患・GOなど様々な 結果を同時解析! 高スペックPCは不要 解析はクラウド型で高速に計算され一度に様々な データ解釈を得られるので時間も短縮 さらにWeb解析ツールなのでインターネット環境が あればログイン可能 最小限の費用で解析 解析は回数制。必要に応じた解析回数でOK ご自身でのNGS解析や受託解析等と組み合わせることで ユーザーに合わせたデータ解釈を得ることが可能

(4)

解析ワークフロー

Uploding Data

ROSALINDは、サンプルの情報入力と シークエンスデータ(Fastq)のインポートを行うだけで、 簡単にシークエンスデータの生物学的意義を調べることができます。

QC Check

ROSALIND はすべての実験で補完的かつ 視覚的なQCレポートを提供します。 直感的なQCグラフとコンタミネーション検出レポート を使用してサンプルの品質を確認したら、 サンプルあたりの小額の料金を支払って 実験のロックを解除し、分析データの統計処理を開始します。

Differential Expression Analysis

RNA-seqの全経路、疾患およびGene ontologyを用いて、 トランスクリプトーム解釈についてのより深い洞察を得ることができます。 さらに他の同僚、チーム、機関とデータを共有することもできます。

RNA-seq配列データ (Fastq)

(5)

Uploding Data

On EXPERIMNT

実験データについて情報を入力します。 実験名や生物種、 ライブラリー調整に使用したキット名を記入します。

On SAMPLE

個々のサンプルについて情報を入力します。 サンプル名やその属性、グループ分けなど

(6)

Uploding Data

On ANALYSIS

解析条件を入力します。

属性、グループ分けなどの条件より統計解析の際比較する条件設定やファイルのアップロードを実行できます。

(7)

Uploding Data

On EXPERIMNT

実験名と実験内容について入力 解析内容を選択 解析内容:RNA-seqは次世代シークエンサーより出力される生データ(FASTQ)を読み取るか すでに発現値が算出された表を読み込み解析する解析(Processed Counts)が選択できます。 またNanoString社のnCounterのパネル解析より 得られたシークエンスデータ解析も可能です。

(8)

Uploding Data

On EXPERIMNT

生物種とゲノムビルドを選択します。 対応生物種は弊社HPにて紹介しています。 ライブラリー調整に使用した ・キットのメーカー ・製品名 ・製品ロット を入力します。

(9)

Uploding Data

On EXPERIMNT

Replicateの有無 全サンプル数を入力します。 サンプルの属性を選択します。 ※Replicateは反復するデータ数(n数)を意味し 全サンプル中に存在するかの有無を選択します。 control Test n=3 n=3 Replicate 【 Yes 】 処理 年齢 動物モデル バッチ 細胞株 投与量 病期 健康状態 表現型 性別 タイムコース など様々な属性を複数組み合わせることで 次の群分けの項目でスムーズに分けることが できます。

(10)

Uploding Data

On SAMPLE

サンプル名と実験室内でのサンプル名の入力します。 -Sample Name:サンプル名 -Laboratory Identifier:研究室でのサンプル名・番号など Replicateの選択します。 control Test

(11)

Uploding Data

On SAMPLE

1サンプルずつ属性に対しての情報を入力します。 このメタデータは、次に出てくる群分けに不可欠です。 例)control-Test など これまで指定したサンプルデータが表示されます。 データを確認後次のステップに移ります。

(12)

Uploding Data

On ANALYSIS

ドラッグアンドドロップでデータセットを作成します。 前項目で作成した属性を加えることで簡単に群分けができます。 もちろん、サンプルを個々に指定して群分けすることもできます。 比較のためのデータセットを作成します。 作成後次のステップに進みます。

(13)

Uploding Data

On ANALYSIS

データをアップロードします。 FASTQ、GZ、およびGZIPファイルに対応しています。

単純な生物学的な質問に答えることで、解析準備が整います。

クリックしデータを選択することで データのアップロードがスタートします。 シングルエンド・ペアエンドを選択

(14)

解析ワークフロー

Uploding Data

ROSALINDは、サンプルの情報入力と シークエンスデータ(Fastq)のインポートを行うだけで、 簡単にシークエンスデータの生物学的意義を調べることができます。

QC Check

ROSALIND はすべての実験で補完的かつ 視覚的なQCレポートを提供します。 直感的なQCグラフとコンタミネーション検出レポート を使用してサンプルの品質を確認したら、 サンプルあたりの小額の料金を支払って 実験のロックを解除し、分析データの統計処理を開始します。

Differential Expression Analysis

RNA-seqの全経路、疾患およびGene ontologyを用いて、 トランスクリプトーム解釈についてのより深い洞察を得ることができます。 さらに他の同僚、チーム、機関とデータを共有することもできます。

RNA-seq配列データ (Fastq)

(15)

QC Check

インポート時に設定した内容が表示されます。 解析が終了すると登録したメールアドレスに 解析完了のメールが届き ROSALINDのprojectに 作成した実験データを閲覧できるようになります。

(16)

QC Check

サンプル相関ヒートマップ データ行、列にはサンプル間の相関値が含まれ、 最も濃い青が最も強い相関を表します。 上軸の樹状図は、サンプルのクラスタリングを示します。 密接に関連しているサンプル (つまり、同じReplicateグループ内のサンプル) がプロット内で強く相関していること、 および樹状図の最も近い部分であることがわかります。 バイオリンプロット 実験の各サンプルの正規化されていない遺伝子数の対数の分布 を表示するために、ボックスプロットをバイオリンプロットに重ねています。 ボックスプロットは要約統計量のみをグラフ化しますが、 バイオリンプロットはデータの実際の分布を示します。

(17)

QC Check

ゲノム領域 このプロットは、マッピングされたリードが ゲノム全体の遺伝子機能にどのように分布しているかを示しています。 含まれるゲノム領域は以下のとおりです。 ・5 'UTRエクソン(5' UTR) ・遺伝子間領域 ・イントロン ・3 'UTRエクソン(3' UTR) ・タンパク質をコードするエクソン(Coding Exon) MDSプロット 多次元尺度構成法(MDS)プロットは、一組のオブジェクト間の 近接性(すなわち、類似性または距離)のパターンの視覚的表 現です。この場合は、実験内のサンプル間の発現差をプロットします。

(18)

QC Check

ファイルアップロード時に設定したサンプルを 見ることができます。 生データやROSALINDで解析されたデータをサンプルごとにダウンロードできます。 注) Rawファイル(FASTQ / BAM)は 実験が分析を完了した後30日間までダウンロード有効です。

(19)

QC Check

QC情報が確認できます。また、表のエクセルファイルのダウンロードが可能です。 またQCの情報までは料金が発生しないので安心して解析に進むことができます。 確認できるQC情報は以下のとおりです。 ・Reads サンプルに対するリードの合計数。 ・Q30 品質スコアが30以上の塩基の割合。この値はリード長さ全体にわたる平均であり、リードの終わりに向かってエラー率は増加します。 ・Reads Too Short トリミング後に短すぎたために破棄されたリード数の割合。

・Bases Trimmed トリミングによって除去された塩基の数の割合。

・Aligned 参照ゲノムに整列したトリミングされたリードの総数の割合。 ・Duplicates 重複している整列したリードの総数の割合。

ここまで

無料

で解析できます!

(20)

解析ワークフロー

Uploding Data

ROSALINDは、サンプルの情報入力と シークエンスデータ(Fastq)のインポートを行うだけで、 簡単にシークエンスデータの生物学的意義を調べることができます。

QC Check

ROSALIND はすべての実験で補完的かつ 視覚的なQCレポートを提供します。 直感的なQCグラフとコンタミネーション検出レポート を使用してサンプルの品質を確認したら、 サンプルあたりの小額の料金を支払って 実験のロックを解除し、分析データの統計処理を開始します。

Differential Expression Analysis

RNA-seqの全経路、疾患およびGene ontologyを用いて、 トランスクリプトーム解釈についてのより深い洞察を得ることができます。 さらに他の同僚、チーム、機関とデータを共有することもできます。

RNA-seq配列データ (Fastq)

(21)

Differential Expression Analysis

ロックを解除することでより詳細な実験結果を得ることができます。 ロック解除には購入したユニットを使用します。 解除後は正規化データの表の閲覧・Differential Expression 結果の閲覧の選択画面に移ります。 使用可能なユニット数 (この場合28ユニット) 今回の分析で必要なユニット数 (この場合6ユニット必要) 全てのサンプルの正規化された データの閲覧ができます。 発現変動のあった遺伝子について様々な視点から結果を 閲覧することができます。 (比較のため2サンプル以上のデータが必要です。) ロック解除前 ロック解除後

(22)

Differential Expression Analysis

NORMALIZED EXPRESSIONでは 正規化されたすべての遺伝子の表を閲覧することができます。 またカンマ区切りファイルでダウンロードも可能です。 任意の遺伝子を検索できます。 サンプル名 遺伝子情報 最上列をクリックすることで 表の並べ替えができます。

(23)

Differential Expression Analysis

このアイコンより各遺伝子の箱ひげ図を閲覧できます。 Import時に設定した属性もしくは Replicateのグループ間で比較を行うことができます。 箱ひげ図の他、選択した遺伝子に対する各サンプルの 正規化ごの発現量を棒グラフにしたデータを閲覧できます。 pig形式で図を保存できます。

(24)

Differential Expression Analysis

✔Differential Expression 結果では様々な視点からデータの解釈が可能です。

発現変動のあった遺伝子リスト 選択した遺伝子の詳細結果 変動のあった遺伝子の

(25)

Differential Expression Analysis

✔発現変動のあった遺伝子リストでは遺伝子の並べ替えやフィルターによる調節ができます。 GROUP BYより クラスターによる表示に 切り替えることができます。 SORT BYより 並べ替えの条件を変更することができます。 FILTERの⊕より新たなフィルターを作成できます。 フィルターは ・フィルター名 ・上下方調整の数値 ・p-Adjもしくはp-Valueの値 を設定できます。 APPLYをクリック後SAVE&RUN ANALYSISで設定 したフィルターが保存されます。 フィルターは作成後保存され別の解析に使用することもできます。

(26)

Differential Expression Analysis

画面下の表示では簡単な遺伝子の情報が表示されます。

フィルターの条件と

変動のあった遺伝子遺総数 現在選択している遺伝子名 Fold ChangeとP-Adj 現在選択している遺伝子の説明

ボルケーノプロット・MAプロット 選択した遺伝子のプロットが大きく表示されます。 正規化リストと同様に 選択した遺伝子に対して 発現量の棒グラフ、箱ひげ図が表示されます。 PNG、SVGファイルでダウンロードできます。

(27)

Differential Expression Analysis

PNG、SVGファイルでダウンロードできます。 ヒートマップ 選択した遺伝子に該当するレーンが赤く表示されます。 様々なデータベースへのアクセス パスウェイ・Gene ontology・タンパク質など様々な データベースにアクセスできます。 ここでは関連するTop5の結果が表示されます。

(28)

Differential Expression Analysis

パスウェイ解析 様々なデータベースへのアクセス先より パスウェイ解析が実行できます。 現在(19.6)下記のパスウェイ検索が可能です。 ・WikiPathways ・Kegg(アカデミックユーザー限定) ・REACTOME ・BIOCYC 虫メガネアイコンを選択するとより詳細な結果を見ることができます。

(29)

Differential Expression Analysis

任意の経路を選択するとそれに対応する

(30)

Differential Expression Analysis

虫メガネアイコンを選択するとデータベースの外部サイトにアクセスすることができます。 WikiPathways・Keggの場合はROSALIND内で結果を表示することができます。

(31)

Differential Expression Analysis

WikiPathWay・Keggの場合ROSALIND内で表示することが可能です。

発現のUP、DOWNや左側の遺伝子を選択することで遺伝子の強調表示が可能です。

(32)

Differential Expression Analysis

REACTOME

(33)

Differential Expression Analysis

PROTEINS Protein Interactions Interpro PRINTS Prosite SMART Pfam Gene3D OTHER Lipid Maps MSigDB Chromosome Location GENE ONTOLOGY Biological Process、Cellular Component、Molecular Functionについて表示可能

AmiGO 2を使用したGO検索

(34)

Differential Expression Analysis

ROSALINDは

Advaita社のiPathway Guideと連携しています。 iPathway Guideによるデータの閲覧も可能

対応生物種:Homo sapiens、Mus musclus、Rattus norvegicus

様々なデータベースでの一覧より ADVAITA BIOINFORMATICS の選択後虫メガネアイコンを選択 ADVAITA社のページに移行するので アカウントを作成後ログインします。 再度ROSALINDでADVAITAへ アクセスする虫メガネアイコンを選択 するとAdvaita社より共有のメールが 届きます。

(35)

Differential Expression Analysis

accept shareすることで ROSALINDの解析データをiPathway Guideに 表示させることができます。 iPathway Guide 結果画面

(36)

Differential Expression Analysis

パスウェイ検索

(37)

Differential Expression Analysis

病原検索

(38)

データの共有

プロジェクト単位で

(39)

データの共有

共有先のメールアドレスを入力することで

同じ実験結果を共有することができます。

(40)

・バイオインフォマティクススキルを使用せずに、

データ解析の全プロセスを解析することができます。

・高スペックPCなしで解析できます。

・サンプル回数制なので最小限の費用で解析可能

プロジェクトや受託サービスと組み合わせてもご使用できます。

・本日のデモデータは以下より閲覧可能です。

(登録なしで閲覧可能です。)

https://filgen.onramp.bio/explore

弊社HP ROSALIND紹介ページ

(41)

同様な操作性でChIP-Seq・Small RNA-Seq解析が可能です。

利用料金も共通です。

ChIP-Seq ・ヒートマップ、TSSプロットノート、ピーク分布図、FRiPスコアなどの データの視覚化 ・サンプル間のピーク検出比較 ベン図、Binding Heatmap、モチーフ解析、 Gene Ontology term enrichment検索

・ChIP-Seq-Tracksによる柔軟なピークや染色体の表示 Small RNA-Seq ・正規化後の発現解析データの表による表示 ・ヒートマップ、MDSプロット、ボルケーノプロット, 構造図などのデータ視覚化 ・予測される影響を受ける遺伝子の特定 ・検証された影響を受ける遺伝子のレビュー ・病気と薬物の関連性の探索

(42)

お問い合わせ先:フィルジェン株式会社

TEL 052-624-4388 (9:00~17:00)

FAX 052-624-4389

参照

関連したドキュメント

2 つ目の研究目的は、 SGRB の残光のスペクトル解析によってガス – ダスト比を調査し、 LGRB や典型 的な環境との比較検証を行うことで、

Research Institute for Mathematical Sciences, Kyoto University...

解析の教科書にある Lagrange の未定乗数法の証明では,

TRACG は,オリジナルの原子炉過渡解析コード(TRAC)[1]の GE Hitachi Nuclear Energy

しかし , 特性関数 を使った証明には複素解析や Fourier 解析の知識が多少必要となってくるため , ここではより初等的な道 具のみで証明を実行できる Stein の方法

解析モデル平面図 【参考】 修正モデル.. 解析モデル断面図(その2)

(今後の展望 1) 苦情解決の仕組みの活用.

※ CMB 解析や PMF 解析で分類されなかった濃度はその他とした。 CMB