忙しい人のための R/Bioconduc
tor の基礎
Kashiwa.R #7 (バイオ実験系ラボ支援回) 横山貴央(東大・新領域・情報生命)
2013/3/19
• 東大院 新領域 情報生命科学専攻 D1
• 研究テーマ:
ホヤのメチローム解析から探る組織特異的メチル化の起源
• 特技は R です
– Tsukuba.R, Tokyo.R, Kashiwa.R などで発表
– 『 R パッケージガイドブック』を共同執筆しました – R の楽しさを伝えるためにやって来ました
自己紹介
2
1. コードを実行する方法を知る
2. コードとその実行結果の保存法を知る 3. 思い通りに行かなかった時の対処法を知
る
これさえ覚えれば R は使える!
「 R マンとの約束だ!」
• R はなるべく最新のバージョンを入れて おこう
http://cran.md.tsukuba.ac.jp/ (筑波大のミラーサイト)
• R の統合開発環境「 RStudio 」もあわせて入れておこう http://www.rstudio.com/
(なぜ Rstudio も入れたほうがいいかは、このあと説明し ます。)
最新版は R-2.15.3
http://cran.md.tsukuba.ac.jp/
Rstudio 配布サイト
http://www.rstudio.com/
Rstudio の起動画面
• テキストエディタのようにコードを書く画面 (S ource) と、実行画面( Console )が分けられてい る
• 作った変数一覧やコマンド履歴が楽に辿れる
• プロットの描画、ヘルプの閲覧、ファイルの一 覧が一つの画面内で行える
Rstudio のよいところ
(参考) RGui
• ">" の右にコマンドを入力する、だけの 使い方をしていませんか?
• コマンド履歴で辿れる数には上限がある
• Source 画面でコードを書き、 Console で実行し よう
• "~.R" という名前で保存すると、 Rstudio で自動で開けるようになる
コードはなるべくファイルに保存しよう
• ヘルプの使い方
• データ型とデータ構造を知る
• 繰り返し処理と条件分岐を理解する
• 関数の作り方、パッケージの使い方を知 る
詳細な Tips
• help.start() というコマンドを実行すると ヘルプ画面が起動される。
• help( 関数名 )
• help(package= パッケージ名 )
• help( データセット名 ) など
ヘルプの使い方を知る
• 数値
• 文字列
• 論理型
データ型とは
• v ector
• list
• matrix ( 行列 )
• data.frame ( 列名のついた行列 )
データ構造とは
• matrix や data.frame の大きさを知りたい ときは→ dim() #dimension の略
データ構造を扱う関数
(参考)行と列の覚えかた
• for
• while
• apply
繰り返し処理
• 関数定義
• Source
• Install.package
関数とパッケージ
18
http://www.bioconductor.org/
Bioconductor とは何か?
• RNA-Seq のマッピング結果を可視化&発 現変動遺伝子を抽出する
Bioconductor でできること
http://g86.dbcls.jp/~wakuteka/?p=382
• 出芽酵母の一番長い遺伝子を調べる
http://qiita.com/items/e9197f8a7b6743107866
Bioconductor でできること
• ゲノムブラウザーを R の plot で再現する
http://qiita.com/items/a99d5fb9f24367f55461
Bioconductor でできること
• 細胞の核をカウントする
Bioconductor でできること
http://d.hatena.ne.jp/Rion778/20091210/1260414280
• 教えてくれそうな人のところに聞きに行 く
• 教えてくれそうな人の Twitter に @ で聞 く
• Google, seekR や Rjpwiki を調べてみる
• sessionInfo() を添えるとよいかも
• 解決策がわかったら、次の人に教えてあ げてください
うまく行かなかった時どうするか
参考資料
• R+Bioconductor を使った NGS 解析 1 限目「 R の基礎」
http://cat.hackingisbelieving.org/lecture/tohoku-u/NGS-R-Bioconductor-1st.html http://togotv.dbcls.jp/20120925.html (講義動画)
• (R で ) マイクロアレイデータ解析 http://www.iu.a.u-tokyo.ac.jp/~kadota/r.html
• (R で ) 塩基配列解析(主に次世代シーケンサーのデータ) http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html
• 統計処理ソフトウェア R についての Tips http://minato.sip21c.org/swtips/R.html