• 検索結果がありません。

基本的な利用法

N/A
N/A
Protected

Academic year: 2021

シェア "基本的な利用法"

Copied!
36
0
0

読み込み中.... (全文を見る)

全文

(1)

2015.04.03版 1

(Rで)塩基配列解析

基本的な利用法 Macintosh版

東京大学・大学院農学生命科学研究科

アグリバイオインフォマティクス教育研究プログラム

門田幸二(かどた こうじ)

kadota@iu.a.u-tokyo.ac.jp

http://www.iu.a.u-tokyo.ac.jp/~kadota/

到達目標:このスライドに書かれている程 度のことは自在にできるようにしてエラー への対処法を身につける。 1. 必要なパッケージのインストールが正し くできているかどうかの自力での判定、お よび個別のパッケージのインストール 2. 作業ディレクトリの変更 3. テキストエディタで自在に入出力ファイ ル名の変更(どんなファイル名のものがど こに生成されるかという全体像の把握) 4. 「ありがちなミス」のところで示しているエ ラーメッセージとその原因をきっちり理解

(2)

前提条件

2 2015.04.03版 インストールができているつ もりでも、実際にはできてい なかったという事例が散見さ れます。パッケージ名のスペ ルミスもよく見受けられます。 いくつかのパッケージについ て適切にインストールされて いるか確認しておきましょう。

(3)

Rの起動

3

2015.04.03版

(4)

基本的な利用法

4

2015.04.03版

(5)

Rの終了

5

2015.04.03版

通常のソフトウェアと同様、左上 の赤丸ボタンを押せばよい。

(6)

Rの終了

6 2015.04.03版 「ワークスペースのイメージファイルを保存し ますか?」というダイアログが出るが、最初の うちは「保存しない」でよい。(間違って「保 存」を押してしまっても.Rapp.historyというドッ トから始まる隠しファイルが作成されるだけ なので特に問題はない。ユーザ名kadotaの 環境では、/Users/kadota/.Rapp.historyにイ メージファイルが自動作成される。尚、隠し ファイルは通常は表示されない。

(7)

(Rで)塩基配列解析

7 2015.04.03版 基本的な塩基配列解析から、NGS データ取得、マッピング、統計解析、 作図などができます。このウェブ ページは、サンプルデータと解析例 を徹底的に充実させています。項目 数が非常に多いですが、慣れです。

(8)

解析基礎1:翻訳配列取得

8 2015.04.03版 塩基配列を入力として、そ の翻訳されたアミノ酸配列 を取得することができます

(9)

9 2015.04.03版

hogeフォルダの作成

デスクトップにあるhogeフォル ダ中のファイルを解析するや り方として説明します

(10)

10 2015.04.03版

ファイルの保存

①解析したいファイル sample1.fastaをhogeフォルダ中 に保存。②勝手に.txtという拡張 子が追加されてしまいますので、 戻しておきましょう。 ① ②

(11)

11 2015.04.03版

ファイルの保存

基本Rで取り扱うので、エ ディタもRのものを利用した ほうが無難です。

(12)

作業ディレクトリの変更

12 2015.04.03版 R起動直後のデフォルトの作業 ディレクトリは、ユーザ名kadota の環境では、「/Users/kadota」で す。その一方で、今解析したい ファイルはデスクトップ上にある hogeなので、作業ディレクトリをそ こに変更する必要があります。 「getwd()」は、現在の作業ディレク トリを表示させるコマンドです。

(13)

作業ディレクトリの変更

13 2015.04.03版 ① ② ③ デスクトップのhogeを指 定して「開く」を押す。

(14)

getwd()と打ち込んで確認

14 2015.04.03版 当たり前ですが、解析したいディレ クトリ(またはフォルダ)を正しく指 定できていなければエラーに遭遇 します。また、解析したいファイル が存在しない状態でもエラーが出 ます。

(15)

実際のhogeフォルダとR操作画面の関係

15

2015.04.03版

ファイル保存前

ファイル保存後

(16)

基本はコピペ

16 2015.04.03版 ①一連のコマンド群をコピーして ②R Console画面上でペースト。 ① ②

(17)

基本はコピペ

17

2015.04.03版

ペースト直後の状態。「リ ターンキー」を押す。

(18)

基本はコピペ

18 2015.04.03版 「リターンキー」を押すとコピ ペしたコードが実行される。 無事実行が終わると、このよ うな画面になる。

(19)

実行結果

19 2015.04.03版 実行前のhogeフォルダ 実行後のhogeフォルダ 出力ファイル名として指定 したhoge1.fastaが生成さ れていることが分かります

(20)

実行結果

20 2015.04.03版 実行前のhogeフォルダ 実行後のhogeフォルダ 「list.files()で表示される結果」と 「実行後のhogeフォルダの中身」 は当然同じです

(21)

実行結果

21 2015.04.03版 入力:塩基配列ファイル(sample1.fasta) 出力:アミノ酸配列ファイル(hoge1.fasta 入力ファイル中の塩基配列は、3 の倍数の12塩基長、ACGTのみ からなるので何のエラーも出ない

(22)

解析基礎2

22 2015.04.03版 目的:アノテーションファイル (annotation.txt)中の第1列目に対して、 リストファイル(genelist1.txt)中の文字 列と一致する行を抜き出して、 hoge1.txtというファイル名で出力したい 入力:アノテーションファイル(annotation.txt) 入力:リストファイル(genelist1.txt) 出力:hoge1.txt

(23)

解析基礎2

23 2015.04.03版 目的:アノテーションファイル (annotation.txt)中の第1列目に対して、 リストファイル(genelist1.txt)中の文字 列と一致する行を抜き出して、 hoge1.txtというファイル名で出力したい

(24)

解析基礎2

24 2015.04.03版 作業ディレクトリは「デスクトッ プ – hoge」。hogeフォルダ中 にannotation.txtとgenelist1.txt が存在するという前提。

(25)

基本はコピペ

25 2015.04.03版 ① ①一連のコマンド群をコピーして ②R Console画面上でペースト。 ③「リターンキー」を押す ②

(26)

基本はコピペ

26 2015.04.03版 「リターンキー」を押すとコピペ したコードが実行される。無事 実行が終わると、このような画 面になる。

(27)

実行結果

27 2015.04.03版 実行前のhogeフォルダ 実行後のhogeフォルダ 「list.files()で表示される結 果」と「実行後のhogeフォル ダの中身」は当然同じです

(28)

実行結果

28 2015.04.03版 実行後のhogeフォルダ outというオブジェクトの中 身をwrite.tableという関数で ファイルに出力しています。 それゆえ、出力ファイル (hoge1.txt)の中身は、Rコン ソール画面中で「out」と打 ち込むことでも見られます。

(29)

色の説明

29

2015.04.03版

Rコード中の色の使い分け について説明します。

(30)

応用

30 2015.04.03版 このサンプルコードは1列 目でキーワード検索する場 合。別のリストファイルを読 み込んで4列目で検索した い場合のやり方を示します。

(31)

解答例

1.

目的のキーワードリストを含むファイルを作成し(例:

list.txt

2.

該当箇所を変更し、Rコンソール画面上でコピペ

31 2015.04.03版 一連の作業手順を記述した スクリプトを1つのファイルと して保存することをお勧め

(32)

ありがちなミス1

32 2015.04.03版 作業ディレクトリの変更を忘 れているため、in_f1で指定し た最初のファイルの読み込み 段階でエラーが出る。つまり、 実際に行ったフォルダ中には annotation.txtというファイル は存在しないということ。

(33)

ありがちなミス2

33 2015.04.03版 必要な入力ファイルが作業 ディレクトリ中に存在しない。 この場合、in_f2で指定した genelist1.txtが存在しないた め、それの読み込み段階でエ ラーが出ている。それゆえ、 その情報を用いているコマン ド部分でエラーが出ている。

(34)

ありがちなミス3

34 2015.04.03版 出力予定のファイル名と同じものをエクセルなど別の プログラムで開いているため、最後のwrite.table関数 のところでエラーが出る。対処法は、出力ファイル名 を変更するか、開いている別のプログラムを閉じる。 これはWindowsの例。Macの場合、Excelで開いてい ようがおかまいなしに上書き保存されてしまうが、他 のアプリケーションで開いている場合にこのようなエ ラーに遭遇する可能性があるため、念のため掲載。

(35)

ありがちなミス4

35 2015.04.03版 実行スクリプトをコピーする際、最後 の行のところで改行を含ませずにR Console画面上でペーストしたため、 最後のコマンドが実行されない(出 力ファイルが生成されない)。これも Windowsの例。Macの場合、コピペ後 にリターンキーを押すのでこのような ミスは犯しにくいが念のため掲載。

(36)

警告メッセージ

36 2015.04.03版 list.txtファイル作成時に、membraneと 打った後に改行を入れた場合(左)と入 れない場合(右)の挙動の違いを把握 し、後学のために警告メッセージの意 味を理解しておくとよい。この場合は結 果には影響していないことがわかる。R は警告メッセージ後の記述内容が比較 的分かりやすいのでよく読むべし。

参照

関連したドキュメント

目的 これから重機を導入して自伐型林業 を始めていく方を対象に、基本的な 重機操作から作業道を開設して行け

C. 

・学校教育法においては、上記の規定を踏まえ、義務教育の目標(第 21 条) 、小学 校の目的(第 29 条)及び目標(第 30 条)

12―1 法第 12 条において準用する定率法第 20 条の 3 及び令第 37 条において 準用する定率法施行令第 61 条の 2 の規定の適用については、定率法基本通達 20 の 3―1、20 の 3―2

項   目  単 位  桁   数  底辺及び垂線長 m 小数点以下3桁 境界辺長 m  小数点以下3桁

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの

市民的その他のあらゆる分野において、他の 者との平等を基礎として全ての人権及び基本

National Ass’n of Fire and Equipment Distributors and Northwest Nexus, Inc., ῕῔῏ F.. Harper’s Magazine Foundation,