QTL解析 iwatawiki

Free

1
21
12
1 year ago
Preview
Full text
(1)R QTL 解析 ュ 2017.11.17 岩田洋佳 本 R ュ 定例 QTL 解析 用い 行う方法 い 明 利用 定 多環境試験 遺伝子型 例 解析 行う 記 ウン : http://www.genenetwork.org/genotypes/SXM.geno 表現型 : http://wheat.pw.usda.gov/ggpages/SxM/phenotypes.html 表現型 様々 ウン ここ yield 収量 ウン 利用 定 こ 品種 Steptoe×Morex ッ doubled haploid 体 全体 t/ha 含 定 利用 R 定 QTL 解析 qtl R い 系統 含 218 布 収量 DH 交配 い 含 得 150 倍加半数 7 染色体 遺伝子型 16 環境 収量 計測さ 単 い ッ GS 予測 ッ ッ ン 定 入力 qtl kernlab ッ 簡単 ウン R 込 ン ッ 用い 可能 あ 準備 ウン こ 形式 作成 定 遺伝子型入力 定 ウン 以 定 削除 入 定 入力 作成 Excel 区 定 28 行目 ウ 手順 ッ 後 え 残 情報 開く 削除 選択 転置 表計算ソ 表計算ソ 行 列 貼付け 初 3行 < 1 <染色体番号 <染色体

(2) 置 Locus 定 定 並 id 測 示 定 作業 示 列 必要 R こ 入力 数 実行 あ 引 行う解析 う 前 あ 保 系統 各行 い 遺伝子型 形式 列 そ 入力 形質 環 系統 id 一致 作成 作業 含 置い 各列 必要 述 必要 こ 表現型 い yield.csv 実行 続 geno.csv ッ 系統 id yield.dat ここ こ qtl こ こ 空白 ここ 準備 あ 用い 写 一括変換 入力 ッ く必要 除く 先頭行 変更 R 作成 い あ 定 以 NA − cM 数 2 行目 そこ CSV 形式 形式 含 あ Chr 1〜150 行 対応 必要 変更 表現型入力 境 い SM### 定 系統 定 順 変更 付け 出力さ 表現型入力 # read phenotype data data <- scan("yield.dat", what = character()) n.env <- as.numeric(data[3]) # get the number of environments n.line <- as.numeric(data[4]) # get the number of lines yield <- matrix(NA, n.line, n.env) # prepare a data matrix for(i in 1:n.env) { # repeat n.env times start <- 4 + (n.line + 1) * (i - 1) + 2 end <- start + n.line - 1 # start of the i-th env data # end of the i-th env data yield[, i] <- as.numeric(data[start:end]) # should convert to numeric } yield <- cbind(1:n.line, yield) # add a data id column colnames(yield) <- c("id", paste("Env", 1:n.env, sep = "")) write.csv(yield, "yield.csv", quote = F, row.names = F) 定 QTL 解析 定 ここ qtlAnalysis.R # add names to columns # output data to a csv file 実行 R qtlAnalysis.R 内容 順 明 QTL 解析 手順 行く require(qtl) # R package for QTL mapping 2 qtl ッ 行う 以 込

(3) 準備 入力 込 # Read an input file cross <- read.cross(format = "csvs", genfile = "geno.csv", phefile = "yield.csv") 実 記 通 認識さ back-cross BC BC 集団 開 plot 関数 B H さ 込 使 こ 連鎖地図 いこ H 実際 直 作業 起因 こ 戻 Excel 表計算 geno_bc.csv 一括置換 染色体 遺伝子 測値 F2 集団 い 直接扱うこ 込 jittermap 関数 種々 こ い 集団 保 あ 込 B geno.csv 用い く DH 集団 ッ 遺伝子型入力 ソ 子 正 qtl こ そこ 雑 入力 置 間 保 全く 小さ 交 遺伝 隙間 く 表現型 さ 表示 # again, read the input file cross <- read.cross(format = "csvs", genfile = "geno_bc.csv", phefile = "yield.csv") # add a small distance between markers at the same position cross <- jittermap(cross) plot.map(cross) # show the linkage map plot.missing(cross) # show missing data plot.pheno(cross) # show a histogram of phenotype. With this command, just id is shown plot.pheno(cross, pheno.col = 2) # show phenotype data in the second column # data from the 1st environment is shown R 描 図 PDF PDF 直接出力 ン 出力さ # output to a pdf file pdf("cross_summary.pdf") # set the name of pdf file plot.map(cross) plot.missing(cross) for(i in 2:nphe(cross)) { plot.pheno(cross, pheno.col = i) } dev.off() # should close the file at the end 3 実行 連鎖地図等

(4) QTL 解析 け 染色体 遺伝子型 確率 等間隔 計算 く pseudo marker 置 ここ 2 cM 間隔 pseudo marker 配置 # calculate the probabilities of genotypes at equal-spaced potisions on the map interval <- 2 # 2 cM intervals cross <- calc.genoprob(cross, step = interval) # preparation for the imputation method. it takes some time cross <- sim.geno(cross, step = interval, n.draws = 1000) 単純 16 環境 qtl ン 計測さ ッ ッ 収量 う いく EM 基 方法 いう関数 補完 用い 16 番目 env.id = 16 ン em く方法 遺伝子型 QTL 遺伝子型 scanone simple interval mapping ン ッ Haley and Knott imp 行う方法 SIM ン SIM 行う 解析 こ 行うこ 回帰 3 R ここ 基 く方法 qtl 試 ここ hk ッ 測 含 行う # determine environment env.id <- 16 # interval mapping with the EM-algorithm out.em <- scanone(cross, pheno.col = env.id + 1, method = "em") plot(out.em) # large QTL are detected on the 2nd and 3rd chromosome # interval mapping with the Haley and Knott regression out.hk <- scanone(cross, pheno.col = env.id + 1, method = "hk") plot(out.hk) # interval mapping with the imputation method out.imp <- scanone(cross, pheno.col = env.id + 1, method = "imp") plot(out.imp) par(mfrow = c(3,1)) # plot 3 figures simultaneously to make comparison plot(out.em, main = "EM-algorithm") plot(out.hk, main = "Haley and Knott regression") plot(out.imp, main = "Imputation method") # difference between methods is quite small par(mfrow = c(1,1)) # reset the number of figures plotted simultaneously to 1 3 方法 配置さ 結果 あ い 3 手法 計算速 ほ 間 違い 出 速い Fig. 1 在 こ QTL 考え hk 用い 解析 こ 計算方法 そこ 行う 4 高密 違う こ 以降 計算 計算 3 手法 中

(5) EM-algorithm 15 lod 10 5 0 1 2 3 4 5 6 7 5 6 7 5 6 7 Chromosome Haley and Knott regression 15 lod 10 5 0 1 2 3 4 Chromosome Imputation method 15 lod 10 5 0 1 2 3 4 Chromosome Fig. 1. 3 異 色体 置 縦軸 手法 手法間 LOD 値 決 違い ほ 見 さ 基 QTL 大 い値 え検 表現型 え こ い QTL う ン ッ いほ そ 情報 LOD 値 SIM 結果 QTL あ い値 横軸 可能性 第 〜7染 高い こ 決 LOD 値 並べ 並び 遺伝子型 関 場所 検出 決 無作 ン い 表示 表示さ 出さ LOD 値 大 QTL 前 び 単純 断さ え検 え 表現型 消失 う 逆 偽物 QTL 5 い値 QTL permutation test QTL 解析 繰 対応関係 撹乱さ 見 並び 偽陽性 起因 え 返 行う 並べ 行う 無作 並 本来 行 検 考え こ

(6) う 基 値 経験的帰無 誤 偽 え こ 5% QTL 複数回 等 求 繰 5% ノ LOD 値 染色体全域 返 い値 例え う確率 い値 行い 1,000 回 例え 布 設 検出 QTL 領域 QTL 解析 毎 布 経験的帰無 布 求 2 記録 LOD 値 い場合 並び う こう 意 求 設 無 得 QTL 設 う 大 QTL こ 例え 5% 全体 LOD 中 無い さ こ こう 場合 Fig. 2 検出さ # show the list of QTL detected by the hk regression summary(out.hk) # perform a permutation test to get a threshold for LOD score to detemine QTL regions operm.hk <- scanone(cross, pheno.col = env.id + 1, method = "hk", n.perm = 1000) # show the threshold obtained from the permtation test summary(operm.hk, alpha = 0.05) # with this threshold, it is expected to detect non-QTL as QTL at the 5% probability # show the QTL result figure with the threshold plot(out.em) abline(h = summary(operm.hk, alpha = 0.05)) # close up one chromosome chr.id <- c(2,3) plot(out.em, chr = chr.id) abline(h = summary(operm.hk, alpha = 0.05)) # show the list of QTL detected with the threshold summary(out.hk, perms = operm.hk, alpha = 0.05) 15 lod 10 5 0 1 2 3 4 5 6 7 Chromosome Fig. 2. 単純 値 LOD 値 ン 線 ッ あ ン 置 SIM 結果 QTL 在 6 線 並べ 考え え検 領域 求 LOD

(7) QTL 検出さ 遺伝子型 変数 QTL 抜 出 回帰 効果 意 誤差 効果 推 行 そ 独立変数 述 い値 比べ そ 大 さ う makeqtl 関数 明変数 従う あ 表現型 2 大 QTL 従属変数 Fig. 3 検出さ く無く 回帰 QTL 検出さ 析 F検 け 置 被 明 こ 結果 い # estimate QTL effects temp <- summary(out.hk, perms = operm.hk, alpha = 0.05) # output the list of significant QTL qtl <- makeqtl(cross, chr = temp$chr, pos = temp$pos, what = "prob") res <- fitqtl(cross, qtl = qtl, get.ests = T, method = "hk") # show the result plot(qtl) # plot the location(s) of QTL summary(res) # summary of fitting significant QTL # QTL effects are not so strong, and the result of F-test for QTL are not significant... Genetic map 0 Q1 Location (cM) 50 Q2 100 150 200 1 2 3 4 6 5 7 Chromosome Fig. 3. 単純 ン ッ ン SIM 検出さ 7 2 QTL

(8) ン ッ ン ッ CIM う 共変量 共変量 CIM 配置 結果 Fig. 4 QTL 目 様 い 共変量 100 回 繰 時間 返 設 用い こ 行 決 必要 い 起こ 捉え い値 並び 置 注目 引 え 10 回 窓 大 解析 QTL こ そ 節約 解析 指 明瞭 え検 設 比べ後者 QTL 並べ ここ 5 前者 込 あ 7 ここ い ここ CIM こ 場所 数 比較 影響 い SIM 図示 composite interval mapping CIM ン 変動 さ そ 行う必要 あ 解像 高いこ 場所以外 置 押さえ込 う 窓 中 SIM い こ 注 QTL 検出さ こ 用 意 繰 行 返 い い 実際 あ # perform the composite interval mapping with the Haley and Knott regression n.covar <- 7 window.size <- 5 outcim.hk <- cim(cross, pheno.col = env.id + 1, method = "hk", n.marcovar = n.covar, window = window.size) # compare the results between SIM and CIM par(mfrow = c(2,1)) plot(out.hk, main = "Simple Interval Mapping") plot(outcim.hk, main = "Composite Interval Mapping") add.cim.covar(outcim.hk, col = "green") par(mfrow = c(1,1)) # The resolution of CIM is much higher than SIM # determine the threshold for QTL detection opermcim.hk <- cim(cross, pheno.col = env.id + 1, method = "hk", n.marcovar = n.covar, window = window.size, n.perm = 10) # With larger number of permutations, you can get a more accurate result. # show the threshold obtained from the permutation test summary(opermcim.hk, alpha = 0.05) # show the list of QTL detected with the threshold summary(outcim.hk, perms = opermcim.hk, alpha = 0.05) # no QTL is significant... 8

(9) Simple Interval Mapping 15 lod 10 5 0 1 2 3 4 5 6 7 6 7 Chromosome lod Composite Interval Mapping 25 20 15 10 5 0 1 2 3 4 5 Chromosome Fig. 4. 単純 ッ CIM 比較 後 ン 単純 ン QTL ン SIM 置 ッ 推 ン QTL 間 検 結果 第 2 第 3 染色体 QTL 間 2 QTL う ここ 時検出 本 色体間 意 場合 並べ ッ ッ 複数 QTL 間 scantwo 関数 意 述 え検 ン 並べ 得 検出さ 9 CIM ン さ 用い 2 行 ン あ 基 索 いう結果 え検 い値 交互作用 い値 く 第2 検出 並び え 決 こ 得 び第 3 染

(10) # scan two QTL interactions (epistasis) out2.hk <- scantwo(cross, pheno.col = env.id + 1, method = "hk") # show the result of the scanning plot(out2.hk) ## perform a permutation test to get a threshold for LOD score to determine epistasis operm2.hk <- scantwo(cross, method="hk", n.perm=100) # show the threshold obtained from the permtation test summary(operm2.hk, alpha = 0.05) # show the list of epistasis detected with the threshold summary(out2.hk, perms = operm2.hk, alpha = 0.05) # one epistasis between the 2nd and 3rd chromosomes is significant R 以 用い い 析 解析 う env.id 設 例え 結果 変化 い 発見 QTL 解析 行 異 いう変数 CIM 際 示 あ 方法 関 環境 2 以外 共変量 明 終わ あ 計測さ 値 結果 解析 数や窓 繰 変化さ 少 う 10 ここ 変更 返 2 番目 う 環境 変化 実行 こ 解析 解 得 行 い

(11) 応用編 1 レポート課題 遺伝子連鎖地図 1. #76 lnL(r) 表 0.3 A い Haldane log 自然対数 遺伝子 r A-C, B-C 間 さい B A-B 間 遺伝子 そ A-B, A-C, B-C 間 求 3. い 書 遺伝子 2. 基 い 尤推 組換え価 量 求 求 地図距離 google 計算 さい 関数 式 基 さい Kosambi 地図距離 組換え価 r 対数尤 例え ン ン単 ln(0.3) 検索 計算 C 順 並 い 考え 妥当 う QTL 解析 4. #58 3cM F2 集団 示 A あ piqq 求 2cM aaBb 遺伝子型 考え 置 B 1cM ここ 値 遺伝子 A, B 間 置 QTL 置 QTL 遺伝子型 個体 i さい さい rAB= 0.029 い 離 QQ, Qq, qq 各地図距離 地図距離 3cM , rAQ=0.020 地図距離 い 確率 piQQ, piQq, 対応 組換え価 用 地図距離 2cM , rBQ=0.010 地 図距離 1cM 5. 問4 個体 i マーカー遺伝子型が aaBb #59 今 い 考え #60 1.2 あ µ=0.0, a=1.0, d=0.5, σ2=0.5 示 QTL 遺伝子型 個体 i 場合 表現型値 yi い 求 QQ, Qq, qq 表現型 yi あ 場合 1.2 確率 さい QTL 解析の実習 6. 16 環境 授業 計測さ 収量 16 番目 行い そ 結果 環境間 比較 収量 環境間 相関関係 Env16 正 値 較 収量 似 16 番目 env.id =16 環境 似 い い環境 類似性 環境間 相関係数 い 大 隔 求 0 い環境 相関 い 環境 決 解析 QTL 解析 3 環境 う こ 近い環境 負 相関 QTL 解析 行い い う 類似性 い う cor(cross$pheno)定 相関 0 環境 う QTL 解析 結果 う 11 関係 あ う 大 そ い 負 結果 比

(12) <提出の仕方> 以 い 方法 電子 構い 本文 PDF 内容 作成 MS−Word 〜 さい 自動 電子 作成 い 理 方法 送 書く 添付 電子 iwata.report@gmail.com 作成 返さ <期限 2016 年 12 添付 23 日 12 送

(13)

Tags

第1回構造解析Doc Recent Site Activity I S English Materials Day2 Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Merge Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Fixedlength Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Varlist Seminar Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Day4 Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Day3 Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Day1 120910 R Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Questionnaire Recent Site Activity 慶應義塾大学パネルデータ解析セミナー Pdf 多変量解析 2017 Aセメ Kengo Kato
Show more