• 検索結果がありません。

カバレッジの統計をグラフを描いて眺めるこ とができる

できるようになること

1. カバレッジの統計をグラフを描いて眺めるこ

awk '($1=="chr3L"){print $2"\t"$4}' all_pileup.txt >

chr3L_pileup_r.txt &&

awk '($1=="chr2R"){print $2"\t"$4}' all_pileup.txt >

chr2R_pileup_r.txt &&

awk '($1=="chr3R"){print $2"\t"$4}' all_pileup.txt >

chr3R_pileup_r.txt &&

awk '($1=="chr4"){print $2"\t"$4}' all_pileup.txt >

chr4_pileup_r.txt &&

awk '($1=="chrX"){print $2"\t"$4}' all_pileup.txt >

chrX_pileup_r.txt &&

awk '($1=="chrMT"){print $2"\t"$4}' all_pileup.txt >

chrMT_pileup_r.txt

これをRに読み込ませてグラフを描くだけである。

chr3R_pileup_r.txt は1列目がポジション、2列目がカバ

レッジになっているので、前のセクションと同様にヘッダー をつけてRが読み込めるようにする。今回は、pos と count と つけた。あとは

plot(pos,count,pch=20,col=ifelse(count < 1, "red", "black")) とすれば描ける。

同様にしてすべての染色体について行った結果がこれだ。

MTはミトコンドリアで、カバレッジが高いように見えるのは 極端に高いのがないためにグラフの縦軸が小さいのだ。

chr length Zero 0rate Cov. Max

chr3L 24543557 9480442 0.3862701 1.393538 33323

chrX 22422827 9185534 0.4096510 1.298916 5129

chrMT 19517 4297 0.2201670 13.291797 91

chr2L 23011544 9162103 0.3981525 1.257954 1650 chr2R 21146708 7369697 0.3485033 1.475968 613 chr3R 27905053 10216401 0.3661129 1.243935 509

chr4 1351857 776293 0.5742420 1.609679 629

簡単な統計も取ってみた。0rate というのはカバレッジが0 だったものの数を染色体の長さで割ったものである。ミトコ ンドリアで0率が低いことがわかる。ただし、ミトコンドリ アは平均カバレッジが13倍なのでこれによる可能性もある。

平均カバレッジのゲノムvs ミトコンドリアの比較によって、

1ゲノムあたりのミトコンドリアゲノム数、すなわち一細胞 あたりのミトコンドリア数が10個弱であることも推定され

る。chr3Lに非常にカバレッジの高い部位があった。

 このデータはハエのkc167セルラインのものである。昆虫の セルラインが樹立される過程で染色体の異数化が起こること が知られている。また、ほ乳類のセルラインではテロメア伸 長酵素が発現していることが知られているが、昆虫細胞の場 合はというと、発現していないことが明らかになっている。

逆に、正常に発生した個体の全身のさまざまな場所でテロメ ア伸長酵素と考えられる遺伝子が発現している。そもそも、

ハエのテロメアはトランスポゾンをsmall RNAで制御するこ とで伸長しており、テロメア伸長酵素は必要ない。昆虫セル ラインでテロメア伸長は起きているのか調べたくてこれを やった。結果は、特定の部位のコピー数変異を見つけてい る。これらの部位は反復配列ではなかった。

チャプタ 3

その他の問題 と対処

bcl 変換とデマルチプレックス

クオリティチェック&コントロール

記憶媒体のフォーマット

できるようになること