• 検索結果がありません。

遺伝子発現量データを利用した表現型の違いに影響を及ぼす遺伝子セットの検出方法の開発

N/A
N/A
Protected

Academic year: 2021

シェア "遺伝子発現量データを利用した表現型の違いに影響を及ぼす遺伝子セットの検出方法の開発"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-BIO-33 No.7 2013/3/21. 遺伝子発現量データを利用した表現型の違いに影響を及ぼす 遺伝子セットの検出方法の開発 土多隆雄†1 大林武†1 木下賢吾†1†2†3 マイクロアレイ解析では遺伝子単独の発現量変化に対して統計学的仮説検定を行うことで、表現型の違いに影響を及ぼ す遺伝子を検出することが多い.しかし、実際には遺伝子は複数で相互に関わりあいながら機能することから、遺伝子 単独ではなく複数の遺伝子による発現パターン変化にも着目する必要があるといえる.そこで、本研究では複数の遺伝 子による発現パターン変化を検出する手法を新たに開発し、肺がんに関する遺伝子発現量データを用いて先行研究で提 案されている手法との比較解析を行った.その結果、先行研究で提案されている手法では検出されない発現パターン変 化を示す遺伝子ペアを検出することができた.. 1. は じ め に. 2. 解 析 手 法 と 使 用 し た デ ー タ. マイクロアレイ解析では、表現型によって異なる発現を. 2.1 解 析 手 法. する遺伝子を検出するために各々の発現量変化に対して統. 先行研究では、相関係数によって図 1-(i)(ii)のような発現. 計学的仮説検定を行うことが多い.しかし、実際遺伝子は. パターン変化を示す遺伝子ペアをそれぞれ評価式. 複数で機能することから、表現型に影響を与える遺伝子の. S1=|ρ1 + ρ2 − αρ|、S2=|ρ1 − ρ2|(ρ:全サンプルの. 検出には遺伝子単独ではなく複数の遺伝子による発現パタ. 相関係数、ρ1:表現型 1 の相関係数、ρ2:表現型 2 の相関係. ーン変化に着目する必要がある(図 1).. 数、α=1.5)によって検出する.この評価式の値が高い遺 伝子ペアほど発現パターン変化を示す.そして、本研究で 図 1-(iii)を検出する評価式 S3=||ρ 1|−|ρ2||を新たに定 義する.S3 も先行研究と同様に相関係数を用いる. また、これらの評価式は 3 遺伝子以上の発現パターンを 評価することができないため、3 遺伝子以上にも適用でき る評価式 S4 を次のように定義する.. 図 1:遺伝子ペアによる発現パターン変化. n. ∑ (Y − Yˆ ). 2. ∑ (Y − Yˆ ). 2. i. 図 1 のいずれの発現パターンも遺伝子 a もしくは b のどち. S4 =. らか一方にのみ着目すると表現型 1 と表現型 2 で発現量の. i=1 m. i. . 分布に有意な差はないが、遺伝子ペアに着目するとその発. i. i. i=1. 現パターンが表現型によって明らかに異なる.. m:線 形 モ デ ル が 認 め ら れ る. 先行研究では図 1-(i)(ii)のような発現パターン変化を示. 表現型のサンプル数. € n:他方の表現型のサンプル数. す遺伝子ペアの検出を可能にしている[1].しかし、その手 法では図 1-(i)(ii)のような 2 つの表現型の両方に強い相関. 図 2:評価式 S4 による発現パターン変化の検出. がみられる遺伝子ペアしか検出されず、図 1-(iii)のような 片方の表現型でみられる相関関係がもう一方の表現型では. 評価式 S4 は図 2 のように比較する 2 つの表現型のどちら. 失われる発現パターン変化を示す遺伝子ペアは検出されな. かに認められる線形回帰モデル(Y=aX+b)に対し残差平. い.また、先行研究の手法では相関係数を用いているため、. 方和を求め、比をとったものである.図 2 の場合、表現型. その使用は遺伝子ペアに限られ 3 遺伝子以上の発現パター. 2 に回帰モデルが認められるので、そのモデルに対する表. ン変化を評価できない.. 現型 1 の残差平方和を表現型 2 の残差平方和で除算する.. そこで、本研究では先行研究で想定されていない発現パ. 回帰モデルの認定は決定係数から求められる F 値によって. ターン変化を示す遺伝子ペアの検出ならびに 3 遺伝子以上. 行い、有意水準α=0.05 で仮説「回帰係数 a,b がともにゼ. で発現パターン変化の評価を行う.. ロである」が棄却された場合のみ上記線形モデルを認める. どちらの表現型にも回帰モデルが認められる場合、より F 値が小さい表現型を採用し、どちらにも回帰モデルが認め られない場合は S4 の値を 0 とする.. †1 東北大学大学院情報科学研究科 †2 東北大学加齢医学研究所 †3 東北大学東北メディカル・バンク機構. ⓒ2013 Information Processing Society of Japan. 2.2 使 用 し た デ ー タ 解析には日本で癌死亡者数が最も多い肺がんに関するマ. 1.

(2) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-BIO-33 No.7 2013/3/21. イクロアレイデータ(GDS3257:Cigarette Smoking effect. に関わる遺伝子だが、肺がん細胞ではその発現量が減少し. on lung adenocarcinoma)を使用する[2].この発現量デー. ていることや、細気管支肺胞がん細胞では過剰にメチル化. タは 58 のがん細胞サンプル、49 の正常細胞サンプルから. されていることが報告されている.さらに、図中の ASCL1. なり、それをそれぞれ表現型1、表現型2とする.また、. は肺の上皮細胞や神経内分泌細胞の分化に関わる遺伝子で. 解析の対象となる遺伝子は、ベンゾピレンの代謝に関わる. あり、肺がん細胞ではその発現が変化し、肺がんの種類に. 45 遺伝子とヒトの転写因子 1,558 遺伝子のうち、プローブ. よってもその発現パターンが異なることが知られている.. に対応付けられる 1,011 遺伝子である.ベンゾピレンは肺. この遺伝子は評価式 S4 でも検出されている.. がんの形成に関わるとされるタバコの煙に含まれる. 1,011 遺伝子に対応するプローブは 1,680 プローブあり、 1,409,180 プローブペアについて解析する. (同じ遺伝子の プローブペアは解析から除く.). 3. 結 果 3.1 評 価 式 S 1 ,S 2 ,S 3 ,S 4 に よ る 遺 伝 子 ペ ア の 解 析 結 果 各評価式 S1,S2,S3,S4 で検出された代表的な遺伝子ペア をそれぞれ図 3-(i)(ii)(iii)(iv)に示す.. 図 4:評価式 S3 で検出された遺伝子ペアの関係図. 4. 結 論 各評価式による解析の結果、それぞれ想定する発現パタ ーン変化を示す遺伝子ペアが検出された.S1 ではスコアが 高 い 上 位 100 の 遺 伝 子 ペ ア に 含 ま れ る 遺 伝 子 は 全 て Wilcoxon 検定で検出できる遺伝子であったが、S3,S4 では. 図 3:各評価式によって検出された遺伝子ペア. Wilcoxon 検定で検出されない遺伝子を多く検出していた. また、評価式 S4 は原理的には S1,S2,S3 のそれぞれで想定す. 図 3 より、それぞれの評価式で想定している発現パターン. る発現パターン変化を示す遺伝子ペアを検出できるが、今. を示す遺伝子ペアを検出していることがわかる.特に今回. 回解析した発現量データでは S1,S3 で得られる遺伝子ペア. 新たに定義した評価式 S3 で得られた図 3-(iii)の遺伝子ペア. をよく検出していた.さらに、各評価式について得られた. は正常細胞では相関関係がみられるが、がん細胞ではその. 遺伝子ペアの関係図から、多くの遺伝子と関わり発現パタ. 関係が失われていることがわかる.評価式 S4 で得られた図. ーンを変化させる遺伝子が分かった.それらの遺伝子は既. 4-(iv)の遺伝子ペアは正常細胞では相関関係がみられるが、. に肺がんとの関連性を示唆されているものが多かったが、. がん細胞では相関関係が弱くなっており、また、発現量の. ほとんど先行研究がなされていない遺伝子もあった.. 和が大きくなっている.. 最後に、3 遺伝子発現パターンの解析ついては、今後遺. さらに、評価式 S3 についてスコアが高い上位 100 の遺. 伝子ペアでは検出されないものの、この解析によって検出. 伝子ペアの関係図を図 4 に示す.図 4 にて濃い水色で示さ. された遺伝子があるか検討する必要がある.. れている遺伝子は単独の発現量変化についての Wilcoxon. 参考文献. 検定で検出される遺伝子であり、薄い水色で示されている. 1) M.Dettling, et al., Searching for differentially expressed gene combinations, Genome Biology, Vol.6, No.10, pp.R88 (2005) 2) M.Landi, et al., Gene Expression Signature of Cigarette Smoking and Its Role in Lung Adenocarcinoma Development and Survival, PLOS ONE, Vol.3, No.2, pp.e1651 (2008). 遺伝子は評価式 S3 によって検出された遺伝子を示す.図 4 より、HOXA1 は単独の発現量変化についての検定では検 出されないが、多くの遺伝子に関わり発現パターンを変化 させていることがわかる.この遺伝子は胎児や幼生の発生. ⓒ2013 Information Processing Society of Japan. 2.

(3)

参照

関連したドキュメント

今日のお話の本題, 「マウスの遺伝子を操作する」です。まず,外から遺伝子を入れると

第四章では、APNP による OATP2B1 発現抑制における、高分子の関与を示す事を目 的とした。APNP による OATP2B1 発現抑制は OATP2B1 遺伝子の 3’UTR

マーカーによる遺伝子型の矛盾については、プライマーによる特定遺伝子型の選択によって説明す

・逆解析は,GA(遺伝的アルゴリズム)を用い,パラメータは,個体数 20,世 代数 100,交叉確率 0.75,突然変異率は

脱型時期などの違いが強度発現に大きな差を及ぼすと

その産生はアルドステロン合成酵素(酵素遺伝 子CYP11B2)により調節されている.CYP11B2

We have investigated rock magnetic properties and remanent mag- netization directions of samples collected from a lava dome of Tomuro Volcano, an andesitic mid-Pleistocene

 ヒト interleukin 6 (IL-6) 遺伝子のプロモーター領域に 結合する因子として同定されたNF-IL6 (nuclear factor for IL-6 expression) がC/EBP β である.C/EBP