• 検索結果がありません。

総括および展望

ドキュメント内 Kyushu University Institutional Repository (ページ 87-91)

5.1. 本論⽂のまとめ

本論⽂では,乾癬の発症リスクと関連する機能多型を網羅的に探索するパイプラインの 構築を⽬的として設定し,とくに⾮コード領域について“どの多型がどのように遺伝⼦

発現に影響するか”という点について,バイオインフォマティクス的⼿法を⽤いて検討 した.その結果,複数の新規機能多型候補をコード領域および⾮コード領域において同 定し,さらに遠位エンハンサー領域を介したERRFI1遺伝⼦の転写制御モデルとその破 綻が引き起こす乾癬発症リスク上昇との関連について新たな知⾒を提供した.本論⽂を 通して,とくに疾患ゲノミクス研究においては公共データの統合と再解析が⾮常に重要 であることを改めて強調したい.つまり,公共データベースに存在しすでに⼀次解析が なされているデータセットであっても,適切な作業仮説の元,⽬的に沿った⽅法で様々 な種類のデータを統合することで,これまで⾒過ごされてきた知⾒を発掘することが可 能である.現在の⽣命科学,とくにゲノム科学分野はNGSの登場により⾶躍的な進歩 を遂げ,その情報量は指数関数的に増加し続けているが,今後もその傾向が継続するこ とに疑いの余地はない.このような時代においては,情報処理のノウハウを持った研究 者がこれから蓄積され続けていく多様な種類のビッグデータを統合し有効に活⽤する

⼿⽴てを⽰すことにより,新たな疾患ゲノミクス研究の形を創出できるだろう.

5.2. 今後の研究課題

本論⽂で構築したパイプラインは,⾮コードの転写制御領域としてプロモーター領域と エンハンサー領域を機能多型の探索対象とした.しかしながら,それら以外にも制御領 域は存在している.すなわち,サイレンサー領域やインシュレーター領域である.転写 を下⽅制御するサイレンサー領域は,エンハンサー領域と⽐較して同定が困難であるこ とから本論⽂では探索対象から除外したが,ごく最近,ヒトゲノムにおけるサイレンサ ー領域の網羅的同定⼿法に関する報告がなされた 162–165.この⼿法を応⽤することで,

サイレンサー領域における機能多型の網羅的探索が可能になると考えられた.また,イ ンシュレーター領域についても,多型や変異のインシュレーター活性に対する影響を予 測することが困難である等の理由から,本論⽂では探索対象から除外した.しかしなが ら,ごく最近,Akita166やDeepMIRO167といった機械学習を⽤いてDNA配列情報のみか

の置換や⽋失等の変異によって引き起こされる染⾊体⽴体構造の変化を⾼精度に予測 することが可能である.本解析パイプラインにおいてこのプログラムを実装することで,

インシュレーター領域に疾患関連機能多型の候補が⾒つかった場合についても,その影 響を幾らか予測することが可能であると考えられた.以上より,今後は解析パイプライ ンに様々な転写制御領域予測⼿法を実装することで,プロモーター・エンハンサー領域 のみならず,サイレンサー領域やインシュレーター領域といった他の転写制御領域につ いても疾患関連機能多型を探索可能なパイプラインの新規構築を⽬指す.

また,コード領域の機能多型については,アミノ酸配列を変化させその構造・機能に 影響を及ぼすことが予測される多型を本論⽂では探索対象とした.しかしながら,アミ ノ酸配列を変化させないにもかかわらず,遺伝⼦機能の制御機構に有害な影響を与える 多型・変異も多数報告されている.その⼀例が,スプライシング制御配列にみられる体 細胞変異である.コード領域およびイントロン領域にはスプライシング制御配列(スプ ライシングエンハンサー・スプライシングサイレンサー)が含まれており,SR タンパ ク質ファミリーや hnRNP ファミリーをはじめとするスプライシング因⼦群がそれぞれ 特異的なモチーフを認識し,近傍のスプライシングを促進・抑制することがよく知られ ている168.近年のがんゲノムデータ解析によって,がん関連遺伝⼦のコード領域にみら れるアミノ酸配列を変化させない変異(シノニマス変異)の中には,SF2/ASF等のスプ ライシング促進因⼦の結合モチーフを新たに形成したり,hnRNP H2等のスプライシン グ抑制因⼦の結合モチーフを壊したりする変異が存在し,がん関連遺伝⼦の異常なスプ ライシングを誘導することが明らかになっている169.この報告は,体細胞変異のみなら ず,疾患関連多型についてもスプライシング異常を引き起こすシノニマス多型が存在す る可能性を⽰唆している.本論⽂においては,エクソンとイントロンの境界領域のスプ ライス部位については機能多型の探索対象としたが,今後はエクソン深部およびイント ロン深部に位置するスプライシング制御配列についても探索を⾏う必要があると考え られた.

さらに,シノニマス多型・変異はアミノ酸配列を変化させないもののコドンを変化さ

ている.さらに,ヒト細胞を⽤いたtRNAプロファイリング解析によって,細胞種やが ん種によってtRNA の存在量および存在⽐が異なることが明らかになっており 173,174, このことからも,様々な環境下におけるコドンの使⽤頻度の違いが細胞の⽣理的・病理 的機能と密接に関連する可能性が⽰されている.今後,様々な細胞種におけるtRNAプ ロファイリングデータが整備されることで,シノニマス多型のタンパク質翻訳効率に対 する影響の推測が可能となるため,本論⽂で構築したパイプラインでは同定できなかっ た未知の疾患関連多型の発⾒が期待される.

本論⽂では,プロモーターやエンハンサーといった転写制御領域については⾮コード 領域を探索対象としたが,⼀部のエンハンサーはコード領域にも存在する.⾮コード領 域と同様に,アミノ酸をコードするエクソン領域にも機能的な転写因⼦結合配列が存在 することが明らかになっており 175,そのような領域は近傍遺伝⼦の発現を制御するこ とが報告されている176–178.そのようなエンハンサーはExonic enhancerもしくはeExon と呼ばれる179.また,第⼀エクソンには多くの転写因⼦が結合し,プロモーター活性を 制御している.つまり,シノニマス多型・変異の中には,エクソンにおける転写因⼦の 結合レベルに影響を与えるものがあると予想される.しかしながら,Variant Effect

PredictorやAnnoVar180といった既存のバリアントアノテーションツールの多くは,基本

的にコード領域の多型・変異についてはアミノ酸配列に対する影響しか評価できないた め,そのような多型・変異を検出することができない.そのため,エクソン内に存在す る転写制御領域の活性に影響を与える多型および変異を検出できるプログラムの開発 が今後の課題である.また,これまでエクソン内に位置する転写制御エレメントについ てはプロモーターやエンハンサーのみが注⽬されてきたが,サイレンサーやインシュレ ーターといったその他の制御エレメントもエクソン内に存在していることは容易に想 像できる.これらについても探索可能なプログラムの新規構築が求められる.

さらに,エクソンはアミノ酸配列をコードしない⾮翻訳領域(UTR)を含んでいる.

本論⽂では機能多型の探索対象外としたが,UTR においても有害な多型・変異の存在 が認められている.3´末端⾮翻訳領域(3´ UTR)にはmiRNAが結合することでmRNA の分解もしくはタンパク質への翻訳抑制が誘導されるため 181,182,多型や変異のため

miRNAによる配列の認識が⾏われないと,最終タンパク質量が変化してしまう.また,

5´末端⾮翻訳領域(5´ UTR)にはリボソームを mRNAにリクルートする内部リボソー

ム進⼊部位(Internal Ribosome Entry Site: IRES)が存在しているため183,多型や変異に よって翻訳効率の低下もしくは上昇が引き起こされる可能性がある.UTR における有 害な多型および変異を検出するプログラムはすでに報告されているため 184–186,それら を本パイプラインに実装することが今後の課題である.

これまで述べたように,ヒトゲノムには様々な種類の機能多型が存在する.それらを

⼀挙に検索し,疾患関連多型との連鎖不平衡を考慮した上で,疾患発症リスクへの関与 を総合的に評価するツールはいまだ報告されていない.今後の研究では,すべてのタイ プの疾患関連機能多型を網羅的に探索できる解析パイプラインを新たに構築し,さらに ソフトウェアとして配布しすべての研究者が利⽤できるようにすることで,それぞれが 興味のある遺伝性疾患について機能多型を簡便に検索できる環境の構築・提供を⽬指す.

ドキュメント内 Kyushu University Institutional Repository (ページ 87-91)