• 検索結果がありません。

rs72635708 ( ERRFI1 )

ドキュメント内 Kyushu University Institutional Repository (ページ 61-72)

第3章 結果

3.4. 転写制御領域の機能多型候補とターゲット遺伝⼦

3.4.3. エンハンサー領域の機能多型候補

3.4.3.1. rs72635708 ( ERRFI1 )

本論⽂によって新たに同定した乾癬関連機能多型候補であるrs72635708は,ERRFI1遺 伝⼦の転写開始点から約 170 kb離れた遠位エンハンサー領域に位置していた.この機 能多型候補は 2つの独⽴したGWASによって報告された乾癬感受性 SNPsと強い連鎖 不平衡の関係にあった(rs417065 [r2 = 0.9832], rs11121129 [r2 = 0.6547]).CAGEによっ て計測された eRNA の発現量に基づくと,rs72635708 が位置するエンハンサー領域

(hg19: chr1: 8,257,762–8,258,040)はとくにhepatocyte,fibroblastおよび様々なepithelial

cellsにおいて⾼い活性を⽰していた(図24).

24eRNAの発現量に基づくrs72635708が位置する ERRFI1遠位エンハンサーの活性

CAGEによって測定されたERRFI1遠位エンハンサー(hg19: chr1: 8,257,762–8,258,040)

の発現量.縦軸に⾼発現する細胞10種を,横軸に“Percentage of Expression”を⽰す.各細 胞種における“Percentage of Expression”とは,解析したすべての細胞において測定された 全発現量(normalized CAGE counts from all cells)に対する発現量の⽐を表している.グ ラフ中の数値はそれぞれの細胞種におけるTPM(Tags Per Million)を⽰す.

機能多型候補 rs72635708 のエンハンサー活性に対する影響を理解するために,

ChromHMM によって定義されたchromatin state データを⽤いて,rs72635708座位周辺

領域のヒト細胞・組織エピゲノム修飾状態を解析した.その結果,肝臓および⽪膚線維

芽細胞を含む多くの組織で⾼いエンハンサー活性が認められたが,種々の⾎液細胞では 認められなかった(図25a).更に,肝細胞由来細胞株のHepG2における様々なタンパ

ク質の ChIP-seq データを解析した結果,このエンハンサー領域にはヒストンアセチル

トランスフェラーゼ p300 や転写因⼦ MAFK,MAFF,および AP-1 複合体を構成する JUNDなど多くのタンパク質の強い結合シグナルが認められた(図25a).機能多型候

補rs72635708は転写因⼦ ARNT,BACH1,FOS,MAFKおよびNFE2の結合モチーフ

内に位置しており(図25b;表14),実際にARNTはK562細胞株,BACH1はH1-hESC およびK562細胞株,FOSはHUVEC,HeLa-S3,K562およびMCF10A細胞株,MAFK はH1-hESC,HeLa-S3,HepG2,IMR-90およびK562細胞株,NFE2はK562細胞株にお いて結合が認められた(表 15)また,GTEx eQTL データを参照すると,rs72635708-C の本数は,Cells - Transformed fibroblastsにおいてERRFI1遺伝⼦の発現量と負の相関を

⽰していた(P = 9.86e-9).Liverにおいては有意な差はみられなかったが(P = 0.16),

rs72635708-Cの本数に依存したERRFI1遺伝⼦発現の減少傾向が認められた(図23, 25c;

補⾜図4).

25:機能多型候補rs72635708のエンハンサー活性に対する影響

a. 機能多型候補rs72635708周辺のエピゲノム修飾状態.上段に6種の細胞株における

H3K4me3,H3K4me1およびH3K27acのChIP-seqシグナル,中段に様々な細胞・組

織におけるChromHMMによって定義されたchromatin state(25-STATE MODEL),

下段にHepG2細胞株における様々なタンパク質のChIP-seqシグナルを⽰す.

b. 機能多型候補rs72635708の周辺配列と転写因⼦Bach1::Mafk,FOSおよびJUNDの 結合モチーフ.

c. LiverおよびCells - Transformed fibroblastsにおける機能多型候補rs72635078の遺伝 型とERRFI1遺伝⼦の発現.横軸にrs72635708の遺伝型とそれぞれのサンプル数を

⽰す.アスタリスク(*)は統計的有意性を⽰す.

Window Position Scale chr1:

LIV.ADLT SKIN.PEN.FRSK.FIB.01 SKIN.PEN.FRSK.KER.02 SKIN.PEN.FRSK.MEL.01 FAT.ADIP.NUC OVRYLNG MUS.SKLT.F MUS.SKLT.M PANC.ISLTTHYM GI.STMC.MUCSPLN GI.S.INT GI.CLN.SIG BLD.CD34.PC BLD.CD4.MPC BLD.CD8.NPC BLD.CD3.CPC BLD.CD3.PPC BLD.MOB.CD34.PC.F BLD.MOB.CD34.PC.M BLD.CD4.NPC BLD.CD19.CPC BLD.CD19.PPC BLD.CD15.PC BLD.CD4.CD25M.TPC BLD.CD14.PC BLD.CD8.MPC

Human Feb. 2009 (GRCh37/hg19) chr1:8,256,001-8,260,000 (4,000 bp)

1 kb hg19

8,257,000 8,258,000 8,259,000

Layered H3K4Me3 150 -0 _ Layered H3K4Me1 50 -0 _ Layered H3K27Ac 100 -0 _

HEPG p300 IgR HEPG MafK IgR HEPG MafF IgR HEPG JunD IgR HEPG Max IgR HEPG MAZ IgR HEPG Mxi1 Std HEPG BHL4 IgR HEPG CBPB IgR HEPG COREST IgR HEPG ARI3 IgR HEPG cJun IgR HEPG CHD2 IgR HEPG BRC1 IgR HEPG SMC3 IgR HEPG RFX5 IgR HEPG Nrf1 IgR HEPG Pol2 IgR HEPG PolS IgR HEPG Rad2 IgR HEPG TBP IgR HEPG USF2 IgR HEPG CEBPZ IgR HEPG IRF3 IgR

Active Enhancer Weak Enhancer Transcription Quiescent ChromHMM 25-STATE MODEL

rs72635708

Foreskin Melanocytes Liver Foreskin Fibroblasts Foreskin Keratinocytes Adipose Nuclei Lung Ovary Skeletal Muscle Female Skeletal Muscle Male Pancreatic IsletsThymus Spleen Stomach Mucosa Small Intestine Sigmoid Colon Hematopoietic stem cells T helper memory cells from peripheral blood T CD8+ naive cells from peripheral blood T cells from cord blood T cells from peripheral blood Hematopoietic stem cells G-CSF-mobilized Female Hematopoietic stem cells G-CSF-mobilized Male T helper naive cells from peripheral blood B cells from peripheral bloodB cells from cord blood Neutrophils from peripheral blood T helper cells from peripheral blood Monocytes from peripheral blood T CD8+ memory cells from peripheral blood

Blood cells

p300 MAFKMAFF JUND MAXMAZ BHLHE40MXI1 CEBPB COREST ARID3A C-JUN CHD2 BRCA1 SMC3 NRF1RFX5 Pol2 Pol2 S2 RAD21 USF2TBP CEBPZ IRF3

HepG2 ChIP-seq

ERRFI1

Cells - Transformed fibroblasts

rs72635708 rs72635708

ERRFI1 Liver

P = 0.16 P = 9.86e-9*

a

b c

WebLogo 3.7.1

TA C G G CA

T G

G

C

GAC

T

CT

G

TC

A

C

G T

AA

C

GT

A

GCTTCAGTGCAGACT

Bach1::Mafk (MA0591.1)

WebLogo 3.7.1 GA

T CA

G

T

T

G A

TCAG

T C A

GC

T

GCT

FOS (MA0476.1)

JUND (MA0491.1)

rs72635708 (T>C)

WebLogo 3.7.1 TA

G CA

G

T G A

T

C

G

T

A

C A

GC

T

TAGC

...GTGCTGAGTCATGCA...

実際に,リスクアリル rs72635708-C のエンハンサー活性に対する影響を調べるため に,ChIP-seqのピークコールデータを⽤いてBACH1,MAFK,FOSおよびJUNDの結 合レベルを解析した.“TGAGTCAT”(⾮リスク型)または“TGAGTCAC”(リスク型)

配列を含むピークをすべて取得し(表16‒19),モチーフ間でシグナル強度を⽐較した

(図26, 27).両⽅のモチーフを含むピークは解析から除外した.その結果,HepG2細

胞株において,⾮リスク型モチーフ“TGAGTCAT”を含むピークと⽐較してリスク型モ チーフ“TGAGTCAC”を含むピークは,BACH1(adjP = 6.73e-5),MAFK(adjP =

3.17e-7,9.32e-15)およびJUND(adjP = 0.0019,3.15e-40)についてシグナル強度が有意に低

かったが,FOSではシグナル強度に有意差は認められなかった(adjP = 0.24).有意差

(adjP < 0.1)が認められたものでは,A549細胞株におけるJUNDの結合レベルを除い て,⾮リスク型モチーフ“TGAGTCAT”を含むピークと⽐較してリスク型モチーフ

“TGAGTCAC”を含むピークは,すべてシグナル強度が低かった.更に,先⾏研究におい て報告されたDNase-seqのallele-specific mappingの結果110を参照すると,rs72635708は 転写因⼦のoccupancyに影響を与えることがすでに報告されていた.

16:⾮リスク型およびリスク型モチーフを含むBACH1 ChIP-seqのピーク数

細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks

A549 (ENCSR043EHG) 1,891 836

ESC_H1 (ENCSR000EBQ) 1,982 1,109

GM12878 (ENCSR585CVE) 344 209

HEPG2 (ENCSR699TNT) 2,734 1,253

K562 (ENCSR000EGD) 1,202 507

K562 (ENCSR740NPG) 1,593 923

17:⾮リスク型およびリスク型モチーフを含むMAFK ChIP-seq のピーク数

細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks

A549 (ENCSR541WQI) 7,101 3,838

ESC_H1 (ENCSR000EBS) 1,951 837

GM12878 (ENCSR000DYV) 151 15

HELA_S3 (ENCSR000ECK) 1,782 915

HEPG2 (ENCSR000EDZ) 3,487 1,411

HEPG2 (ENCSR000EEB) 4,408 1,666

IMR90 (ENCSR000EFH) 7,263 4,093

K562 (ENCSR000EGX) 3,080 1,531

MCF7 (ENCSR555PBN) 988 361

OCILY7 (GSE47784) 1,596 1,025

18:⾮リスク型およびリスク型モチーフを含むFOS ChIP-seq のピーク数

細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks

ENDOTHELIAL_UMBILICAL_VEIN (ENCSR000EVU) 14,250 9,954

GM12878 (ENCSR000EYZ) 13 17

HELA_S3 (ENCSR000EZE) 7,662 5,668

HEPG2 (ENCSR177HDZ) 2,826 2,382

K562 (ENCSR000DKB) 6,393 5,454

K562 (ENCSR000FAI) 3,350 2,728

MCF10A (ENCSR000DON) 18,732 13,689

MCF10A (ENCSR000DOO) 17,653 13,455

MCF10A (ENCSR000DOP) 19,943 15,542

MCF10A (ENCSR000DOT) 19,790 14,795

MV411 (GSE64862) 1,745 1,129

MV411_SHFLT3 (GSE64862) 629 659

19:⾮リスク型およびリスク型モチーフを含むJUND ChIP-seq のピーク数

細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks

A549 (ENCSR000BRF) 3,560 3,685

ESC_H1 (ENCSR000BKP) 1,470 1,499

ESC_H1 (ENCSR000EBZ) 3,018 2,533

GM12878 (ENCSR000DYS) 864 416

GM12878 (ENCSR000EYV) 1,116 356

GP5D (GSE51234) 1,196 1,018

GP5D_SIRAD21 (GSE51234) 1,313 1,341

HCT166 (ENCSR000BSA) 6,938 5,718

HELA_S3 (ENCSR000EDH) 15,449 9,298

HEPG2 (ENCSR000BGK) 5,448 4,968

HEPG2 (ENCSR000EEI) 22,025 12,880

HFOB_DIFF (GSE82295) 353 296

HT29_DSMO (GSE77039) 4,346 2,938

K562 (ENCSR000DJX) 10,371 8,133

K562 (ENCSR000EGN) 8,911 7,882

MCF7 (ENCSR000BSU) 3,404 2,827

26:転写因⼦BACH1およびMAFK

⾮リスク型(TGAGTCAT)・リスク型(TGAGTCAC)モチーフに対する結合レベル 縦軸に細胞種(ID),横軸にChIP-seqのシグナル強度を⽰す.アスタリスクは統計的有 意性を⽰す(adjP < 0.1:*,adjP < 0.01:**,adjP < 0.001:***).

P = 6.73e-5***

P = 0.93

P = 0.93

P = 6.73e-5***

P = 0.50

P = 2.91e-8***

P = 3.49e-25***

P = 0.65

P = 0.16

P = 9.32e-15***

P = 3.17e-7***

P = 9.32e-15***

P = 1.53e-41***

P = 4.88e-6***

P = 6.58e-6***

P = 0.16

27:転写因⼦FOSおよびJUND

⾮リスク型(TGAGTCAT)・リスク型(TGAGTCAC)モチーフに対する結合レベル 縦軸に細胞種(ID),横軸にChIP-seqのシグナル強度を⽰す.アスタリスクは統計的有 意性を⽰す(adjP < 0.1:*,adjP < 0.01:**,adjP < 0.001:***).

機能多型候補 rs72635708 が位置する遠位エンハンサー領域と ERRFI1 遺伝⼦プロモ ーターの機能的相互作⽤を更に検証するために,このエンハンサー領域が⾼い活性を⽰

す肝臓組織と線維芽細胞由来の細胞株 IMR90 の Hi-C データを⽤いて染⾊体のコンタ クトマップを作成した.その結果,rs72635708 が位置する遠位エンハンサー領域と

ERRFI1遺伝⼦プロモーターは同じTAD領域内に存在していた(図28).肝臓組織お

よびIMR90細胞株の両⽅において,rs72635708とERRFI1遺伝⼦が含まれるTADの境

界領域に,インシュレータータンパク質として知られる CTCFの ChIP-seq の突出した シグナルが認められた(図28).

28:機能多型候補rs72635708を含む染⾊体領域のHi-Cコンタクトマップ 上段に肝臓,下段に IMR90細胞株のHi-C コンタクトマップ(10 kb解像度)とCTCF

ChIP-seq シグナルを⽰す.⾚縦線はERRFI1 遺伝⼦のプロモーター領域と機能多型候補

rs72635708の座位を⽰している.⻩⾊および⻘⾊の箱はそれぞれのHi-Cコンタクトマッ

プから定義されたTAD領域を⽰す.

8

0

7,000,000 8,000,000 9,000,000

chr1

TADs DHSs

Genes fwd strand (+) rev strand (-)

H6PD VAMP3

PER3 UTS2 TNFRSF9

ENO1 ERRFI1

PARK7

CA6SLC2A5 RERE

SLC45A1

SLC25A33 SPSB1

CAMTA1

GPR157

TMEM201 SLC2A7

RF00019

RNU1-7P RNU6-304P

RNU1-8P RF00599 RF00019

RPL7P7

AL365194.1 AL357552.1

LINC01714

AL590128.1 AL357552.2

MIR34AHG

AL358876.1 RPL23AP19

ENO1-AS1

AL954705.1

AL139415.1 AL139415.2 AL034417.1 AL096855.1

AL358876.2

LNCTAM34A

RPL7P11

AL928921.1

Z98884.1 AL512330.1 CAMTA1-IT1

Z97987.1

HMGN2P17 AL034417.2RNU6-991P

RF00019

RF00424

RNA5SP40

RN7SL451P

Z98884.2 AL359881.1 AL359881.2 AL359881.3

AL096855.2 AL009183.1

MIR6728 MIR34A

BX323043.1 AL928921.2

AL034417.3 AL034417.4 CAMTA1

TMEM201

15 0

7,000,000 8,000,000 9,000,000

chr1

TADs DHSs

Genes fwd strand (+) rev strand (-) H6PD VAMP3

PER3TNFRSF9UTS2

ENO1 ERRFI1

PARK7

CA6 SLC2A5 RERE

SLC45A1

SLC25A33 SPSB1 CAMTA1

GPR157

TMEM201 SLC2A7

RF00019

RNU1-7P RNU6-304P

RNU1-8P

RF00599 RF00019 RPL7P7

AL365194.1 AL357552.1

LINC01714 AL590128.1

AL357552.2

MIR34AHG AL358876.1 RPL23AP19ENO1-AS1

AL954705.1 AL139415.1

AL139415.2 AL034417.1AL358876.2AL096855.1

LNCTAM34A RPL7P11

AL928921.1 Z98884.1

AL512330.1 CAMTA1-IT1Z97987.1

HMGN2P17 AL034417.2

RNU6-991PRF00019

RF00424

RNA5SP40 RN7SL451P

Z98884.2 AL359881.1 AL359881.2 AL359881.3

AL096855.2 AL009183.1

MIR6728

MIR34A BX323043.1AL928921.2 AL034417.3

AL034417.4 CAMTA1

TMEM201 Window Position

Scale chr1:

Human Dec. 2013 (GRCh38/hg38) chr1:6,800,000-9,600,000 (2,800,001 bp)

1 Mb hg38

7,500,000 8,000,000 8,500,000 9,000,000 9,500,000

CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1

LOC102725193 LOC102725193 LOC102725193

CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 VAMP3

PER3PER3 PER3PER3 PER3UTS2

UTS2 TNFRSF9

PARK7 PARK7 ERRFI1

LINC01714 SLC45A1

RERE RERE LOC102724552RERE

SNORD128

ENO1ENO1 ENO1 MIR6728 ENO1-AS1

CA6 CA6 CA6 SLC2A7CA6

SLC2A5 SLC2A5 SLC2A5 SLC2A5 SLC2A5 GPR157 MIR34AHG

MIR34A LINC01759

H6PD H6PD SPSB1 LOC100506022 LOC100506022

SLC25A33 TMEM201 TMEM201

Liver

IMR90 (Fibroblast)

rs72635708 TADs

TADs

pool foldchg 71.2273 -0 _

IMR90 CTCF IgR 1726

-1 _1 IMR90 CTCF ChIP-seq 1756

Liver CTCF ChIP-seq

ERRFI1 promoter

更に,Hi-Cデータを⽤いてERRFI1遺伝⼦の転写開始点をアンカーとした4C-like plot を作成した結果,肝臓組織およびIMR90細胞株の両⽅において機能多型候補rs72635708 を含む染⾊体領域は⾼いシグナルを⽰していた(図29).

CAMTA1

VAMP3 PER3 PER3PER3 PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE LOC102724552RERE

SNORD128 CAMTA1

VAMP3 PER3 PER3 PER3PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE RERE LOC102724552

SNORD128 CAMTA1

VAMP3 PER3 PER3 PER3PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE RERE LOC102724552

SNORD128 CAMTA1

VAMP3 PER3 PER3 PER3PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE RERE LOC102724552

SNORD128 CAMTA1

VAMP3 PER3 PER3PER3 PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE LOC102724552RERE

SNORD128 CAMTA1

VAMP3 PER3PER3 PER3 PER3PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERERERE LOC102724552

SNORD128 CAMTA1

VAMP3 PER3 PER3 PER3PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE RERE LOC102724552

SNORD128 CAMTA1

VAMP3 PER3PER3 PER3 PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERERERE LOC102724552

SNORD128 CAMTA1

VAMP3 PER3 PER3 PER3PER3 PER3

UTS2

UTS2

TNFRSF9PARK7 PARK7

ERRFI1

LINC01714

SLC45A1RERE RERE RERE LOC102724552

SNORD128

Liver Hi-C signal

anchoring ERRFI1 promoter

IMR90 (Fibroblast) Hi-C signal anchoring ERRFI1 promoter

rs72635708

また,この領域におけるRNAポリメラーゼIIのChIA-PETシグナルに着⽬すると,

K562細胞株においてはERRFI1遺伝⼦プロモーター領域と機能多型候補rs72635708を 含むエンハンサー領域間の相互作⽤は認められなかったが,MCF-7 細胞株においては 強い相互作⽤シグナルが認められた(図30).eRNAおよびmRNA発現量の相関によ って定義されたenhancer–promoter correlationデータと合わせると,ERRFI1遺伝⼦プロ モーター領域と機能多型候補 rs72635708 を含むエンハンサー領域間には強い機能的相 互作⽤が認められた.これらの結果に加えて,CTCFタンパク質の結合領域および結合 モチーフの⽅向を探索したところ,明瞭な TAD構造の境界領域を⾒出した(図 30).

301p36.23領域の機能多型候補rs72635708ERRFI1遺伝⼦の相互作⽤

上段から RefSeq Curated Genes,CAGE データによって定義された enhancer–promoter correlation,K562細胞株におけるRNAポリメラーゼIIのChIA-PET相互作⽤およびシグ ナル(紫⾊),MCF-7細胞株におけるRNAポリメラーゼIIのChIA-PET相互作⽤およ びシグナル(⿊⾊)を⽰す.最下段にCTCFタンパク質の結合モチーフの座位および⽅

向と,推測されるTAD領域を⽰す.⻘縦線で乾癬感受性SNP rs417065,⾚縦線でERRFI1 遺伝⼦のプロモーター領域および機能多型候補rs72635708の座位を⽰す.

Window Position Scale chr1:

MCF7 CTCF Pk 1

Human Feb. 2009 (GRCh37/hg19) chr1:7,950,000-8,500,000 (550,001 bp)

200 kb hg19

8,100,000 8,200,000 8,300,000 8,400,000 TNFRSF9

PARK7 PARK7

ERRFI1 LINC01714 SLC45A1

RERE RERE

RERELOC102724552

K562 Pol2 Sig 1

MCF7 Pol2 Sig 3

MCF7 CTCF Sg 1 149

-1 _ TAD

CTCF binding sites MCF-7 Pol2 ChIA-PET interactions K562 Pol2 ChIA-PET interactions Enhancer-Promoter correlations

rs72635708

(Enhancer Functional Variant) rs417065

(Psoriasis GWAS SNPs) ERRFI1 promoter

K562 Pol2 ChIA-PET signals

MCF-7 Pol2 ChIA-PET signals RefSeq Curated Genes

ドキュメント内 Kyushu University Institutional Repository (ページ 61-72)