第3章 結果
3.4. 転写制御領域の機能多型候補とターゲット遺伝⼦
3.4.3. エンハンサー領域の機能多型候補
3.4.3.1. rs72635708 ( ERRFI1 )
本論⽂によって新たに同定した乾癬関連機能多型候補であるrs72635708は,ERRFI1遺 伝⼦の転写開始点から約 170 kb離れた遠位エンハンサー領域に位置していた.この機 能多型候補は 2つの独⽴したGWASによって報告された乾癬感受性 SNPsと強い連鎖 不平衡の関係にあった(rs417065 [r2 = 0.9832], rs11121129 [r2 = 0.6547]).CAGEによっ て計測された eRNA の発現量に基づくと,rs72635708 が位置するエンハンサー領域
(hg19: chr1: 8,257,762–8,258,040)はとくにhepatocyte,fibroblastおよび様々なepithelial
cellsにおいて⾼い活性を⽰していた(図24).
図24:eRNAの発現量に基づくrs72635708が位置する ERRFI1遠位エンハンサーの活性
CAGEによって測定されたERRFI1遠位エンハンサー(hg19: chr1: 8,257,762–8,258,040)
の発現量.縦軸に⾼発現する細胞10種を,横軸に“Percentage of Expression”を⽰す.各細 胞種における“Percentage of Expression”とは,解析したすべての細胞において測定された 全発現量(normalized CAGE counts from all cells)に対する発現量の⽐を表している.グ ラフ中の数値はそれぞれの細胞種におけるTPM(Tags Per Million)を⽰す.
機能多型候補 rs72635708 のエンハンサー活性に対する影響を理解するために,
ChromHMM によって定義されたchromatin state データを⽤いて,rs72635708座位周辺
領域のヒト細胞・組織エピゲノム修飾状態を解析した.その結果,肝臓および⽪膚線維
芽細胞を含む多くの組織で⾼いエンハンサー活性が認められたが,種々の⾎液細胞では 認められなかった(図25a).更に,肝細胞由来細胞株のHepG2における様々なタンパ
ク質の ChIP-seq データを解析した結果,このエンハンサー領域にはヒストンアセチル
トランスフェラーゼ p300 や転写因⼦ MAFK,MAFF,および AP-1 複合体を構成する JUNDなど多くのタンパク質の強い結合シグナルが認められた(図25a).機能多型候
補rs72635708は転写因⼦ ARNT,BACH1,FOS,MAFKおよびNFE2の結合モチーフ
内に位置しており(図25b;表14),実際にARNTはK562細胞株,BACH1はH1-hESC およびK562細胞株,FOSはHUVEC,HeLa-S3,K562およびMCF10A細胞株,MAFK はH1-hESC,HeLa-S3,HepG2,IMR-90およびK562細胞株,NFE2はK562細胞株にお いて結合が認められた(表 15)また,GTEx eQTL データを参照すると,rs72635708-C の本数は,Cells - Transformed fibroblastsにおいてERRFI1遺伝⼦の発現量と負の相関を
⽰していた(P = 9.86e-9).Liverにおいては有意な差はみられなかったが(P = 0.16),
rs72635708-Cの本数に依存したERRFI1遺伝⼦発現の減少傾向が認められた(図23, 25c;
補⾜図4).
図25:機能多型候補rs72635708のエンハンサー活性に対する影響
a. 機能多型候補rs72635708周辺のエピゲノム修飾状態.上段に6種の細胞株における
H3K4me3,H3K4me1およびH3K27acのChIP-seqシグナル,中段に様々な細胞・組
織におけるChromHMMによって定義されたchromatin state(25-STATE MODEL),
下段にHepG2細胞株における様々なタンパク質のChIP-seqシグナルを⽰す.
b. 機能多型候補rs72635708の周辺配列と転写因⼦Bach1::Mafk,FOSおよびJUNDの 結合モチーフ.
c. LiverおよびCells - Transformed fibroblastsにおける機能多型候補rs72635078の遺伝 型とERRFI1遺伝⼦の発現.横軸にrs72635708の遺伝型とそれぞれのサンプル数を
⽰す.アスタリスク(*)は統計的有意性を⽰す.
Window Position Scale chr1:
LIV.ADLT SKIN.PEN.FRSK.FIB.01 SKIN.PEN.FRSK.KER.02 SKIN.PEN.FRSK.MEL.01 FAT.ADIP.NUC OVRYLNG MUS.SKLT.F MUS.SKLT.M PANC.ISLTTHYM GI.STMC.MUCSPLN GI.S.INT GI.CLN.SIG BLD.CD34.PC BLD.CD4.MPC BLD.CD8.NPC BLD.CD3.CPC BLD.CD3.PPC BLD.MOB.CD34.PC.F BLD.MOB.CD34.PC.M BLD.CD4.NPC BLD.CD19.CPC BLD.CD19.PPC BLD.CD15.PC BLD.CD4.CD25M.TPC BLD.CD14.PC BLD.CD8.MPC
Human Feb. 2009 (GRCh37/hg19) chr1:8,256,001-8,260,000 (4,000 bp)
1 kb hg19
8,257,000 8,258,000 8,259,000
Layered H3K4Me3 150 -0 _ Layered H3K4Me1 50 -0 _ Layered H3K27Ac 100 -0 _
HEPG p300 IgR HEPG MafK IgR HEPG MafF IgR HEPG JunD IgR HEPG Max IgR HEPG MAZ IgR HEPG Mxi1 Std HEPG BHL4 IgR HEPG CBPB IgR HEPG COREST IgR HEPG ARI3 IgR HEPG cJun IgR HEPG CHD2 IgR HEPG BRC1 IgR HEPG SMC3 IgR HEPG RFX5 IgR HEPG Nrf1 IgR HEPG Pol2 IgR HEPG PolS IgR HEPG Rad2 IgR HEPG TBP IgR HEPG USF2 IgR HEPG CEBPZ IgR HEPG IRF3 IgR
Active Enhancer Weak Enhancer Transcription Quiescent ChromHMM 25-STATE MODEL
rs72635708
Foreskin Melanocytes Liver Foreskin Fibroblasts Foreskin Keratinocytes Adipose Nuclei Lung Ovary Skeletal Muscle Female Skeletal Muscle Male Pancreatic IsletsThymus Spleen Stomach Mucosa Small Intestine Sigmoid Colon Hematopoietic stem cells T helper memory cells from peripheral blood T CD8+ naive cells from peripheral blood T cells from cord blood T cells from peripheral blood Hematopoietic stem cells G-CSF-mobilized Female Hematopoietic stem cells G-CSF-mobilized Male T helper naive cells from peripheral blood B cells from peripheral bloodB cells from cord blood Neutrophils from peripheral blood T helper cells from peripheral blood Monocytes from peripheral blood T CD8+ memory cells from peripheral blood
Blood cells
p300 MAFKMAFF JUND MAXMAZ BHLHE40MXI1 CEBPB COREST ARID3A C-JUN CHD2 BRCA1 SMC3 NRF1RFX5 Pol2 Pol2 S2 RAD21 USF2TBP CEBPZ IRF3
HepG2 ChIP-seq
ERRFI1
Cells - Transformed fibroblasts
rs72635708 rs72635708
ERRFI1 Liver
P = 0.16 P = 9.86e-9*
a
b c
WebLogo 3.7.1
TA C G G CA
T G
GC
GACT
CTG
TCA
CG T
AAC
GTA
GCTTCAGTGCAGACTBach1::Mafk (MA0591.1)
WebLogo 3.7.1 GA
T CA
G
T
TG A
TCAGT C A
GCT
GCTFOS (MA0476.1)
JUND (MA0491.1)
rs72635708 (T>C)
WebLogo 3.7.1 TA
G CA
G
T G A
TC
GT
AC A
GCT
TAGC...GTGCTGAGTCATGCA...
実際に,リスクアリル rs72635708-C のエンハンサー活性に対する影響を調べるため に,ChIP-seqのピークコールデータを⽤いてBACH1,MAFK,FOSおよびJUNDの結 合レベルを解析した.“TGAGTCAT”(⾮リスク型)または“TGAGTCAC”(リスク型)
配列を含むピークをすべて取得し(表16‒19),モチーフ間でシグナル強度を⽐較した
(図26, 27).両⽅のモチーフを含むピークは解析から除外した.その結果,HepG2細
胞株において,⾮リスク型モチーフ“TGAGTCAT”を含むピークと⽐較してリスク型モ チーフ“TGAGTCAC”を含むピークは,BACH1(adjP = 6.73e-5),MAFK(adjP =
3.17e-7,9.32e-15)およびJUND(adjP = 0.0019,3.15e-40)についてシグナル強度が有意に低
かったが,FOSではシグナル強度に有意差は認められなかった(adjP = 0.24).有意差
(adjP < 0.1)が認められたものでは,A549細胞株におけるJUNDの結合レベルを除い て,⾮リスク型モチーフ“TGAGTCAT”を含むピークと⽐較してリスク型モチーフ
“TGAGTCAC”を含むピークは,すべてシグナル強度が低かった.更に,先⾏研究におい て報告されたDNase-seqのallele-specific mappingの結果110を参照すると,rs72635708は 転写因⼦のoccupancyに影響を与えることがすでに報告されていた.
表16:⾮リスク型およびリスク型モチーフを含むBACH1 ChIP-seqのピーク数
細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks
A549 (ENCSR043EHG) 1,891 836
ESC_H1 (ENCSR000EBQ) 1,982 1,109
GM12878 (ENCSR585CVE) 344 209
HEPG2 (ENCSR699TNT) 2,734 1,253
K562 (ENCSR000EGD) 1,202 507
K562 (ENCSR740NPG) 1,593 923
表17:⾮リスク型およびリスク型モチーフを含むMAFK ChIP-seq のピーク数
細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks
A549 (ENCSR541WQI) 7,101 3,838
ESC_H1 (ENCSR000EBS) 1,951 837
GM12878 (ENCSR000DYV) 151 15
HELA_S3 (ENCSR000ECK) 1,782 915
HEPG2 (ENCSR000EDZ) 3,487 1,411
HEPG2 (ENCSR000EEB) 4,408 1,666
IMR90 (ENCSR000EFH) 7,263 4,093
K562 (ENCSR000EGX) 3,080 1,531
MCF7 (ENCSR555PBN) 988 361
OCILY7 (GSE47784) 1,596 1,025
表18:⾮リスク型およびリスク型モチーフを含むFOS ChIP-seq のピーク数
細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks
ENDOTHELIAL_UMBILICAL_VEIN (ENCSR000EVU) 14,250 9,954
GM12878 (ENCSR000EYZ) 13 17
HELA_S3 (ENCSR000EZE) 7,662 5,668
HEPG2 (ENCSR177HDZ) 2,826 2,382
K562 (ENCSR000DKB) 6,393 5,454
K562 (ENCSR000FAI) 3,350 2,728
MCF10A (ENCSR000DON) 18,732 13,689
MCF10A (ENCSR000DOO) 17,653 13,455
MCF10A (ENCSR000DOP) 19,943 15,542
MCF10A (ENCSR000DOT) 19,790 14,795
MV411 (GSE64862) 1,745 1,129
MV411_SHFLT3 (GSE64862) 629 659
表19:⾮リスク型およびリスク型モチーフを含むJUND ChIP-seq のピーク数
細胞(ID) # of TGAGTCAT peaks # of TGAGTCAC peaks
A549 (ENCSR000BRF) 3,560 3,685
ESC_H1 (ENCSR000BKP) 1,470 1,499
ESC_H1 (ENCSR000EBZ) 3,018 2,533
GM12878 (ENCSR000DYS) 864 416
GM12878 (ENCSR000EYV) 1,116 356
GP5D (GSE51234) 1,196 1,018
GP5D_SIRAD21 (GSE51234) 1,313 1,341
HCT166 (ENCSR000BSA) 6,938 5,718
HELA_S3 (ENCSR000EDH) 15,449 9,298
HEPG2 (ENCSR000BGK) 5,448 4,968
HEPG2 (ENCSR000EEI) 22,025 12,880
HFOB_DIFF (GSE82295) 353 296
HT29_DSMO (GSE77039) 4,346 2,938
K562 (ENCSR000DJX) 10,371 8,133
K562 (ENCSR000EGN) 8,911 7,882
MCF7 (ENCSR000BSU) 3,404 2,827
図26:転写因⼦BACH1およびMAFKの
⾮リスク型(TGAGTCAT)・リスク型(TGAGTCAC)モチーフに対する結合レベル 縦軸に細胞種(ID),横軸にChIP-seqのシグナル強度を⽰す.アスタリスクは統計的有 意性を⽰す(adjP < 0.1:*,adjP < 0.01:**,adjP < 0.001:***).
P = 6.73e-5***
P = 0.93
P = 0.93
P = 6.73e-5***
P = 0.50
P = 2.91e-8***
P = 3.49e-25***
P = 0.65
P = 0.16
P = 9.32e-15***
P = 3.17e-7***
P = 9.32e-15***
P = 1.53e-41***
P = 4.88e-6***
P = 6.58e-6***
P = 0.16
図27:転写因⼦FOSおよびJUNDの
⾮リスク型(TGAGTCAT)・リスク型(TGAGTCAC)モチーフに対する結合レベル 縦軸に細胞種(ID),横軸にChIP-seqのシグナル強度を⽰す.アスタリスクは統計的有 意性を⽰す(adjP < 0.1:*,adjP < 0.01:**,adjP < 0.001:***).
機能多型候補 rs72635708 が位置する遠位エンハンサー領域と ERRFI1 遺伝⼦プロモ ーターの機能的相互作⽤を更に検証するために,このエンハンサー領域が⾼い活性を⽰
す肝臓組織と線維芽細胞由来の細胞株 IMR90 の Hi-C データを⽤いて染⾊体のコンタ クトマップを作成した.その結果,rs72635708 が位置する遠位エンハンサー領域と
ERRFI1遺伝⼦プロモーターは同じTAD領域内に存在していた(図28).肝臓組織お
よびIMR90細胞株の両⽅において,rs72635708とERRFI1遺伝⼦が含まれるTADの境
界領域に,インシュレータータンパク質として知られる CTCFの ChIP-seq の突出した シグナルが認められた(図28).
図28:機能多型候補rs72635708を含む染⾊体領域のHi-Cコンタクトマップ 上段に肝臓,下段に IMR90細胞株のHi-C コンタクトマップ(10 kb解像度)とCTCF
ChIP-seq シグナルを⽰す.⾚縦線はERRFI1 遺伝⼦のプロモーター領域と機能多型候補
rs72635708の座位を⽰している.⻩⾊および⻘⾊の箱はそれぞれのHi-Cコンタクトマッ
プから定義されたTAD領域を⽰す.
8
0
7,000,000 8,000,000 9,000,000
chr1
TADs DHSs
Genes fwd strand (+) rev strand (-)
H6PD VAMP3
PER3 UTS2 TNFRSF9
ENO1 ERRFI1
PARK7
CA6SLC2A5 RERE
SLC45A1
SLC25A33 SPSB1
CAMTA1
GPR157
TMEM201 SLC2A7
RF00019
RNU1-7P RNU6-304P
RNU1-8P RF00599 RF00019
RPL7P7
AL365194.1 AL357552.1
LINC01714
AL590128.1 AL357552.2
MIR34AHG
AL358876.1 RPL23AP19
ENO1-AS1
AL954705.1
AL139415.1 AL139415.2 AL034417.1 AL096855.1
AL358876.2
LNCTAM34A
RPL7P11
AL928921.1
Z98884.1 AL512330.1 CAMTA1-IT1
Z97987.1
HMGN2P17 AL034417.2RNU6-991P
RF00019
RF00424
RNA5SP40
RN7SL451P
Z98884.2 AL359881.1 AL359881.2 AL359881.3
AL096855.2 AL009183.1
MIR6728 MIR34A
BX323043.1 AL928921.2
AL034417.3 AL034417.4 CAMTA1
TMEM201
15 0
7,000,000 8,000,000 9,000,000
chr1
TADs DHSs
Genes fwd strand (+) rev strand (-) H6PD VAMP3
PER3TNFRSF9UTS2
ENO1 ERRFI1
PARK7
CA6 SLC2A5 RERE
SLC45A1
SLC25A33 SPSB1 CAMTA1
GPR157
TMEM201 SLC2A7
RF00019
RNU1-7P RNU6-304P
RNU1-8P
RF00599 RF00019 RPL7P7
AL365194.1 AL357552.1
LINC01714 AL590128.1
AL357552.2
MIR34AHG AL358876.1 RPL23AP19ENO1-AS1
AL954705.1 AL139415.1
AL139415.2 AL034417.1AL358876.2AL096855.1
LNCTAM34A RPL7P11
AL928921.1 Z98884.1
AL512330.1 CAMTA1-IT1Z97987.1
HMGN2P17 AL034417.2
RNU6-991PRF00019
RF00424
RNA5SP40 RN7SL451P
Z98884.2 AL359881.1 AL359881.2 AL359881.3
AL096855.2 AL009183.1
MIR6728
MIR34A BX323043.1AL928921.2 AL034417.3
AL034417.4 CAMTA1
TMEM201 Window Position
Scale chr1:
Human Dec. 2013 (GRCh38/hg38) chr1:6,800,000-9,600,000 (2,800,001 bp)
1 Mb hg38
7,500,000 8,000,000 8,500,000 9,000,000 9,500,000
CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1
LOC102725193 LOC102725193 LOC102725193
CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 CAMTA1 VAMP3
PER3PER3 PER3PER3 PER3UTS2
UTS2 TNFRSF9
PARK7 PARK7 ERRFI1
LINC01714 SLC45A1
RERE RERE LOC102724552RERE
SNORD128
ENO1ENO1 ENO1 MIR6728 ENO1-AS1
CA6 CA6 CA6 SLC2A7CA6
SLC2A5 SLC2A5 SLC2A5 SLC2A5 SLC2A5 GPR157 MIR34AHG
MIR34A LINC01759
H6PD H6PD SPSB1 LOC100506022 LOC100506022
SLC25A33 TMEM201 TMEM201
Liver
IMR90 (Fibroblast)
rs72635708 TADs
TADs
pool foldchg 71.2273 -0 _
IMR90 CTCF IgR 1726
-1 _1 IMR90 CTCF ChIP-seq 1756
Liver CTCF ChIP-seq
ERRFI1 promoter
更に,Hi-Cデータを⽤いてERRFI1遺伝⼦の転写開始点をアンカーとした4C-like plot を作成した結果,肝臓組織およびIMR90細胞株の両⽅において機能多型候補rs72635708 を含む染⾊体領域は⾼いシグナルを⽰していた(図29).
CAMTA1
VAMP3 PER3 PER3PER3 PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE LOC102724552RERE
SNORD128 CAMTA1
VAMP3 PER3 PER3 PER3PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE RERE LOC102724552
SNORD128 CAMTA1
VAMP3 PER3 PER3 PER3PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE RERE LOC102724552
SNORD128 CAMTA1
VAMP3 PER3 PER3 PER3PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE RERE LOC102724552
SNORD128 CAMTA1
VAMP3 PER3 PER3PER3 PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE LOC102724552RERE
SNORD128 CAMTA1
VAMP3 PER3PER3 PER3 PER3PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERERERE LOC102724552
SNORD128 CAMTA1
VAMP3 PER3 PER3 PER3PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE RERE LOC102724552
SNORD128 CAMTA1
VAMP3 PER3PER3 PER3 PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERERERE LOC102724552
SNORD128 CAMTA1
VAMP3 PER3 PER3 PER3PER3 PER3
UTS2
UTS2
TNFRSF9PARK7 PARK7
ERRFI1
LINC01714
SLC45A1RERE RERE RERE LOC102724552
SNORD128
Liver Hi-C signal
anchoring ERRFI1 promoter
IMR90 (Fibroblast) Hi-C signal anchoring ERRFI1 promoter
rs72635708
また,この領域におけるRNAポリメラーゼIIのChIA-PETシグナルに着⽬すると,
K562細胞株においてはERRFI1遺伝⼦プロモーター領域と機能多型候補rs72635708を 含むエンハンサー領域間の相互作⽤は認められなかったが,MCF-7 細胞株においては 強い相互作⽤シグナルが認められた(図30).eRNAおよびmRNA発現量の相関によ って定義されたenhancer–promoter correlationデータと合わせると,ERRFI1遺伝⼦プロ モーター領域と機能多型候補 rs72635708 を含むエンハンサー領域間には強い機能的相 互作⽤が認められた.これらの結果に加えて,CTCFタンパク質の結合領域および結合 モチーフの⽅向を探索したところ,明瞭な TAD構造の境界領域を⾒出した(図 30).
図30:1p36.23領域の機能多型候補rs72635708とERRFI1遺伝⼦の相互作⽤
上段から RefSeq Curated Genes,CAGE データによって定義された enhancer–promoter correlation,K562細胞株におけるRNAポリメラーゼIIのChIA-PET相互作⽤およびシグ ナル(紫⾊),MCF-7細胞株におけるRNAポリメラーゼIIのChIA-PET相互作⽤およ びシグナル(⿊⾊)を⽰す.最下段にCTCFタンパク質の結合モチーフの座位および⽅
向と,推測されるTAD領域を⽰す.⻘縦線で乾癬感受性SNP rs417065,⾚縦線でERRFI1 遺伝⼦のプロモーター領域および機能多型候補rs72635708の座位を⽰す.
Window Position Scale chr1:
MCF7 CTCF Pk 1
Human Feb. 2009 (GRCh37/hg19) chr1:7,950,000-8,500,000 (550,001 bp)
200 kb hg19
8,100,000 8,200,000 8,300,000 8,400,000 TNFRSF9
PARK7 PARK7
ERRFI1 LINC01714 SLC45A1
RERE RERE
RERELOC102724552
K562 Pol2 Sig 1
MCF7 Pol2 Sig 3
MCF7 CTCF Sg 1 149
-1 _ TAD
CTCF binding sites MCF-7 Pol2 ChIA-PET interactions K562 Pol2 ChIA-PET interactions Enhancer-Promoter correlations
rs72635708
(Enhancer Functional Variant) rs417065
(Psoriasis GWAS SNPs) ERRFI1 promoter
K562 Pol2 ChIA-PET signals
MCF-7 Pol2 ChIA-PET signals RefSeq Curated Genes