II型糖尿病是一类多基因和环境共同影响的复杂疾病,在全世界范围内发病人口超过4亿人。为了揭示其致病机制,研究者利用三维基因组技术连续发表两篇文章,从不同的视角对该科学问题进行了深入研究。第一篇文章利用高分辨率Hi-C数据联合多组学数据,从全基因组维度绘制了胰岛特异性互作图谱,同时基于增强子-启动子互作调控网络筛选得到多个潜在的致病性增强子位点;第二篇文章采用启动子捕获Hi-C策略构建启动子区域的调控图谱,并结合多组学数据,验证得到大量的顺式互作元件,定义enhancer hub作为重要功能单元,并证实enhancer hub对于血糖代谢等具有重要的调控功能,作者指出可应用enhancer hub来评估胰岛素调控变异引起的II型糖尿病风险。
人类胰岛染色质可及性及构象揭示2型糖尿病风险的远端增强子网络
Pancreatic islet chromatin accessibility and conformation reveals distal enhancer networks of type 2 diabetes risk
发表期刊:Nature Communication
Published online: 2019年5月7日
2019年5月7日,Kyle J Gaulton 和任兵教授作为共同通讯作者于Nature Communications发表了文章pancreatic islet chromatin accessibility and conformation reveals distal enhancer networks of type 2 diabetes risk,文章应用高分辨率的Hi-C,ATAC-Seq,ChIP-seq和转录组等多组学进行分析。
01 绘制人类胰岛染色质开放性图谱和三维互作图谱
研究者利用胰岛样本ATAC-Seq与已发表ChIP-seq数据,发现开放区集中在active enhancer (EnhA1)和promoter (TssA)处(Figure 1a),并鉴定出44,680个活性增强子。结合胰岛样本高深度的Hi-C数据共鉴定出11,924个loops。
作者利用Hi-C数据和ATAC-Seq数据进行联合分析发现,染色质开放区在靠近Hi-C loops anchor中间位置处富集,几乎一半的开放区位于距离loop midpoint的25kb以内,开放区与loops anchor overlap处富集了CTCF结合位点和活性启动子及增强子等(Figure 1c-d)。最显著富集的loops互作类型为活性启动子和活性增强子之间的互作(EnhA1-TssA、EnhA1-EnhA1、TssA-TssA),也能明显的看到CTCF与CTCF结合位点的互作(Figure 1e)。
Figure 1 胰岛的染色质开放性信息和互作信息
02 loops关联远端增强子与其潜在靶基因
作者进一步验证了筛选得到的enhancer有多少参与了染色质的显著性互作。通过过滤分析,发现与Hi-C loops anchor 存在直接关联的活性enhancer有6,278个,其中3,022个对应有1个启动子。联合已公布的大样本量胰岛RNA-seq数据,发现胰岛中基因启动子和增强子互作数量与基因表达水平呈现正相关,同时胰岛中远端增强子的loop与胰岛特异性基因表达相关(Figure 2)。
Figure 2 胰岛loop中增强子数目与胰岛基因表达
通过eQTL分析鉴定出影响疾病的潜在变异位点,发现活性启动子以及基因邻近增强子的变异的eQTL 证据最强(TssA: median –log10(P) = 0.64;EnhA proximal: median –log10(P) = 0.50),相对non-loop,形成loop的远端增强子的eQTL证据更高 (EnhA loop median = 0.35,EnhA non-loop median = 0.32, Wilcox P = 4.4 × 10−5)(Figure 3)。
Figure 3 胰岛调控元件位点变异与目标基因的eQTL相关性
03 筛选增强子变异的潜在靶基因
在T2D风险中,染色质环内的胰岛活性调控元件中的变异在全基因组范围内富集。在107个已知的风险位点中,有30个风险位点位于活性增强子中,并且这30个位点中有24个位点具有等位基因不平衡性,比如位于5p13上的rs7732130,碱基G比A使得增强子具有更高的活性(Figure 4)。
Figure 4 胰岛增强子中的T2D风险信号
通过寻找位于与活性启动子形成loop结构的活性增强子,并且影响启动子邻近基因表达水平的变异,筛选到了8个候选的功能增强子突变位点(Table 1和Figure 5a和b)。例如与CAMK1D promoter形成loop结构的活性增强子中rs11257655突变影响了CAMK1D基因的表达水平(Figure 5 c)。这些可能因为活性增强子区的突变而改变表达水平的互作基因,其功能富集在囊泡介导的蛋白运输和分泌途径中(Figure 5c)。
Table 1 T2D增强子变异相关的候选靶基因
Figure 5 T2D增强信号的靶基因参与蛋白质分泌和转运
作者注意到,在3q27 处,候选靶基因只有1个,即IGF2BP2,并且其所处的TAD中仅有这一个基因。活性增强子与距离此基因启动子6kb处的内含子存在互作,而内含子中的rs10428126位点存在等位基因不平衡性,碱基由正常的C突变为A之后减弱了胰岛增强子活性,可能通过扰乱转录因子NKX2.2和PDX1结合的motif序列。于是,作者最后对此候选基因的功能进行了验证。发现T2D风险等位基因的突变降低了胰岛染色质可接近性和靶基因IGF2BP2的表达,对小鼠胰岛中IGF2BP2同源基因imp2的条件性敲除降低了葡萄糖刺激的胰岛素分泌。
Human pancreatic islet three-dimensional chromatin architecture provides insights into the genetics of type 2 diabetes
发表期刊:Nature genetics
Published online: 2019年6月28日
2019年6月28日,Jorge Ferrer实验室于Nature Genetics发表了文章Human pancreatic islet three-dimensional chromatin architecture provides insights into the genetics of type 2 disbetes,文章应用Capture Hi-C,ATAC-Seq,ChIP-seq和转录组等进行多组学分析。
01 Promotor Capture Hi-C获得丰富的promoter-Enhancer互作信息
Capture Hi-C针对含有HindIII酶切片段的启动子区域设计了31,253个探针,对Hi-C全基因组互作片段进行捕获(Figure 1 a),通过CHICAGO软件鉴定得到了175,784个具有高置信度的互作(CHICAGO Score>5),并结合增强子表观遗传学marker 和H3K27ac,H3K4me1及架构蛋白信息将增强子进行分类(Figure 1 b- e)。利用捕获Hi-C的显著互作和已知的与II型糖尿病相关的基因进行数据筛选,获得了18,031个promoter-Enhancer显著互作。
Figure 1 胰岛启动子互作组信息
02 筛选T2D相关变异的靶基因
针对T2D和空腹血糖 (FG)相关变异的109 位点,在其中61个位点确定了T2D- and/or FG-associated variants与胰岛增强子重叠,通过互作数据,确定了53个位点的1个或多个候选靶基因,这其中75%位点确定的候选基因是远端的(Figure 2a),如promotor Capture Hi-C(pcHi-C)互作数据发现,相对rs11257625所在增强子较近的CAMK1D(CHiCAGO = 4.42),与增强子区域较远的OPTN的互作可信度更高(Figure 2c)。与此同时,研究者对其中8个与T2D相关的基因座位进行CRISPR突变,发现等位基因的突变与基因表达符合预期。
Figure 2 确定T2D相关增强子的靶基因
03 enhancer hub为重要功能单元
为了识别3D 增强子簇,作者定义了含有三个以上class I enhancers (高H3K27ac和mediator蛋白占据的区域)为enhancer-rich PAT(promoter-associated three-dimensional spaces),基于此在整个基因组范围内鉴定得到了enhancer-rich 2,623个PAT,将enhancer-rich PAT与通过增强子介导高可信度的其他PAT合并,得到1,318个胰岛enhancer hub(Figure 3)。进一步分析发现enhancer hub富集的基因富集islet-selective transcripts,基因注释发现其显著富集在与糖尿病相关的通路中。
Figure 3 enhancer hub筛选
综合来看enhancer hubs以三维结构单位起调控功能作用,enhancer hub的基因对显示出组织和胰岛样本间RNA表达相关值的增加;相比同一TAD种的non-hub Promotor,hub enhancers和靶基因promotor显示出更高的H3K27ac富集;葡萄糖诱导enhancers 和 mRNAs高度富集在对应区域的hubs。
同时发现Enhancer hubs含有超级增强子和增强子簇,比如pcHi-C中的1个Hub连接了ISL1位点,lncRNA HI-LNC57与多个增强子簇和超级增强子连接(Figure 4a)。为了深入了解enhancer hub三维结构,基于pcHiC三维数据进行建模,并选定一个基因分布较少的TAD进行研究,并构建5kb的矩阵进行模拟,发现胰岛增强子与靶基因共定位,而B淋巴细胞显示的这些区域聚集显著减少。
Figure 4 ISL1 enhancer hub组织特异性结构
04 基于enhancer hub变异提供组织特异性风险评分
分析发现hub class I enhancer 变异对T2D易感性非常重要。与T2D相比,胰岛hub突变体对胰岛细胞性状的遗传富集估计值更高,值得注意的是,对于enhancer clusters, stretch enhancers or super-enhancer注释,通常也观察到显著的遗传能力富集,但对于hub enhancer,估计值始终较大。这些说明enhancer hubs在T2D和胰岛素分泌的遗传性上起重要作用。
Figure 5基于GWAS统计的遗传力评估
最后研究者还利用enhancer hub来开发了islet hub PRS models,以预测胰岛素调控变异引起的II型糖尿病风险评分。
在第一篇文章中,作者构建了三个Hi-C文库,其中有两个文库数据量高达1.5G以上(1,794,763,577、1,558,203,805、538,807,603),分别获得了2392、9910、4571个分辨率为20Kb 的loop结构。在第二篇文章中,构建了4个人胰岛capture Hi-C文库,数据量分别为(182,058,459,236,319,173、209,563,465、202,561,338),鉴定得到175784个具有高置信度的显著互作。
比较两篇文章,可以发现Capture Hi-C相较于Hi-C数据具有测序数据量少,靶标位点互作分辨率高的特点。相较于普通Hi-C高分辨率的互作图谱,Promoter Capture Hi-C能富集得到更丰富的enhancer-promotor互作信息。在我们研究课题中,可通过Capture Hi-C对特定区域进行深度富集,利用高分辨率的数据解析远程调控元件的变异对靶基因调控的影响。
参考文献:
1.Greenwald W W, Chiou J, Yan J, et al. Pancreatic islet chromatin accessibility and conformation reveals distal enhancer networks of type 2 diabetes risk[J]. Nature communications, 2019, 10(1): 2078.
2.Irene Miguel-Escalada, Silvia Bonàs-Guarch, et al. Human pancreatic islet three-dimensional chromatin architecture provides insights into the genetics of type 2 disbetes[J],Nature Genetics,2019,6