全基因组关联研究 (GWAS) 是评估个体基因变异对特定性状影响的宝贵工具。Promoter Capture Hi-C(PCHi-C)能够提供启动子相关互作信息。「GWAS+PCHi-C」可以聚焦变异相关的靶基因,结合多组学数据定位与其存在显著互作的近端/远端增强子、甲基化位点等调控因素,从而解锁与遗传变异存在驱动关系的具有疾病特征的风险基因和潜在生物学机制,并且可能以此为契机设计疗法帮助患者。
以Capture Hi-C为关键词在Pubmed检索,调查结果显示,在医学方面,近年有几十余篇高分研究采用了Capture Hi-C技术,其中绝大部分关注的是Promoter区域的相关互作,涉足的疾病类型包括有代谢类疾病(糖尿病)、肥胖、神经精神疾病、心血管疾病、早产、肿瘤和自身免疫性疾病等。并且普遍存在「GWAS+PCHi-C」模式。下面就近期几篇高分研究的主题内容做简要导读,一窥其在疾病的探索之路。
图1 PCHi-C解析多种疾病的功能目标/关键调控程序
(表中皆为精选OA文章,文末可获得DOI号)
1
神经精神疾病 · 阿尔茨海默病
阿尔茨海默病(AD)是一种进行性神经退行性疾病,是痴呆症最常见的病因。据《中国阿尔茨海默病报告2021》显示,中国的AD及其他痴呆患病率、死亡率略高于全球平均水平,且在女性中的相关数据高于男性。
2021年,美国西奈山伊坎医学院的Alison M Goate团队和Alison M Goate团队合作,在Nature Communications(IF:17.694)期刊发表了文章Integration of Alzheimer’s disease genetics and myeloid genomics identifies disease risk regulatory elements and genes。已知40多个GWAS AD位点,并且AD风险等位基因(AD risk alleles)特异性富集于骨髓的表观基因组注释。该研究进一步确认了这些AD风险等位基因富集在单核细胞、巨噬细胞和小胶质细胞的活性增强子中。并且一边整合PCHi-C和单核细胞和巨噬细胞的eQTL数据集,将含有AD风险等位基因的骨髓活性增强子(AD risk enhancers)映射到其靶基因上,一边基于Summary data-based Mendelian Randomization(SMR)数据来研究染色质活性、目标基因表达和AD风险之间的因果关系,联合确认了AD risk enhancers,并在其可能的目标(AP4E1、AP4M1、APBB3、BIN1、MS4A4A、MS4A6A、PILRA、RABEP1、SPI1、TP53INP1和ZYX)中抉择因果基因。这些增强子的精细映射(fine-mapping)反映了候选功能变异,而这些变异可能通过调节骨髓细胞中的基因表达来改变AD风险。该研究还在人类诱导多能干细胞衍生的小胶质细胞和大脑中验证了MS4A位点的一个变异。
图2 MS4A基因座的一个候选因果变异破坏了一个CTCF结合位点,并与染色质可及性降低和骨髓细胞中MS4A6A基因表达增加有关
时隔一年,芝加哥大学和波士顿大学医学院的研究团队合作发现了一个名为MGMT的新基因,该基因会增加女性患阿尔茨海默病的风险。研究成果以Genome-wide association and multi-omics studies identify MGMT as a novel risk gene for Alzheimer's disease among women为题发表于Alzheimer’s Dementia(IF:16.555)。该研究在tau基因(MAPT)区域的变异与女性乳腺癌和缺乏脂蛋白E ε4(ε4-)的阿尔茨海默病有关的背景下,进行了两项AD的GWAS研究。一项是在阿尔茨海默病遗传学联盟(ADGC)的10340名ε4-女性中进行,另一项是在一个近亲的Hutterite家族的31名成员(22名女性)中进行。研究在ADGC(rs12775171)和Hutterite(rs12256016和rs2803456)数据集中发现了AD与MGMT变异的新关联。遗传、甲基化和转录组等多组学分析显示,在女性中,单核苷酸多态性、DNA CpG甲基化、MGMT表达和AD相关的神经病理特征之间存在最显著和数量最多的关联。此外,PCHi-C分析也展现了MGMT启动子与MGMT SNPs和CpG位点的远距离相互作用。总结得到,参与DNA损伤修复功能的MGMT的表观遗传调控表达与AD的标志性蛋白(Aβ和tau)明显相关,特别是在女性之中。
图3 MGMT位点的调控图谱
2
自身免疫性疾病 · 系统性硬化症
文章题目:Epigenomics and transcriptomics of systemic sclerosis CD4+ T cells reveal long-range dysregulation of key inflammatory pathways mediated by disease-associated susceptibility loci
发表期刊:Genome Medicine( IF:15.266)
研究单位:何塞普-卡雷拉斯研究机构和López-Neyra寄生虫学和生物医学研究所合作团队
研究材料:CD4+ T细胞
研究策略:GWAS、PCHi-C、甲基化和基因表达数据、ChIP-seq
图4 文章信息
系统性硬化症(SSc)是一种遗传复杂的自身免疫性疾病,主要特点是广泛的微血管损伤、免疫细胞失调以及皮肤和各种器官的全身纤维化。SSc由多种免疫细胞的遗传和表观遗传因素相互作用而介导,CD4+T淋巴细胞是发病机制的主要驱动因素之一。该研究揭示了SSc患者CD4+T细胞的遗传、表观遗传和转录失调之间的潜在联系,为驱动SSc发病机制的分子成分提供了一个新的综合视角。
该研究对48例SSc患者和16例健康对照的CD4+ T 细胞DNA样品进行了MethylationEPIC BeadChip芯片杂交。同时,在Clariom™ S阵列上杂交总RNA来检查基因表达。然后通过进行下游分析来确定相关的差异甲基化的CpG位置(DMP)和表达不同的基因(DEG),并且利用PCHi-C数据进行确认。结果分别鉴定了9112个和3929个DMP和DEG。这些DMP和DEG富集在与炎症和T细胞生物学有关的功能中。此外,利用PCHi-C数据分析确定了17500个可能的DMP-DEG相互作用,观察到212个CD4+T细胞特定的DMP-DEG互作对也形成了三维的启动子-增强子互作网络的一部分,并且可能和CTCF有关。最后,联合分析PCHi-C数据和SSc GWAS数据,确定了四个重要的SSc相关易感基因座——TNIP1(rs3792783),GSDMB(rs9303277),IL12RB1(rs2305743)和CSK(rs1378942),它们分别可能与DMP-DEG对cg17239269-ANXA6、cg19458020-CCR7、cg10808810-JUND和cg11062629-ULK3相互作用。
图5 TNIP1(rs3792783)、GSDMB(rs9303277)、IL12RB1(rs2305743)和CSK(rs1378942)可能与DMPs(分别位于TNIP1、RARA、LSM4和MPI)及其相关的DEGs(即ANXA6、CCR7、JUND和ULK3)相互作用
3
自发性早产
文章题目:Transcriptome and regulatory maps of decidua-derived stromal cells inform gene discovery in preterm birth
发表期刊:Science Advances( IF:14.957)
研究单位:芝加哥大学
研究材料:人类胎盘膜的间充质基质/干细胞(MSCs)和蜕膜的MSCs
研究策略:GWAS、RNA-seq、ChIP-seq、ATAC-seq、PCHi-C
图6 文章信息
自发性早产(PTB)指的是妊娠37周前的自然分娩和出生,与相当高的婴儿死亡率和发病率以及成年后的长期健康后果有关。虽然PTB的遗传成分早已被认可,并且最近通过GWAS绘制了图谱,但PTB的分子决定因素仍然难以捉摸。部分原因是与怀孕和PTB有关的人类细胞类型的功能基因组注释不完整。
该研究对收集自人类胎盘膜的培养间质/干细胞(MSCs)和蜕膜的MSCs(也称为蜕膜基质细胞(DSCs))的转录组(RNA-seq)和染色质特点(ATAC-seq、ChIP-seq(H3K27ac、H3K4me1和H3K4me3))进行了表征,然后将这些功能注释与56384名妇女的妊娠期GWAS结果结合起来,促进PTB基因的发现。这种综合分析显示,在由开放染色质或组蛋白标记注释的蜕膜基质细胞基因组区域中,妊娠期的遗传性明显富集。利用这些功能注释,研究还发现了与妊娠期相关的额外位点,并改进了与妊娠期相关区域的精细映射。最后,利用PCHi-C将功能注释的妊娠期相关变异与其可能的靶基因联系起来。该研究的策略说明了妊娠相关细胞类型的功能注释可以帮助PTB以及可能的其他妊娠相关疾病的GWAS的实验跟踪,如先兆子痫和复发性流产,以及与子宫内膜功能紊乱相关的疾病(如子宫内膜异位症和不孕症)。
图7 妊娠期GWAS位点的精细映射
参考文献:
1.Novikova G, Kapoor M, Tcw J, et al. Integration of Alzheimer’s disease genetics and myeloid genomics identifies disease risk regulatory elements and genes[J]. Nature communications, 2021, 12(1): 1-14.
2.Chung J, Das A, Sun X, et al. Genome‐wide association and multi‐omics studies identify MGMT as a novel risk gene for Alzheimer's disease among women[J]. Alzheimer's & Dementia, 2021.
3.Li T, Ortiz-Fernández L, Andrés-León E, et al. Epigenomics and transcriptomics of systemic sclerosis CD4+ T cells reveal long-range dysregulation of key inflammatory pathways mediated by disease-associated susceptibility loci[J]. Genome medicine, 2020, 12(1): 1-17.
4.Sakabe N J, Aneas I, Knoblauch N, et al. Transcriptome and regulatory maps of decidua-derived stromal cells inform gene discovery in preterm birth[J]. Science advances, 2020, 6(49): eabc8696.
文献列表下载链接:链接: https://pan.baidu.com/s/14sFODJDBQFCimieqINIuZw?pwd=pt45 提取码: pt45