近日,国际著名学术期刊Nature Communications发表了一篇题为“The 3D architecture of the pepper genome and its relationship to function and evolution” 的研究论文。华南农业大学廖毅博士(现任美国加州大学尔湾分校项目科学家)和在读博士生王钧涛为共同第一作者、华南农业大学陈长明副教授、曹必好教授和加州大学尔湾分校J. J. Emerson副教授为共同通讯作者。该研究构建了高质量的辣椒(Capsicum annuum)染色体水平的参考基因组,并通过整合叶、芽、果肉和胎座四种组织的高分辨率Hi-C互作图谱与表观基因组、转录组和遗传变异数据,探索了其三维基因组结构的基本特征以及与基因组功能和进化的关系。结果显示,辣椒的染色质折叠域与哺乳动物的TADs一样突出,但表现出独特的特征。它们往往与富含反转录转座子的异染色质区域一致,并且经常嵌入环中,这可能与转录工厂相关。辣椒染色质折叠域的边界是染色体重排的重点区域。研究结果表明辣椒基因组显著的拓扑结构可由转录工厂介导的异染色质驱动的折叠模型解释,这种空间构造受到了结构和功能的限制。
5848vip威尼斯电子游戏承担了该研究中的Hi-C建库测序和转录组相关工作。
材料方法
研究材料:辣椒自交系植株(CA59)的叶、芽、胎座、根和果肉
研究方法:三代+二代基因组测序、Iso-seq、Hi-C、BS-seq、ChIP-seq、RNA-seq数据
研究结果
1.C. annuum的染色体水平基因组和全局3D互作信号
该研究首先基于PacBio长读长数据、二代短读长数据和Hi-C数据组装得到高质量的染色体水平的参考级C. annuum基因组,基因组大小~2.95Gb,BUSCO完整性评估结果为95.8%。与以前的组装基因组相比,其能被识别到更多的长末端重复逆转录转座子 (LTR-RT) 。同时,结合五个组织(叶、芽、果肉、胎座和根)的Iso-seq全长mRNA测序数据、基因组中注释的蛋白质序列以及ab initio预测的基因注释得到46160个蛋白编码基因。大约 84.71% 的辣椒基因组序列为重复序列,LTR-RT占73.21%。
关于C. annuum的3D基因组结构,该研究生成了叶、芽、果肉和胎座四种组织的Hi-C数据,每种组织的互作信息分辨率达到10kb。数据分析显示不同组织的互作图谱有很大的不同。例如,叶和芽有明显的反对角线互作模式,但这些模式在果肉和胎座中较弱或没有。这些构象的反差可能源于组织中间期细胞核的Rabl或非Rabl构型的差异。并且相对于果肉和胎盘,叶和芽中具有更丰富的长距离(> 20 Mb)相互作用频率。因此来自不同植物组织的细胞在细胞核内的整体染色体构象可能存在差异。尽管各组织之间存在这些全局性的差异,但后续分析明确有A和B compartment、TAD-like结构域和loop在各组织中是保守的。
辣椒四种组织的全基因组互作信号(分辨率500kb)
2.辣椒中subcompartment的基因组和表观基因组特征
该研究基于PCA的分析将辣椒染色体分割成明确的“A”和“B”compartment,然后基于Calder方法将基因组划分为A和B subcompartment,实现在更高分辨率的Hi-C矩阵进行更精细的compartment分类。随后评估不同级别(即 4 和 8 个subcompartment)的信息特征。该研究结合幼叶的ChIP-seq(H3K4me3、H3K27me3 和 H3K9me2)和DNA甲基化信息,发现subcompartment的等级与一系列基因组和表观基因组特征相关,如转录水平、基因含量、DNA甲基化水平和组蛋白修饰的强度。A subcompartment具有活性染色质区域的特征,它们富含基因、基因表达和活性染色质标记(H3K4me3)。而根据较高的LTR反转录转座子含量和抑制性染色质标记(H3K9me2),B subcompartment似乎更静止。有趣的是,活跃的A subcompartment往往比B subcompartment有更高的整体 DNA甲基化水平。总的来说,结果表明subcompartment的特性与基因组和表观基因组特征的微妙差异有关。
subcompartment的基因组和表观基因组特征
1号染色体的subcompartment与基因和LTR及表观基因组特征的对应关系
3.辣椒中的TAD-like结构域
该研究利用多种分析方法都在辣椒基因组检测到明显的TAD-like结构域,并且四个组织的TAD-like结构域大小和位置都一样。随后基于基因组(LTR 和基因密度)和表观基因组特征(DNA甲基化和组蛋白修饰如H3K4me3、H3K9me2和H3K27me3)将TAD-like结构域分为三个主要区域,分别是活跃的、不活跃的和HDF(异染色质驱动的折叠)。对这三个区域分析发现,辣椒基因组中的大部分TAD-like结构域是compartment结构域,并且与动物一样,TAD-like结构域边界富含基因和活性染色质标记(H3K4me3),但缺乏非活性标记(H3K9me2)和LTR反转录转座子。活性结构域的边界与其侧翼区域相比具有较低水平的DNA甲基化,而非活性结构域和HDF结构域的边界具有更高水平的DNA甲基化。鉴于HDF结构域占据其基因组的约60%,推测异染色质可能驱动了辣椒中染色质折叠的3D结构。
TAD-like结构域边界的基因组和表观基因组特征
6号染色体上20Mb 区域折叠结构域的基因组和表观基因组特征
4.辣椒中的loop结构
接下来使用Hi-C数据来注释四个组织中的染色质loop。主要分析Mustache工具确定的8236个非冗余loop中,发现辣椒基因组中染色质loop经常划分TAD,也就是说,一个loop的两个锚点与TAD的两个边界重合。这些loop有两大特点,一是它们在TAD外部,二是辣椒中的loop锚点与基因重叠的频率是偶然预测的两倍,能够经常观察到按顺序排列的基因loop。这样的配置与转录工厂模型一致,由转录工厂支持的染色质折叠可能是辣椒和大多数大型植物基因组中TAD-like结构域形成的常见机制。
染色质loop划分TAD-like结构域
5.尽管进化保守性较高,但共线性断点优先发生在染色质折叠域边界附近
为调查边界区域的进化特性,该研究首先将来自马铃薯、番茄和茄子的保守共线性序列与辣椒基因组进行比对,发现边界平均比非边界区域具有显著更高的序列覆盖率,这意味着更强的序列保守性。然后通过现有的5个Capsicum组装基因组识别SNV和小的删除,并结合S. lycopersicum的基因组变异分析进行验证,发现基因组变异局限于边界,并且这种约束可能在茄科物种中普遍存在。
后生动物中,染色体重排的断点优先发生在TAD 边界并在TAD内部无此现象,但这种模式尚未在植物中报道。该研究确定了C. annuum和三种远缘茄科物种之间的基因组共线性断点,发现在C. annuum和三种茄科物种之间的每次比较中,TAD-like结构域边界处确实富集了共线性断点。在对序列保守水平的跨域进行归一化处理后,这种模式仍然存在。
辣椒中染色质折叠域的边界富含从远缘茄科植物中发现的进化共线性断点
6.染色质构象预测转录的量化变异但不预测差异基因表达
为了探索基因组结构和基因表达之间的关系,该研究分析了基因表达的变化是否与compartment转换相对应,结果显示基因表达的变化只能预测一小部分基因组区域的subcompartment转换。分析重塑染色质折叠结构域是否与组织之间的差异基因表达有关,发现TAD结构与基因调控相关的方式主要局限于结构域边界或附近的基因。该研究还以比较两个或多个组织共享的loop和单个组织独有的loop的方式,来核对染色质loop的变化是否与基因表达的变化有关。结果表明染色质构象可以在一定程度上预测但不能直接决定组织之间的转录差异。
华南农业大学廖毅博士和在读博士生王钧涛为论文共同第一作者,华南农业大学园艺学院陈长明副教授、曹必好教授和加州大学尔湾分校J. J. Emerson副教授为该论文共同通讯作者。该研究得到了国家自然科学基金、国家重点研发计划和广东省自然科学基金等项目的资助。
参考文献:
Liao, Y., Wang, J., Zhu, Z. et al. The 3D architecture of the pepper genome and its relationship to function and evolution. Nat Commun 13, 3479 (2022). https://doi.org/10.1038/s41467-022-31112-x