在环境样品的宏基因组研究中,Hi-C可以帮助宏基因组contigs聚类得到宏基因组组装基因组(MAG),还能提供质粒/噬菌体等与宿主菌株的关联网络。相较传统宏基因组分析,宏基因组Hi-C(Meta Hi-C)能够进一步补充更详细的菌株和可移动遗传元件/抗性基因的组成概况,在医学上追踪耐药基因转移,在农口中助力解析抗逆性/抗病机制。我们在前期的文章中对此做过技术分享(宏基因组加上Hi-C/3C,如何构建可移动元件和宿主互作网络?)。今天,我们从一篇最新应用着手,了解Meta Hi-C如何深入噬菌体-宿主菌株变化动态。
2023年11月23日,美国西北太平洋国家实验室的Kirsten S. Hofmockel研究团队在Nature Communications发表了题为Hi-C metagenome sequencing reveals soil phage–host interactions的研究成果。该研究通过对干燥前后的土壤样品进行宏基因组、宏转录组、Hi-C(Meta Hi-C)建库测序,直接捕获特定的噬菌体-宿主互作,为土壤中噬菌体介导的细菌种群动态提供了证据。其中,研究人员利用宏基因组数据从宏基因组组装contigs筛选病毒contigs,并且分别通过宏基因组和宏转录组数据检测干燥前后土壤样品中的病毒(噬菌体)群落组成和转录活性。此外,Meta Hi-C确定的contig-contig关系,不仅将宏基因组组装contigs聚类为宏基因组组装的基因组(MAGs),还提供了湿润和干燥土壤条件下的噬菌体-宿主相互作用。
图1 实验设计和分析流程
实验和分析细节
1. 样品:两组土壤样品同样条件培养。其中,第一组土壤(三个重复)保持75%的含水量于一周(第1天 10°C,第3天 15°C,第5天 25°C,第7天 30°C)后收集储存,第二组土壤(三个重复)一周后继续置于30°C且不再添加无菌水,经过14天完全干燥后收集储存,用于模拟炎热天气下土壤的自然干燥。
2. 实验细节:
▶ DNA用于构建二代宏基因组建库,RNA用于二代宏转录组建库
▶ 每个重复取5g样本构建宏基因组Hi-C文库(样品与25ml水混合窝旋, 1000 x g离心10min,取上清液,添加1%甲醛,室温20min,1%甘氨酸终止交联; Sau3AI和MlucI酶处理;补平标记生物素;连接;解交联;磁珠富集嵌合片段;二代建库测序)。
3. 数据分析
▶ 宏基因组数据QC:
• QC去接头、过滤低质量reads、标准化:fastp
• contig组装:MEGAHIT (v1.2.9) 和 meta-large
• 筛选病毒contig:VirSorter (v2)、VIBRANT((v1.2.1)、DeepVirfinder (v 2020.11.21)、CheckV (v0.7.0)
▶ Hi-C数据QC
• Hi-C clean reads与宏基因组contigs进行比对:BWA-MEM (v0.7.17)
• 去PCR: SAMBLASTER (v0.1.24)
• 过滤:samtools (v1.9)
▶ 宏基因组分箱和聚类
• 宏基因组组装和Hi-C互作数据通过ProxiMeta聚类得到宏基因组组装基因组(MAG)
• CheckM (v1.2.0) 评估分箱基因组或MAG的质量
• dRep对MAGs进行去冗余。
• CheckM对去冗余后的MAGs进行分类注释。
• GTDB-Tk对CheckM的分类结果进行验证。
• 分析标准化后的reads的测序深度来估计MAGs的丰度。
▶ DNA病毒序列聚类和注释
• A greedy centroid algorithm聚类得到vOTU:95% ANI and 85% AF
• 注释:Demovir工具,TrEMBL数据库中病毒参考序列
▶ 宏基因组和宏转录组中的DNA病毒丰度
• 宏基因组:BBMap (v 38.34)
• 宏转录组: BamM(v1.7.3)比对过滤, samtools(v1.9)
▶ 噬菌体-宿主关联:
• 通过Hi-C reads筛选噬菌体-宿主互作,该数据可用于计算每个宿主的平均病毒拷贝数(VPH)
• 通过CRISPR spacer预测噬菌体-宿主联系:CRISPRCasFinder (v3.1.0)
▶微生物共现网络:arson’s correlation coefficient、Context Likelihood of Relatedness (CLR)、、GENIE3
研究结果
1. 宏基因组Hi-C鉴定土壤微生物的病毒感染
基于宏基因组数据,该研究识别583个病毒contigs,聚类得到479个vOTU(viral operational taxonomic units)。联合Hi-C和宏基因组,该研究检测到118个噬菌体-宿主,并且聚类得到9个菌门的148个MAG。479个vOTU中有19个噬菌体通过Hi-C定位了各自的宿主。例如,土壤干燥前(图2 内层圆),两个vOTU与单个宿主MAG相关(图2 蓝色格子),但都只能在1个重复中观察到。其他三个vOTU与多个宿主MAG相关(图2 橙色格子),并且在三个重复中均一致存在。相较于基于匹配CRISPR spacers到phage genomes的方法推断的噬菌体-宿主联系,Meta Hi-C不会因病毒感染的免疫记忆无法检测最近或当前的病毒感染。
图2 土壤干燥前后的噬菌体-宿主互作关联
2. 宏基因组Hi-C和宏转录组揭示干燥后宿主的溶原性感染增加
Meta Hi-C分析显示,与宿主相关的噬菌体群落受到土壤干燥的影响。宏基因组分析显示,土壤干燥后,vOTU(相对丰富度)的比例明显更大(图3a),宿主相关vOTU的相对丰度(相对于所有vOTU的总丰度)则与湿润状态之间的差异并不显著(图3b)。宏转录组显示,土壤干燥后,较高比例的活跃vOTU与宿主相关(图3c),但是这些vOTU转录本的比例较低(图3d),因此宿主相关vOTU的平均转录活性在土壤干燥后明显下降。
图3 宿主相关vOTU的丰富度、相对丰度和转录活性
与仅检测到一种宿主的vOTU相比,与多个宿主相关的vOTU具有更高的相对丰富度和相对丰度(图3e-3h)。在干燥前的土壤中尤其如此,其中噬菌体通常更具转录活性。
3. 宏基因组Hi-C重构噬菌体-宿主网络
以至少两个重复样本中检测到的噬菌体-宿主构建感染网络,V8噬菌体在所有重复中感染相同的放线菌宿主。土壤干燥前后的噬菌体-宿主感染网络不一样,只有B94(Alphaproteobacteria)在干燥前后被不同的噬菌体感染。在干燥的土壤中,以放线菌MAG B117为目标宿主的是6个vOTU(V4、V7、V8、V9、V10 和V12)(图4a)。与干燥前相比,干燥后土壤中的vOTU与宿主MAG的相对较低的丰富度相关(图4a)。
图4 噬菌体-宿主网络和群落共现分析
群落共现网络用于识别具有高中心性的微生物。该研究通过三种互补的网络构建方法(CLR、GENIE3和Pearson相关系数)对宏转录组数据进行共现分析(图4b):CLR方法中,两个B117 argS基因是根据betweenness确定的第二和第三最中心节点,也是根据degree确定的第三和第四最中心节点;GENIE3方法中,MAG B8和B102是根据betweenness确定的第一和第二最中心节点,也是根据degree确定的第一和第四最中心节点;Pearson 相关系数方法中, MAG B102处于高度中心位置(图4b)。这种中心性和高丰度没有必然的关系。
4. 噬菌体感染调节宿主种群动态
该研究以每个宿主的平均病毒拷贝数(VPH)来估计宿主群体噬菌体感染程度。干燥土壤中,样品的平均VPH和一些宿主(例如放线菌)的VPH显著升高(图5a)。然而干燥土壤中感染多个宿主的噬菌体的转录活性较低且相对丰度较低,因此土壤干燥后较高的VPH可能表明更多个体被感染。拟合回归模型进一步展示噬菌体感染对宿主种群动态的潜在影响。在土壤干燥之前,VPH和宿主丰度显著负相关(图5b)。因此,干燥前的土壤中,噬菌体感染对宿主丰度产生反向影响,裂解噬菌体主导了裂解感染。干燥后的土壤中则没有此关系(图5c)。
图5 噬菌体感染细菌宿主的流行率
小结
该研究通过宏基因组、宏转录组和Meta Hi-C深入了解土壤干燥对噬菌体-宿主相互作用的影响以及对细菌群落相互作用的下游影响,发现随着土壤干燥,噬菌体生活方式从主要裂解转变为溶原。在干燥的土壤中存在潜在的溶原性噬菌体,这些噬菌体具有更广泛的宿主/具有适应性优势的目标宿主。
参考文献
Wu R, Davison M R, Nelson W C, et al. Hi-C metagenome sequencing reveals soil phage–host interactions[J]. Nature Communications, 2023, 14(1): 7666.