近日,The Plant Journal期刊在线发表了西北农林科技大学农学院旱区作物逆境生物学国家重点实验室王晓明老师关于中国春小麦热应激(HS)响应研究的文章。该文章不仅解析了小麦旗叶和灌浆籽粒HS响应的时空动态全长转录本,同时比较了两种组织之间不同的响应HS的基因及可变剪切(AS)调控模式,并探讨了小麦三个基因组亚型响应HS的基因表达及功能差异。该结果补充了已发表的小麦参考基因组信息,为研究植物热适应复杂机制和进化差异提供指导。5848vip威尼斯电子游戏有幸参与完成了全长转录组三+二测序分析以及数据深度挖掘等工作,下面小编就给各位带来该文章的解读,以飨看官。
中文题目:全长转录组3+2测序揭示面包小麦品系的热感应和信号传导机理
发表期刊:The Plant Journal
发表时间:2019 影响因子:5.775
合作单位:西北农林科技大学
测序策略/平台:PacBio RS II+ Illumina HiSeq
检索:doi: 10.1111/tpj.14299
研究背景
植物通过重编程基因表达来忍耐各种变化的环境条件,适应并存活下来。小麦(Triticum aestivum L.)是全球重要的农作物,面临着高温胁迫的挑战。但它们的多倍体性质、基因组序列注释不完全、全面的HS转录组缺乏等信息正阻碍着人类对其HS适应过程的充分认识。本研究结合PacBio SMRT测序和Illumina测序,绘制出HS下小麦旗叶和灌浆籽粒的高分辨率的时空动态转录组图谱,生成全面的HS应答全长转录本动态列表,补充了最近发表的小麦参考基因组信息,同时提出小麦HS应答的基因转录调控和可变剪切调控的差异模式。该研究为深入分析小麦早期HS应答的分子机制提供了全面的资料,突出了多倍体小麦的基因组可塑性和进化差异性。
技术路线
取样方案:
开花期后第15天,光照4h后温度升高至37℃,HS下分别于0m、5m、10m、30m、1h、4h收获籽粒和旗叶(每个时间点3个重复),液液速冻。
测序方案:
① 每个组织分别18个样本,等量混合后构建4个文库,文库大小分别为0.5–1kb, 1–2kb, 2–3kb 和3–6kb,使用PacBio RS II平台测序。
② 36个样本同时进行RNA-seq。
主要结果:
① 小麦旗叶和灌浆籽粒在HS早期的动态转录组分析
PacBio RS II测序,小麦灌浆籽粒和旗叶分别鉴定得到643,665和508,119条CCS,通过二代数据校正,最终获得705,335条FLNC,其中91.08%能够比对到参考基因组IWGSC RefSeq v1.0。705,335条FLNC共注释得到98,992个非冗余的转录本,平均长度(2,410 bp)高于IWGSC RefSeq v1.0注释的转录本(993 bp)(图1)。鉴定得到的51,160个基因,涵盖IWGSC RefSeq v1.0中46.18%的高置信度基因。其中45.18%属多外显子基因,编码两个或两个以上isoforms(IWGSC RefSeq v1.0中多外显子基因占比21.87%)(图1)。以上数据表明,三代+二代测序策略在转录本长度和数量上显著改善了小麦基因组注释。
图1小麦旗叶和灌浆籽粒3+2转录组测序数据分析
② 新基因和新isoform的鉴定和验证
基因结构注释得到4947个(9.67%)新基因,编码6927个已知isoforms (2774 个单外显子,4153多外显子)和63358个新isoforms (图2)。这些结果表明,3+2测序得到一套高质量的小麦转录本,用于小麦HS反应的综合分析。新基因中有2678个(38.66%)isoforms和1584(2.81%)个已知基因的新isoforms被鉴定为lncRNAs,突出了PacBio测序应用于确定lncRNAs的强大优势,补充了小麦lncRNA数据库。
图2转录组数据CIRCOS 可视化展示
③ 热响应过程的差异表达基因(DEGs)和差异可变剪切水平基因(DSGs)鉴定
旗叶和灌浆籽粒的热响应模式存在显著差别。和0m样本对比,每种组织至少有一个时间点样本的HS基因表达发生改变,差异表达基因数量在旗叶和灌浆籽粒的占比分别是14.38%和5.01%(旗叶和籽粒中分别是8622和2702个,新基因分别为468和144个)。两种组织间的差异HS基因数量为3,153个,功能主要表现在“蛋白折叠”、“对刺激的反应”、“蛋白结合”,和“内质网蛋白加工”、“MAPK信号通路”和“剪接体”。叶片和籽粒组织分别鉴定到5684(表达基因的9.48%)和4568个(表达基因的8.48%)可变剪切水平差异基因,其中分别含有281和138个新基因(图3c)。HS下,DEGs数量急剧增加,DSGs数量保持相对稳定(图3c),表明AS调控模式与基因转录调控模式不同。
11,399个基因共鉴定出98,107个AS事件,包括四种主要类型:外显子跳跃(ES)、内含子滞留(IR)、剪切供体位点(AD)、剪切受体位点(AA)。其中IR事件HS下被抑制。
图3 叶片和籽粒中各时间点DEGs和DSGs的鉴定
④ HS可诱导异常快速的DEGs和DSGs表达
热处理后的前30 m内,叶片和籽粒分别检测到42.83%和74.50%的DEGs, 71.78%和69.31%的DSGs(图4a,b)。热处理5m后,叶片和籽粒便检测到46和80个DEGs,1672和1526个DSGs(图3 a、c)。表明植物的热感应和信号传导比预想的更快。IR事件的调控结果同样显示小麦对HS的迅速响应。HS反应标志基因(HSFs和HSPs)的热诱导快速表达显示籽粒的热感应和信号传导慢于叶片。作为HSFs典型靶点的一些HSPs的AS调控可能在HS早期应答中独立于HSF。
图4小麦在HS应答过程中DEGs和DSGs变化迅速
⑤ 不同转录因子(TFs)在热信号传导中的时间差异
TFs能够感知应激信号并激活应激反应基因的表达,在环境应激下的基因调控网络中发挥着主控作用。小麦的IWGSC RefSeq v1.0基因组涵盖8,908个 TFs,共59个家族,编码10,356个TF isoforms。本研究发现,HS下,家族基因可产生更多的isoforms,识别到88种新的HSFs isoforms。HSF家族中的DE-TFs显著富集(图5a),籽粒热处理10m时,AP2、FAR1、MYB、bHLH、G3H、NAC等参与热信号传导的家族基因和HSF应答基因表达差异一致。HS下, AS调控的TFs随着时间的推移保持稳定,DSGs的变化规律也是如此(图5b)。
图5不同TFs在热信号传导中的时间差异
⑥ HS适应中,转录水平和AS水平分别调控不同的基因表达和功能途径
DEGs与DSGs分析显示叶片的996个基因(11.55%的DEGs和17.52%的DSGs)和籽粒的279个基因(10.32%的DEGs和6.11%的DSGs)之间存在重叠 (图6a、b)。籽粒中,DEG中14.81%的特异性基因与DSG中4.27%的特异性基因具有基因同源性,叶片中的相对数量则为12.20%和16.26%。说明对HS的应答,转录水平和AS水平分别调节不同的靶基因。
AS与转录水平的调控差异也在GO和KEGG功能富集中体现。“内质网蛋白加工”和“MAPK信号通路”富集于DEG特异性基因,“抗坏血酸和醛酸代谢”富集于DSG特异性基因。
许多HSF和HSP编码的基因,如TraesCS5D01G393200(属于HSFA2亚家族),在HS下显著上调,AS水平上同样差异显著。
⑦ 小麦三个基因组亚型适应HS的应答差异和功能分区
小麦属异源六倍体物种,包含三个高度相似和冗余的亚基因组。B亚基因组中DEGs和DSGs最多。为了进一步了解亚基因组偏差,本研究鉴定了7287个homologous triplets(亚基因组间同源且每个亚基因组中仅存在一个拷贝的基因)。籽粒和叶片中homologous triplets的DEGs和DSGs比例具有重大差异。DEGs中,存在至少一个时间点,籽粒和叶片的homologous triplets在HS响应中存在差异(图7c,d);DSGs中,所有籽粒和叶片都存在1-2个homologous triplets被差异剪切,所有homologous triplets的AS都存在差异(图7c,d)。
图7 不同基因组亚型在热信号转导中的应答差异
籽粒中,涉及内质网蛋白加工的A-同源基因的表达相对于B-和D-同源基因显著上调。仅在热处理5m时,D-同源基因发生差异剪切。总的来说,小麦的三个亚基因组在HS响应中展示不同的应答差异和功能分区。
文章亮点
① 结合二代和三代测序技术,提供了迄今为止最全面的热响应转录本,补充了最近发布的小麦参考基因组。
② 综合分析揭示了小麦响应HS的调控机制,提出小麦热响应和早期热信号传导的调控途径。
③ 观察到不同器官和亚基因组之间的应答差异和功能分区,突出小麦多倍体性质在环境适应中的进化差异和优势。
④ 对植物热适应机制复杂网络的解剖,为其他非生物胁迫研究提供指导。
PacBio测序技术超长读长解决了二代测序技术由于读长过短引发的一系列问题,例如重复序列的组装,结构变异的识别等,极大地提升了基因组组装质量。5848vip威尼斯电子游戏此次助力合作单位挖掘野猪全长转录组新讯息。5848vip威尼斯电子游戏是国内首家拥有PacBio Sequel三代测序仪的高新技术企业,已与广大科研学者合作完成各种三代测序分析科研项目累积数百项,拥有成熟的实验技术、强大的生信分析团队和丰富的项目经验,期待与您的合作,助您的科研快速起飞!