据不完全统计,截至7月18日,2023上半年T2T基因组文献共有18篇,绝大多数发表在高分期刊上,如Nature Genetics、Cell Research、Molecular Plant、PANS、Plant Communications、Horticulture Research。研究涉及的物种有动物(人类、家鸡、家蚕)、植物(白菜、草莓、柠檬、葡萄、桑树、胡萝卜、玉米、藻类等)、真菌(松茸)等。小编精选三篇具有代表性的T2T基因组文章进行介绍,探讨不同物种的研究热点。
#1
莱茵衣藻Gap-free基因组
A gap-free genome assembly of Chlamydomonas reinhardtii and detection of translocations induced by CRISPR-mediated mutagenesis
发表时间:2023年3月13日
发表刊物:Plant Communications(IF=10.5)
研究策略:PacBio HiFi + Oxford Nanopore
研究背景:单细胞绿藻莱茵衣藻(Chlamydomonas reinhardtii)具有17条染色体,基因组大小约为120 Mb。莱茵衣藻易于培养、生长速度快、遗传学背景清晰且容易转化,是研究光合作用、有性生殖、油脂代谢和生物制氢的模式生物。早前报道的莱茵衣藻基因组由1500个以上contigs组装而成,并且有接近2 Mb的序列未被组装到莱茵衣藻基因组上,阻碍科学家们对莱茵衣藻的研究。因此,实现染色体级别的莱茵衣藻基因组组装可以为莱茵衣藻的深入研究提供有力工具。
研究结果:研究人员利用HiFi和Nanopore数据进行组装获得了CC-5816植株的染色体级别的基因组。该参考基因组由17个scaffold组成,分别匹配到17条染色体上。研究人员在8号染色体和14号染色体上鉴定到3条rDNA序列,在11号和15号染色体上发现分别靠近各自着丝粒的重复区域,可能是基因组中重复最多的区域。此外,研究人员还发现在着丝粒区域具有大量胞嘧啶甲基化位点以及插入在基因组上的细胞器序列,为研究真核生物基因组进化提供了理论依据。
图1 莱氏衣藻的基因组分析
#2
胡萝卜T2T基因组
Telomere-to-telomere carrot (Daucus carota) genome assembly reveals carotenoid characteristics
发表时间:2023年5月10日
发表刊物:Horticulture Research(IF=8.7)
研究策略:PacBio HiFi + ONT Ultra-long + Hi-C
研究背景:胡萝卜(Daucus carota)是一种起源于阿富汗的伞形科二年生草本植物,以肉质根作蔬菜食用。胡萝卜肉质根中含量丰富的类胡萝卜素可以为维生素A合成提供底物,肉质根的颜色是胡萝卜重要性状之一,因其含有多种类胡萝卜素和花青素而呈现不同的颜色。已有研究报道插入MYB转录因子可导致花青素型胡萝卜根由紫变黄。然而,黄色、橙色、红色或白色根的胡萝卜素型胡萝卜的色素沉着机制鲜有报道。胡萝卜被用作模式生物来探索类胡萝卜素合成的分子机制,目前有关胡萝卜的遗传信息并不完整,限制其分子机制研究的开展。通过使用多个测序平台进行高深度测序和组装而获得的高质量无缝隙基因组有利于深入研究物种性状变异的分子机制。
研究结果:研究人员利用HiFi reads、ONT Ultra-long reads、Hi-C reads组装出9条染色体都是0 gap的T2T水平的胡萝卜基因组。基因组大小为430.40 Mb,contig N50达到45.71 Mb,GC含量34.8%。组装结果评估显示,组装完整性为98.9%,二代比对率为99.74%、覆盖率为99.97%,QV值为53.27,表明该T2T基因组版本具有较高的组装完整性、一致性和准确性。基因组中重复序列的比例为55.3%,主要是长末端重复序列(LTRs)。根据重复的覆盖范围,预测出染色体上的14 个端粒区和9个着丝粒区。整个基因组共鉴定到36,268个基因,对其中34,961个基因进行功能注释。包含胡萝卜在内的共12个物种的系统发育分析结果表明胡萝卜与芹菜及其他伞形科植物大约27百万年前出现分化。此外,在胡萝卜中鉴定到2866个基因家族收缩和638个基因家族扩张,其中发生收缩的基因家族主要和植物激素信号转导相关,而扩增基因家族则参与泛素介导的蛋白水解和胞吞作用。基于T2T基因组,研究人员重建了类胡萝卜素代谢途径,筛选出65个调节类胡萝卜素生物合成的结构基因,其中有9个是新发现的。与类胡萝卜素生物合成相关的24个细胞色素P450基因的比较揭示了导致CYP基因家族扩展的串联重复或近端重复。
图2 高质量的胡萝卜T2T基因组组装
#3
中国汉族男性完整和完全分型的二倍体基因组
The complete and fully-phased diploid genome of a male Han Chinese
发表时间:2023年7月14日
发表刊物:Cell Research(IF=44.1)
研究策略:PacBio HiFi + ONT Ultra-long + Hi-C + BGI + Illumina
研究背景:通用的人类参考基因组GRCh38的数据主要源自非洲或欧洲个体,几乎应用于所有基因组学研究。种族多样性的缺乏阻碍对全球人类群体基因组成分的全面了解,并限制了代表性不足的人群的医疗健康研究。GRCh38并不能代表所有人群的所有基因组成分,造成参考偏差,进一步导致与疾病相关的遗传变异鉴定失败。亚洲人口占世界人口的60%以上,群体规模庞大,遗传多样性丰富,但对亚洲人群的基因组研究还处于边缘。因此,有必要建立一个完整的亚洲后代参考基因组,并对亚洲后代基因组与GRCh38、T2T-CHM13之间的差异进行评估。
研究结果:研究人员利用HiFi、ONT Ultra-long 、Hi-C和二代测序结合的策略获得了中国汉族男性个体(CN1)完全分型和注释良好的二倍体基因组(CN1v0.8.1),其中两个单倍体的组装达到端粒到端粒(T2T)的水平。CN1v0.8.1的母系和父系基因组的NG50分别为157.4 Mb和145.8 Mb,并且具有良好的一致性。比较两个完整单倍型的线性基因组,检测到约260万个单核苷酸变异(SNVs),约有311,000个的小插入或缺失(InDels)(< 50 bp),16,519个结构变异(SVs)(≥ 50 bp)。选择每条染色体组装较好的版本整合为二倍体基因组,得到代表汉族人群的T2T参考基因组——CN1。进一步将该参考基因组与CHM13单倍体T2T基因组进行比较,发现两个参考基因组之间在着丝粒区域存在显著长度差异。在着丝粒区域之外,还存在11413种结构变异,其中包括许多新的变异。这些结构变异中包含大量的短散在核元件(SINEs)、长散在核元件(LINEs)和长末端重复(LTRs)。此外,研究人员在东亚人群中检测到数千个CN1等位基因,这些等位基因积累了较高的替代率,少数等位基因处于正选择状态,以CN1作为参考基因组在东亚人群的变异检测应用中的表现优于CHM13。最后,以CN1为参考,发现5.80 Mb和4.21 Mb的推定渗入序列分别来自尼安德特人和丹尼索瓦人,其中包括许多以CHM13为参考基因组未被发现的东亚特异性基因。本研究揭示了利用CN1作为参考基因组在种群基因组研究和古基因组研究中的进展,这一完整基因组将为今后东亚人群基因组研究提供参考。
图3 CN1二倍体基因组的单倍型分型组装
组装出一个物种完整的基因组,解析生命的奥秘,一直都是组学科研工作者的追求。随着测序技术的变革和分析算法的优化,将基因组组装到实现一条或多条染色体端粒到端粒的染色体水平的0 gap基因组,已经相继在人类、家鸡、水稻、香蕉、油菜等物种中实现,T2T基因组为物种起源与进化研究、疾病相关基因的鉴定、性别分化机制研究等提供了高质量参考基因组。
5848vip威尼斯电子游戏拥有丰富的T2T基因组项目经验,已助力发表T2T基因组文章12篇,累计影响因子150+!T2T基因组研究的道路上,5848vip威尼斯电子游戏将助您勇攀科研高峰。
TIPS
“5848vip威尼斯电子游戏”公众号后台回复“T2T”即可获得文献原文!