比较转录组测序是指通过测序技术手段研究物种进化,通过不同物种或亚种间mRNA序列差异进而分析近源物种间的亲缘关系,挖掘明显受到正向选择或负向选择的基因。适用于同一物种不同遗传背景品系,主要指的是比较近缘种(同科属)的转录组序列。
研究材料选取存有以下误区
1.物种遗传关系过远
(1)数学角度考虑,突变饱和,计算突变频率已经没有意义。
(2)生物学角度考虑,分化时间过于久远的物种,讨论选择压力没有意义。
2.同种的个体
(1)序列过于相似,不适合进行ka/ks分析。按照0.1%的差异度来计算,可能某些基因非同义突变为零,这种结果不准确。
(2)转录组call SNP误差较大,而同种个体间自身差异极小,容易导致:背景噪音>真实信号。
3.比较转录组样本同样需要做重复
分两种情况:
(1)比较转录组是比较近缘种(同科属)的转录组序列,序列本身是稳定存在的信息,因此不需要重复。
(2)亲缘关系近的物种,可以尝试做单拷贝同源基因的表达差异。此时我们默认为两个近源种细胞中RNA总量是相同的,这个时候可以面对单拷贝同源基因做比较,基因的表达量分析存在实验误差,所以需要做重复。
Fig1 胡杨和白桦同源基因的表达[1]
比较转录组与基因表达差异
比较转录组无法跨物种比较表达量,物种内的表达量比较是可行的。原因:
(1)不同物种,多拷贝基因难以确定基因的一一对应关系,无法比较表达量。当然,单拷贝同源基因可以确定一一对应关系。
(2)差异分析使用的内参是RNA总量。相同物种RNA总量稳定,所以没有问题。但不同物种RNA总量未必相同,所以物种间的差异分析就失去了稳定的内参。强行比较是不严谨的。
比较转录组能够解决的生物学问题
1. 同源基因鉴定,特有基因查找。
Fig2 同源基因鉴定示意
2.物种分化时间预估,揭示近源物种之间存在的进化关系。
分子进化预估分化时间是基于中性突变(无功能的突变)变化速率恒定的假设,来预估分化时间。最基础的公式:T=K/2r。通常,计算进化时间的时候用的是同义突变,同义突变理论上不受选择压。因此,K为Ks,即同义突变率;r是这个分类的物种的百万年突变率。
Fig3 非标度树(左)和标度树(右)[2]
3.通过计算基因在进化中受到的选择压力,筛选正在快速进化的基因。
两个关键的阈值:
Ka/Ks>1:受到强烈的正向选择(positive selection),即有些有利突变正受到选择;0.5<Ka/Ks <1:受到弱正选择。
Fig4 单拷贝同源基因的ka/ks[1]
4.研究某一个家族在不同近源物种的分类关系。
Fig5 基因家族树
5. 基因分型,区分形态高度相似的不同物种。
为了便于分类,从单拷贝同源基因挑选物种保守的多态SSR用于区分形态高度相似的近源物种。
Fig6 保守SSR序列统计及验证[3]
我们知道,利用转录组数据分析蛋白家族,无法区分低表达基因、多拷贝基因和可变剪切等,这些局限会导致比较转录组判断基因拷贝数存在很大误差。所以,比较转录组分析多集中于单拷贝同源基因。
以上,小编总结了科研小伙伴对比较转录组研究经常难以把控的几大关键问题,是不是豁然开朗了呢!!!
5848vip威尼斯电子游戏“全面出击”,全方位提供各种转录组测序服务,为您解决各种生物学问题,满足您多样化的科研需求!
参考文献:
[1] Zhang J, et al. Rapidly Evolving Genes and Stress Adaptation of Two Desert Poplars, Populus euphratica and P. pruinose[J]. PLoS ONE, 8(6), e66370.
[2] Yang J, Liu D, WangX, et al. The genome sequence of allopolyploid Brassica juncea and analysis ofdifferential homoeolog gene expression influencing selection[J]. Nature Genetics,2016.
[3] Mu X D, et al. Transcriptome analysis between invasive Pomacea canaliculata and indigenous Cipangopaludina cahayensis reveals genomic divergence and diagnostic microsatellite/SSR markers[J]. BMC Genetics (2015) 16:12