威尼斯5848vip电子游戏(wns认证网站)-BinG百科

您好,欢迎光临武汉5848vip威尼斯电子游戏信息有限公司
027-87224696 | marketing@frasergen.com | 中文|English 咨询客服
MARKET DYNAMICS—— 市场动态 ——
首页 > 市场与支持 > 市场动态
市场动态MARKET DYNAMICS

实用干货丨十问十答,转录组常见问答(二)

发布时间:2024-1-11 11:21:15阅读次数: 分享到:


转录组已经是十分普及的组学手段,通过也通常是组学的入门技术,但是对于大多数初学者来说,还是会有许多问题。上一期我们重点解析了转录组上游的一些常见问题,今天我们进一步升级,让我们来看看转录组常见问答第二弹!!



Q1

什么是主成分分析?

A1:主成分分析(PCA)是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。简单的说是通过多元降维的方式,在保留差异的基础上尽量减低数据维度,从而更简略的描述数据集之间的相对关系,在转录组中PCA可以作为评估组间、组内差异的有效手段,通过离散程度来判断试验设计是否初步符合预期。

Q2

什么是相关性分析?

A2:相关性分析是根据样本之间整体基因表达水平来进行的分析,也是反映样本间相似程度的一种方式,数值越接近1则说明样本间相似度越高、数值越解决0则说明相似度越低。对于相关性的计算基本是三种方式:Pearson相关系数,Kendall相关系数和Spearman相关系数,其中在转录组学中被普遍使用的是 Pearson系数。

Q3

什么是富集分析?

A3:“富集”(enrichment)通常指使用某种方法使目的物质占比增加,如富集某种细胞或蛋白,同理,“功能富集分析”可理解为在差异基因集中寻找占比高的功能,从而了解差异基因集的关键功能,进而推出样本间重要的功能差异。转录组中最常见的富集分析是GO富集分析和KEGG富集分析,二者的富集方法为Hyper-geometric distribution,一般选取Q-Value≤0.05为显著富集。

Q4

转录组常用数据库有?

A4:一般有NR/NT、GO数据库、KEGG数据库、KOG数据库、Swiss-Port数据库;,NR/NT数据库常用于蛋白质同源性分析和序列比对;GO数据库可以为基因功能注释和基因表达分析提供帮助;KEGG数据库可以为研究提供功能基因组学、系统生物学、代谢途径、疾病等方面的信息;KOG/COG数据库可以用来研究基因在不同物种之间的演化和功能差异;Swiss-port则可以运用于蛋白质结构、功能及相互作用等研究领域。大家可以查看转录小白日志丨关于数据库的那些事儿

Q5

什么是可变剪接?

A5:可变剪接是指在基因表达的过程中,通过不同的剪接方式产生不同的mRNA转录本。基因组中的大部分基因包含多个外显子(exon)和内含子(intron)。在转录过程中,基因的前体mRNA(pre-mRNA)会通过剪接机制将内含子剪除,将外显子连接起来形成成熟的mRNA转录本。即一个基因通过不同的剪切模式从而形成了不同的转录本,进而实现不同功能。

Q6

关注的基因在富集结果中没有查到怎么办?

A6:无论是GO还是KEGG富集分析,都是基于GO和KEGG数据库进行,需要首先明确基因是否在数据库中存在注释,在数据库没有注释则必然无法富集;其次富集分析是基于差异基因进行,因此需要其判断为差异;如存在注释但是为非差异基因就需要考虑是否进行差异调参。

Q7

关注的通路在富集图中没有展示是为什么?

A7:KEGG富集分析根据各个通路的显著性筛选,如通路未显著富集,则不会出现在显著富集图例中,同时图例只会展示前30条通路,因为数量受限也有可能并未在图中展示。

Q8

关注的通路不是显著富集通路怎么办?

A8:是否显著富集主要取决于该通路中差异基因占比,若差异基因过少,则很可能导致未显著富集;同时富集分析依然会通过Q值筛选,因此可以考虑是否进行调参放宽筛选标准。当然放宽标准可能会影响结果的可信度,可以结合生物学故事综合考虑。

Q9

基因在两个样本间Count差异较大,但是不是差异基因是为什么?

A9:差异基因的计算是基于统计学方法进行,并不通过直观差值判断,readcount受不同测序深度影响会存在偏差,在分析中会进行数据标准化从而消除影响,同时如果涉及组间分析,这组内重复的情况也会影响到差异基因的判断。

Q10

差异P值和富集P值有什么关系?

A10:差异p值:在差异结果中pvalue为显著性检验的p值,计算模型为负二项分布,padj为多重假设检验校正后的p值,计算方法为BH,pvalue、padj代表的是显著差异的阈值。

富集p值:在富集结果中pvalue为显著性检验的p值,计算原理为

padj为多重假设检验校正后的p值,计算方法为BH,pvalue、padj代表的是显著富集的阈值。差异的p值与富集结果中p值代表的含义不同,同时两个分析中pvalue的计算方式不一致,两者没有任何联系不能混淆。



本期十问十答重点在转录组分析起始阶段,后续问答将会围绕转录组后续分析进行让我们敬请期待~


农学科研
表观遗传
基因组
重测序
转录调控
微生物
生物信息学服务
医学临检
实体瘤基因检测
血液肿瘤基因检测
心血管精准用药基因检测
单基因遗传病基因检测
病原基因检测
医学科研
三代测序技术
单细胞测序技术
二代测序技术
三维基因组学技术
市场与支持
市场动态
菲沙课堂
产品速递
关于5848vip威尼斯电子游戏
菲沙简介
菲沙团队
菲沙成果
技术平台
合作伙伴
联系我们
加入我们
校园招聘
社会招聘
联系我们
  • 电话:027-87224696
  • 传真:027-87224785
  • Email:support@frasergen.com
  • 地址:中国湖北省武汉市东湖高新技术开发区高新大道666号光谷生物城D3-1栋三楼
微信公众号
Copyright © 2018武汉5848vip威尼斯电子游戏信息有限公司 鄂ICP备13010493号-1. All Rights Reserved Designed by Wanhu

XML 地图