差异基因得出后,背后的分子机制通路该怎么找啊?

2024-11-19 阅读 11
更新于 2024年11月21日
是依靠KEGG,去看最显著的那些,或者你感兴趣的那几条通路,从中选择1-2条通路深入地看。
生物公司会提供这些,但是前提你送样,他们出报告返回数据之前跟联系你的人沟通好,有哪些问题要问清楚,比如,最终结果,你是按什么条件筛选差异表达基因,是按2被的差异还是?倍,是根据Pvalue还是Pvalue-adjust筛选,阈值选择不一样,后面返回结果文件时,你还需要重新筛选,有点费时间,所以建议类似这些问题考虑清楚,不懂的一定要请教你的师兄师姐。
差异基因中找不到关注的基因,如何解决?
---云分析平台之GSEA富集分析
组学研究中,有时我们会遇到这样的情况:GO/KEGG富集分析中出现了我们比较感兴趣的通路,但是却找不到预期关注的基因。进一步检查发现关注的基因甚至不在差异基因列表里!究其原因,竟然是关注的基因在组间的表达差异不显著。在反复检查,排除掉实验和分析问题后,我们不得不作出抉择:更换靶标基因(意味着前期的分子实验可能打水漂了)?调整分析参数(得衡量可接受度,阈值放宽后也不一定出的来)?重新再做实验(时间成本高,结果可能还和这次一样)?那么,还有其它的可行策略么?有!不妨试一下GSEA富集分析。
富集分析方法对比
富集分析GO/KEGGGSEA差异需要人为设定阈值(通常P Value<0.05,|FC|>2)筛选差异基因,重点关注差异基因在GO term或KEGG pathway中的富集情况。因此,适用于组间表达变化较大的基因。最终从差异表达-功能/通路富集角度解释生物学问题。不需要设定阈值筛选差异基因,兼顾表达差异不显著但却有重要生物学意义的基因。基于基因表达数据,评估特定基因集与其中一种生物学状态的显著相关性。最终从基因集(而非单个基因)的协同变化角度解释生物学问题。对于时间序列数据或定量属性的样本,GSEA优势明显。基因集富集分析(Gene Set Enrichment Analysis,GSEA),是一种基于基因表达数据的计算方法,用于确定先验定义的一组基因是否在两种生物学状态之间显示出统计学上显著的一致性差异。这里,需要重点解释一下:首先,“先验定义的一组基因”指的是进行GSEA富集分析需要先提供一个基因集,可以使用GSEA自带的MSigDB数据库中定义的基因集或者进行自定义,基因集中包含关注的基因。其次,“两种生物学状态”可以简单理解为分组信息,比如实验组和对照组,通常和表型密切联系。最后,“一致性差异”指的是基因集中的基因在两种生物学状态中呈现出的协同变化趋势,或者说基因集整体的表达模式更接近于哪种生物学状态。总的来说,进行GSEA富集分析,我们需要提供基因表达矩阵、分组信息和定义的基因集。随后,依据与生物学状态的关联度(即排序指标,比如FC、P Value等),生成基因排序列表。接着,从上到下遍历排序列表中的基因,如果当前基因也存在于定义的基因集中,则增加富集分数。如果不存在,则减少富集分数。增加/减少富集分数的多少由排序指标决定。生成的富集分数折线图中最高峰顶或最低峰谷位置的富集分数作为基因集的富集得分,富集得分反映基因集在两种生物学状态中的协同趋势(上调/下调)。而基因集中包含的基因在排序列表中的位置分布(上端富集/底层富集)展现了基因集与哪种生物学状态更相关。
GSEA
我司云工具已超过100种,并可实现快速查找。云文件中数据1次上传即可反复使用,并且支持多种工具同时调用。云任务中可实时追踪任务状态。云工单可随时提交问题和建议。康测云分析平台极大地提高了科研效率,让客户省心省力。