技术交流
扫描二维码
或添加“GeneGroup003”
获取更多更新资讯
商城订购
扫描二维码
或添加“基因商城(GeneMart)”
手机下单,快人一步
售后服务
扫描二维码
或添加“GeneGroup005”
获取更快速售后支持
GSEA基因集富集分析—高阶篇
上期介绍了GSEA数据分析的基础原理,阐述了为什么要做GSEA分析,以及我司的优化的GSEA数据分析的亮点,接着一段视频欣赏重磅升级的GSEA数据网页版的效果!
贝晶升级的GSEA数据分析
亮点一
GSEA分析所有图形的分辨率都是出版级别, 适用于任何高影响因子的杂志。
亮点二
我司GSEA图相比Broad Institute图增加了阴影区域标示零假设分布,这样更容易比较看出p-value的显著性,便于用户更直观比较数据结果的准确性。
亮点三
结合GSEA检出的差异功能集,后续还可以进行其它数据分析,进一步解读转录组下游功能,如在差异基因集中做转录因子分析;并提取转录因子显著富集结果进行激酶底物富集分析,汇总推测得到的Kinase(激酶), TF(转录因子), 在结合DEG(差异基因),以及DEG之间的PPI(蛋白质网络互作)调控关系, 并把它们之间的关系以Arc Diagram图展示(如下图)。
亮点四
贝晶的结果都以html网页版的形式展出,输出为出版级别的矢量图(svg),结合第三方矢量图编辑软件(inkscape等),用户可以把各组样本灵活组合成图,修改样本名称,以及在总的热图中挑选自己关注的基因组合成新的热图,并保存为不同的图片格式。
更后对GSEA中几个关键的概念做个介绍:
ES
富集得分 (ES, enrichment score). 它反应基因集成员s在排序列表L的两端富集的程度,它反映的是将全部芯片数据或测序数据按表达量大小排序后,在此序列的前部或后部一个功能基因集富集的程度。当 ES 值为正,表示某一功能基因集富集在排序序列的前方,当 ES 值为负,表示某一功能基因集富集在排序序列的后方。
计算方式是,从基因集L的个基因开始,计算一个累计统计值。当遇到一个落在s里面的基因,则增加统计值。遇到一个不在s里面的基因,则降低统计值。每一步统计值增加或减少的幅度与基因的表达变化程度(更严格的是与基因和表型的关联度)是相关的。
NES
ES标准化处理的值,为什么要做标准化处理:因为各个功能基因集中所包含的基因数不同,而且不同的功能基因集与要分析的目标基因列表也不同,因此在比较数据集在不同功能基因集中的富集程度时,需要对ES进行标准化处理。
LEADING EDGE
领头亚集。领头亚集中的基因是指对ES 值贡献更大的基因集合。当 ES 为正值时,领头亚集位于 ES值对应排序序列之前,反之,则位于 ES 值对应排序序列之后。领头亚集的出现可说明这些基因在通路中有富集,且这些基因在通路中有共同的表达趋势。
具体情况请联系身边的基因人或直接拨打电话021-67285083