生物信息学分析之如何看懂火山图?

火山图(Volcano plot)是散点图的一种,它将统计测试中的统计显著性量度(如p-value)变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(代谢物等)。

用途

展示差异表达的基因,常常出现在芯片、测序等组学检测技术的结果中。

基本概念

  • P-value、adjusted p-value:这两个概念很常见,一般P-value的阀值设为0.05,小于0.05即说明某个基因在比较分组之间的表达差异是足够显著的;adjusted p-value即经过统计学方法校正后的p-value,统计学上常用的校正方法包括“BH”、“FDR”等。
  • Fold Change:表示两个分组之间的差异倍数,其绝对值越大说明某基因在两组之间的表达差异也越大。该值为正时,表示差异上调;该值为负时,表示差异下调。画图时,一般转换为log2Fold Change,使展示更直观。关于log处理,在生信数据中经常出现,一般来说,表示倍数关系时,常常会将数据进行对数转换。

如何看懂

小小口诀:横着看差异,竖着看(统计学)意义。

一般来说,在图中会有三条线,分别是X=-1,X=1,Y=1.30。

X=-1即表示表达下调了2倍

X=1即表示表达上调了2倍

Y=1.30即为-log10(0.05)

下图可以帮助大家快速get要义:

https://dr2pp.oss.ns-svc.cn/9F/9FC3/9FC3VeyiSZTwEJc9XzCx.png以上内容来自: https://mp.weixin.qq.com/s/-ux-xtvOYNLR8ny2xlVPnQ