生物信息学分析之如何看懂热图?

用途

热图多用于展示各种基因或RNA在不同样本中的表达,观察其表达模式。在RNA-Seq的相关文章中经常出现。

表现的是一个数值矩阵,热图中的每一个小方格都是一个数值,按照预先设置好的颜色值,给其分配一个颜色。若行为基因,列为样品,则是对应基因在对应样品的表达值;若行和列都为样品,展示的可能是对应的两个样品之间的相关性。

但列和行不是固定的样本或者基因,也可能是药物名称、通路之类的,根据研究对象来选择。

基本概念

  • 聚类:本质上是利用多组值间两两的差异程度或者相似程度作为依据,对多组值进行层吸聚类,以最终得到样本间聚类的远近关系

如何看懂

小小口诀:通过颜色看表达量,通过聚类看关系。

https://dr2pp.oss.ns-svc.cn/EV/EVgO/EVgOBdbcyYqTAwIHRbTe.png


① 就是它的横坐标,代表样本;

② 是它的纵坐标,代表基因,此外还表示红色代表高表达,绿色代表低表达;

③ 是它的主体部分,代表各个基因在样本中的表达情况;

④ 表示这些样本共分为了两类;

⑤ 是对这些基因表达模式的聚类分析的树形图。

以上内容来自: https://mp.weixin.qq.com/s/-ux-xtvOYNLR8ny2xlVPnQ