原来聚类分析有软硬,且看中国分型糖尿病
关于糖尿病的分型,在既往的文章中反复多次提到过「基于六种不同变量将糖尿病分成五个亚组」这篇文章【Lancet Diabetes Endocrinol.2018 May;6(5):361-369.】,该篇研究基于【GAD抗体,BMI,诊断时年龄,HbA1C,HOMA-β功能,HOMA-IR】等六种变量进行的聚类分析(硬聚类),将糖尿病分成五个亚组,并验证了不同亚组微血管并发症的不同进展轨迹。
然而,由于队列研究中的数据均来自北欧研究,因此这种新分类在中国和美国人群中的效用尚不清楚。因此为了验证这种「糖尿病聚类分型」是否适用于中国和美国糖尿病患者,作者在二大横断面研究数据库中进行验证。
1.中国国家糖尿病和代谢紊乱研究(CNDMDS 2007 - 08年):新诊断糖尿病患者【n=2316名】
2.美国国家健康和营养检查调查(NHANES III 1988-94年):新诊断糖尿病患者【n=685名】
糖尿病的五种分类
1.自身免疫性糖尿病:SAD
2.胰岛素缺乏型糖尿病:SIDD
3.胰岛素抵抗型糖尿病:SIRD
4.肥胖相关的糖尿病:MOD
5.年龄相关性糖尿病:MARD
另外,其实还有一种「软聚类」的分析方法,根据遗传位点将疾病进行聚类分析,并且探究了鉴定的基于遗传位点的新聚类亚群,是否具有更广泛的临床意义【PLoS Med.2018 Sep 21;15(9):e1002654.】
我们暂且先看看中国分型的数据,在文后我们再介绍「软聚类」分型的研究结果。
中国研究分型结果
研究者使用k-means分析将数据基于以下五个变量分为四组【未考虑自身免疫性糖尿病】
关于糖尿病的分型,在既往的文章中反复多次提到过「基于六种不同变量将糖尿病分成五个亚组」这篇文章【Lancet Diabetes Endocrinol.2018 May;6(5):361-369.】,该篇研究基于【GAD抗体,BMI,诊断时年龄,HbA1C,HOMA-β功能,HOMA-IR】等六种变量进行的聚类分析(硬聚类),将糖尿病分成五个亚组,并验证了不同亚组微血管并发症的不同进展轨迹。
然而,由于队列研究中的数据均来自北欧研究,因此这种新分类在中国和美国人群中的效用尚不清楚。因此为了验证这种「糖尿病聚类分型」是否适用于中国和美国糖尿病患者,作者在二大横断面研究数据库中进行验证。
1.中国国家糖尿病和代谢紊乱研究(CNDMDS 2007 - 08年):新诊断糖尿病患者【n=2316名】
2.美国国家健康和营养检查调查(NHANES III 1988-94年):新诊断糖尿病患者【n=685名】
糖尿病的五种分类
1.自身免疫性糖尿病:SAD
2.胰岛素缺乏型糖尿病:SIDD
3.胰岛素抵抗型糖尿病:SIRD
4.肥胖相关的糖尿病:MOD
5.年龄相关性糖尿病:MARD
另外,其实还有一种「软聚类」的分析方法,根据遗传位点将疾病进行聚类分析,并且探究了鉴定的基于遗传位点的新聚类亚群,是否具有更广泛的临床意义【PLoS Med.2018 Sep 21;15(9):e1002654.】
我们暂且先看看中国分型的数据,在文后我们再介绍「软聚类」分型的研究结果。
中国研究分型结果
研究者使用k-means分析将数据基于以下五个变量分为四组【未考虑自身免疫性糖尿病】
诊断年龄
BMI
HbA 1c(或者平均血浆葡萄糖)
稳态模型评估2估计β细胞功能(HOMA2-B)
稳态模型评估2胰岛素抵抗估计(HOMA2-IR)
HOMA2-B和HOMA2-IR计算,基于HOMA计算器
NHANES III研究:基于FPG和C肽
CNDMDS研究:基于FPG和胰岛素
CNDMDS和NHANES III中的四个聚类,概括了Ahlqvist 及其同事观察到的聚类的基本表型:
1.年龄相关性糖尿病【MARD】;
将近占了一半,二大研究中分别为45.1%【中国】,45.4【美国】,该组存在轻度代谢紊乱【血糖,BMI,胰岛素抵抗和β细胞功能】
2. 轻度肥胖相关糖尿病【MOD】;
是第二大亚组,分别为32.7%【中国】,32.4%【美国】,患者群体中BMI最高,但平均血糖,β细胞功能和胰岛素抵抗最低。
3. 严重胰岛素缺乏型糖尿病【SIRD】;
第三大亚组,分别为13.5%【中国】和14.3%【美国】,这一亚组特征在于:胰岛素分泌最低,血糖浓度最高。
4.严重胰岛素抵抗型糖尿病;
二个研究中占比分别为:8·6%【中国】,7·9%【美国】,这一亚组人群特征在于:胰岛素抵抗最重,而β细胞功能最佳。
以上数据显示:聚类分析可将两个研究中四个亚型很好地分开,尽管在CNDMDS队列中有轻微的数据干扰。
由于NHANES III参与者的种族和民族范围更广,研究者们进一步按种族划分了数据。结果显示:非西班牙裔白人和非西班牙裔黑人表现出类似的群体分布,与墨西哥裔美国人群和NHANES III总人群的分布不同。但是每个亚组人群的特征与NHANES III总体上一致。
(A) 中国研究 【CNDMDS】 (B) 美国研究【NHANES III】 SIDD =严重胰岛素缺乏型糖尿病,SIRD =严重胰岛素抵抗型糖尿病,MOD =轻度肥胖相关型糖尿病,MARD =年轻相关性糖尿病。HOMA2-B = 基于模型β-cell功能评估,HOMA2-IR基于稳态模型的胰岛素抵抗评估。
通过使用中国和美国研究数据,很好的验证了Ahlqvist及其同事提出的新型糖尿病亚组,提示这种以欧洲为导向的糖尿病分类在不同种族和人群中可能具有普遍性。可能由于不同的种族和参与者抽样,不同种族中亚族的群体分布有所不同,但亚群中个体特征在所有种族中都是相似的。
除了严重胰岛素抵抗型糖尿病【SIRD】,在中国研究数据中,显示人群均较年轻,而在欧美研究数据中则年龄较大。这种差异除了与评估指标是用替代参数评估以外,可能部分归因于胰岛素抵抗与西方国家的年龄呈正相关,但在CNDMDS研究中,与年龄呈负相关。
另外,需要注意有一点不足的是:研究中并未分析自身免疫性糖尿病的分布【SAD】,原因是我们无法明确合并谷氨酸脱羧酶抗体(GADA)阳性的糖尿病患者。然而,流行病学调查显示:GADA阳性的2型糖尿病患病率在中国和美国分别为:5·9%和4.7%,而在基于人群的筛查中这个比例甚至可能更低,因为患有GADA阳性糖尿病的患者通常由于其急性糖尿病并发症而被诊断。
另一个不足是:不得不选择平均血浆葡萄糖,HOMA2-B和HOMA2-IR来作为评估HbA 1c,HOMA2-B 和HOMA2-IR的替代指标,因为在CNDMDS中测量的参数有限。
这仅是一项横断面研究,仅调查了新诊断糖尿病的患者,但未纳入没有糖尿病前期阶段或长病程的糖尿病患者。因此,这种基于大数据的聚类分析仅提供了有关新诊断患者的信息,无法提供有关长期并发症的信息。为了进一步检验我们研究中的聚类是否与原始欧洲研究具有相同的临床结果,我们应进行前瞻性研究。
软聚类分型研究结果
PLoS Med. 2018 Sep 21;15(9):e1002654.
该研究尝试明确基于生理的遗传学方法是否可用于解构T2D异质性。与其他生物标志物不同,遗传标志物不随疾病进展或治疗而改变。而通过对疾病过程中或治疗后的不同时间分析相同变量可能会产生不确定的结果,正如Ahlqvist教授的研究中基于六种变量。因此该研究拟根据遗传位点将疾病进行聚类分析,并且探究了鉴定的基于遗传位点的新聚类亚群,是否具有更广泛的临床意义。
研究中使用贝叶斯非负矩阵分解(bNMF)聚类分析方法,从基于GWAS的94个独立的T2D遗传变异和47个糖尿病相关性状的遗传位点中,在28种细胞类型的表观基因组数据的分析中确定了基于T2D遗传位点和性状簇的五种聚类亚型,每个聚类亚型具有不同的组织特异性增强子富集。
研究结果显示:基于遗传位点的新聚类亚群,能够很好的解构T2DM的异质性,为T2DM的精准分类和治疗提供了一个方向。尽管如此,因为GWAS鉴定的100多个T2DM基因位点,大部分是在欧洲人群中发现的。其中大约50%已经在东亚人群中被成功证实。
而在中国汉族人群研究中发现,只发现10余种与T2D相关【Diabetes. 2018 Jan;67(1):3-11.】,而且不同基因位点的权重或GRS阈值在各种族人群是不一样的。因此,可能需要有针对中国人群T2D相关的特定基因的分析。
聚类分析中的遗传位点
1.Beta Cell:
MTNR1B, CDKAL1, C2CD4A, HHEX, TCF7L2, SLC30A8, CDKN2A_B, CDC123.CAMK1D, HNF1A, AP3S2, ZHX3, UBE2E2, ACSL1, PRC1, GIPR HNF1B,KCNJ11, KCNQ1_2, ABO, ANK1, GLIS3, GLP2R, CTRB2, CDKN2A_2 DUSP8, ADCY5, GIP, HNF4A, HSD17B12 TLE4.
2.Proinsulin:
ARAP1, SPRY2, DGKB_2, IGF2BP2, CCND2, HNF4A, CDC123.CAMK1D.
3.Obesity:
FTO,MC4R, NRXN3, HSD17B12, RBMS1.
4.Lipodystrophy:
IRS1, GRB14, PPARG, LYPLAL1, ANKRD55, CMIP, KLF14, LPL, ANKRD55_2, ARL15, ADCY5, C17orf58, POU5F1,MACF1, ZBED3, KIF9, ADAMTS9,CCND2, FAF1, MPHOSPH9.
5.Liver:
GCKR, CILP2, HLA.DQA1, PNPLA3, TSPAN8.LGR5.
β细胞功能降低相关的二种聚类亚型:
分别为「β细胞」和「胰岛素原」
区别于其它亚型的特点是低C肽水平。
其他三个聚类显示出胰岛素抵抗的特征:
肥胖介导:高BMI和腰围
脂肪营养不良:低BMI,脂联素和HDL-C,高TG
肝脏脂代谢异常:低TG
图1. 不同聚类的特征
a:聚类「GRS-特征」关联的标准化效应大小
b:GRS与T2D多种特征的相关性
c:GRS处于前十分位的不同聚类特征
图2:不同聚类亚型存在组织特异性增强子的富集
聚类亚型中遗传风险评分(GRS)与临床结局的关联
CAD风险:β细胞聚类,脂肪营养不良聚类
缺血性卒中风险:β细胞聚类
血压:脂肪营养不良聚类
eGFR:肝脏脂代谢异常聚类
UACR:脂肪营养不良聚类
CKD风险【 eGFR < 60】:无
参考文献:
1:Lancet Diabetes Endocrinol. 2018 May ;6(5): 361-369. doi: 10.1016/S2213-8587(18)30051-2.
2:PLoS Med. 2018 Sep 21;15(9):e1002654. doi: 10.1371/journal.pmed.1002654.
3:PLoS Med. 2018 Sep 21;15(9):e1002654. doi: 10.1371/journal.pmed.1002654.
4:Diabetes. 2018 Jan;67(1):3-11. doi: 10.2337/dbi17-00
扫码关注“医咖会”公众号,及时获取最新重磅研究!