在过去70年里,研究人员发现了导致癌症的多种因素,包括吸烟、酗酒、肥胖和紫外线照射,职业环境中的致癌物质以及感染因素。但是还有约一半的癌症负担与以上因素无关。
确定致癌原因存在许多困难,包括流行病学研究设计的局限性、混杂因素和因果倒置等问题,以及对罕见癌症的统计能力不足。癌症潜在的原因有可能包括人群中相对普遍存在的因素,如空气污染或水污染,也有可能只和儿童或青少年某个特定时间窗有关。
孟德尔随机化(MR)为克服某些局限性提供了机会,可进一步阐明癌症的潜在原因。MR是一种工具变量分析,将基因变异(例如单核苷酸多态性SNP)作为待研究暴露因素的工具变量。
相对于传统的观察性研究,MR的优势在于,亲代等位基因是随机分配给子代的,从而避免了因果倒置引起的偏倚,混杂因素的影响也更有限。
UK Biobank等大型队列的大规模全基因组数据以及癌症全基因组关联研究(GWAS)的应用,伴随着关键的方法学进展,使得已经可以对大多数癌症与一系列危险因素展开良好的MR分析。例如,糖尿病是新受关注的一个癌症原因,传统的流行病学研究始终对此没有确凿的证据,孟德尔随机化研究的结果阐明了多种癌症和糖尿病的相关性,包括肾癌、胰腺癌和肺癌。
与任何其他研究设计一样,MR研究也有自己的弱点,所以不能孤立地解释MR的研究结果,而应将其视为对其他研究设计的补充。下图详细展示了MR的应用场景(图1)。
图1 孟德尔随机化(MR)对明确癌症病因的帮助
实例:超重相关的癌症负担
研究背景
一项针对观察性数据的综述表明,肥胖会增加13种癌症的风险,证据等级为“充足”。根据队列研究中的癌症特异性相对风险估计,归因于超重和肥胖的癌症人群占比估计为6%,这一比例在未来几十年可能还会上升。在高收入国家,估计超重将会成为仅次于烟草的第二大癌症诱因。
确认删除