2023年11月3日,《欧洲心脏病学杂志》(EHJ;IF=39.3)发表了一篇针对孟德尔随机化的综述,医咖会对这篇综述进行了梳理,近期我们已推送了三篇内容:
1. 什么是孟德尔随机化研究?
今天我们继续聊一聊孟德尔随机化(MR)研究在实操过程中需要考虑的一些问题,例如:如何选择遗传变异?如何分析数据?如何考虑其他危险因素?
单样本或双样本MR研究?
在单样本MR研究中,遗传变异-危险因素关联和遗传变异-结局关联来自同一个体,而在双样本MR研究中,这些关联来自彼此独立的研究人群。例如,一项关于血钙水平和冠心病风险的双样本MR研究,可能包括一项研究中与血钙遗传关联的汇总数据,以及另一项研究中与冠状动脉疾病遗传关联的数据。
双样本设计的一个优点是,统计功效通常更强,因为可以使用来自大规模全基因组关联研究(GWAS)联盟的现有汇总数据。双样本设计要求两个样本代表相似的基础人群,因为在第一个样本中识别出的与危险因素相关的遗传变异,在结局数据集中也应该是危险因素的可靠预测因素。
如果两个样本中的年龄、性别或其他特征不同,那么这一假设可能就不成立了。例如,在仅包含吸烟者的GWAS分析中与吸烟严重程度相关的遗传变异,在主要由非吸烟者组成的人群结局数据中,就不适合作为MR分析的工具变量。理想情况下,两个样本中也不应该有重叠的人群,因为重叠的病例会使MR估计在观察关联的方向上产生偏倚,特别是当遗传与危险因素的关联不强时。
使用汇总数据的缺点是依赖于其他研究团队报告的GWAS结果的有效性,并且降低了MR分析的灵活性。使用个体水平的数据可以进行更全面的分析,例如非线性MR分析或对特定亚组(例如仅在吸烟者中)的分析。可用于双样本MR分析的全基因组关联研究数据,会公开许多表型和疾病结局。表1列出了一些与CVD研究相关的大规模GWAS研究的实例。
表1、与CVD研究相关的GWAS研究实例
如何选择遗传变异?
在MR分析中,有两种典型的遗传变异选择策略。遗传变异的选择可以基于生物学原理,也可以包括与危险因素相关的所有独立遗传变异,而不考虑其生物学功能。
例如,探讨饮酒与CVD关联的MR研究,要么使用了在酒精代谢中起关键作用的酶的编码基因变异,要么使用了与饮酒相关的所有独立遗传变异,在大型联盟数据中具有全基因组显著性水平。
酒精(乙醇)在肝脏中通过两个步骤代谢:首先通过乙醇脱氢酶,其次通过乙醛脱氢酶。这些酶的编码基因区域的遗传变异会影响饮酒行为,因为这两步反应的中间产物(即乙醛)的积累,达到足够的浓度时,会产生不适,如面部潮红、脉搏加快和皮肤温度升高。MR研究表明,乙醇脱氢酶或乙醛脱氢酶的编码基因区域的一个或多个遗传变异所导致的较高的酒精摄入量,与较高的收缩压、以及CVD和卒中风险增加相关。
饮酒行为和许多其他表型是多基因的,这意味着它们受到许多基因变异的影响。当多种遗传变异作为工具变量可用时,结合个体水平的数据,可以将这些遗传变异组合成多基因评分,即基因型对多种遗传变异的加权总和,该评分随后可以作为工具变量使用。在基于汇总数据的两样本MR分析中,每个变异都提供了自己的MR比率估计,该估计是通过对它们进行加权平均来组合的。与MR分析酒精代谢基因变异所代表的饮酒量类似,一项双样本MR分析结果显示,由94种基因变异所代表的较高饮酒量与较高的收缩压和卒中风险相关。
这两种选择遗传变异的策略各有不同的优势和局限性。使用对危险因素具有明确生物学作用的少数遗传变异的优势是,产生多效性效应的可能性通常较低。例如,在英国生物样本库中,包含与饮酒相关的所有遗传变异的工具与吸烟易感性相关。
使用与危险因素相关的所有遗传变异的一个优势是,随着用作工具变量的遗传变异数量的增加,危险因素的变异比例增加,统计学功效可能更大。此外,当有许多遗传变异可用时,可以采用敏感性分析来检验MR假设。
确认删除