医学统计学八大核心概念

清楚了解医学统计学中的核心概念是后续正确运用统计学方法进行数据分析的基础,本文将对医学统计学的八大核心概念做一个简单的总结。

注:本文整理自梦特医数通的一篇文章(文末附链接),目的是对涉及到的概念进行简单列举和结构化描述,适用于有一定医学统计学基础的同学,可根据这份简单的提纲进行主动回想,加深理解与记忆。如果对本文列举的概念没有基本的认识、或者在回想时遇到困惑,建议查看原文详解。

一、总体与样本

总体(population):根据研究目的确定的同质研究对象的集合,可分为有限总体和无限总体。

概念举例
有限总体在空间、时间、人群范围上明确限制的观察单位。某地区近10年一年级男生的身高
无限总体没有上述限制,仅理论上存在所有糖尿病患者

样本(sample):从总体中抽取的具有代表性的研究对象的集合。全部观察单位数称为样本含量。


二、同质与变异

概念性质举例
同质(可比性)研究的某些特征或者对研究对象的处理因素相同相对性,不存在绝对的同质,也不存在绝对的可比造模时的”假手术组“
变异观察单位在同质基础上的个体差异绝对性,不存在一模一样的患者每只小鼠的个体特征不同

三、参数与统计量

参数(parameter)

参数是用于描述总体特征的指标,通常用希腊字母表示,如总体平均数(μ)、总体标准差(σ)、总体率(π)等。总体参数往往是未知的,需要通过样本的统计量去推断描述。

统计量(statistics)
是用于描述样本特征的指标,常用英文字母表示,如样本平均数( 𝑥― )、样本标准差(s)、样本率(p)等。除此之外,还有一些统计分析过程中产生的统计量,如用于统计检验的z值、t值、X² 值、F值等。

四、误差

误差(error):是指观察值与实际值之差,可分为三类:

原因举例是否可避免如何减小
随机误差偶然因素抽样误差不可避免增加测量次数
系统误差固有因素仪器未调零可避免仪器校准、严格操作流程、做好质控
非系统误差操作失误抄错数字可避免仔细核对

五、随机化

随机化(randomization):是指研究对象被选择、被分配到不同组别或被施加干预措施的概率相等,包括随机化抽样、随机化分组和随机化顺序

概念分类
随机化抽样从总体中选择样本时,每个被抽到的几率相等简单随机抽样、系统/机械随机抽样、分层随机抽样、整群随机抽样、多阶段抽样
随机化分组纳入的研究对象,被分配到各个研究组的几率一样
随机化顺序进行交叉试验时,随机化分组后的研究组接受不同干预措施的顺序是随机的

六、频率和概率

频率(frequency):是指事件出现的次数与总试验次数之比。

概率(probability):是反映随机事件发生可能性大小的指标,介于0与1之间。

七、变量

变量(variable):是指观察单位的某些特征,如调查对象的年龄、体重、血型等。
可分为以下几类:

别名定义举例分类
计量资料定量资料、数值变量通过测量某项指标的大小而获得的资料,一般有度量衡单位,可比较大小身高(cm)、体重(kg)、血压(mmHg)等连续型;离散型
计数资料定性资料、无序分类资料、名义变量通过观察单位某种属性或类别分组计数后得到的资料,表现为互不相容的属性或类别性别(男、女)、血型(A、B、AB、O)
等级资料半定量资料、有序分类资料按照观察对象的某种属性的不同程度分成等级后分组计算、分类汇总各组观察单位数后得到的资料,具有半定量性质,表现为等级大小或属性程度学历(文盲、小学、初中、高中、大学、研究生及以上);治疗效果(治愈、显效、好转、无效)

这里是我之前学理论课的时候感觉最难、最抽象的部分,一个原因是复杂的定义对我而言根本记不住,也不好理解;另一个原因是别名太多,容易记混。相对于抽象的定义,记忆具体的示例似乎更容易一些。所以就像背单词我一般只背词根词缀、感情色彩和主要词义。这部分我只记了具体例子和第一个名称,如果有小伙伴和我有一样的问题,可以参考我的学习方法。

八、因素和水平

概念举例注意事项
因素可能对研究结局产生影响的变量研究年龄对激素分泌的影响时,年龄就是因素;研究激素对某种疾病的影响时,激素就是因素某个变量是否为因素是相对于研究目的而言的
水平因素的不同等级或分类学历可有“文盲”、“小学”、“初中”、“高中”、“大学”、“研究生及以上”多个水平;性别有“男性”、“女性”两个水平

整理自:https://mengte.online/archives/173