医学统计学八大核心概念

清楚了解医学统计学中的核心概念是后续正确运用统计学方法进行数据分析的基础，本文将对医学统计学的八大核心概念做一个简单的总结。

注：本文整理自梦特医数通的一篇文章（文末附链接），目的是对涉及到的概念进行简单列举和结构化描述，适用于有一定医学统计学基础的同学，可根据这份简单的提纲进行主动回想，加深理解与记忆。如果对本文列举的概念没有基本的认识、或者在回想时遇到困惑，建议查看原文详解。

一、总体与样本

总体（population）：根据研究目的确定的同质研究对象的集合，可分为有限总体和无限总体。

	概念	举例
有限总体	在空间、时间、人群范围上明确限制的观察单位。	某地区近10年一年级男生的身高
无限总体	没有上述限制，仅理论上存在	所有糖尿病患者

样本（sample）：从总体中抽取的具有代表性的研究对象的集合。全部观察单位数称为样本含量。

二、同质与变异

	概念	性质	举例
同质（可比性）	研究的某些特征或者对研究对象的处理因素相同	相对性，不存在绝对的同质，也不存在绝对的可比	造模时的”假手术组“
变异	观察单位在同质基础上的个体差异	绝对性，不存在一模一样的患者	每只小鼠的个体特征不同

参数(parameter)：

参数是用于描述总体特征的指标，通常用希腊字母表示，如总体平均数(μ)、总体标准差(σ)、总体率(π)等。总体参数往往是未知的，需要通过样本的统计量去推断描述。

统计量(statistics)：
是用于描述样本特征的指标，常用英文字母表示，如样本平均数( 𝑥― )、样本标准差(s)、样本率(p)等。除此之外，还有一些统计分析过程中产生的统计量，如用于统计检验的z值、t值、X² 值、F值等。

误差(error)：是指观察值与实际值之差，可分为三类：

	原因	举例	是否可避免	如何减小
随机误差	偶然因素	抽样误差	不可避免	增加测量次数
系统误差	固有因素	仪器未调零	可避免	仪器校准、严格操作流程、做好质控
非系统误差	操作失误	抄错数字	可避免	仔细核对

随机化(randomization)：是指研究对象被选择、被分配到不同组别或被施加干预措施的概率相等，包括随机化抽样、随机化分组和随机化顺序。

	概念	分类
随机化抽样	从总体中选择样本时，每个被抽到的几率相等	简单随机抽样、系统/机械随机抽样、分层随机抽样、整群随机抽样、多阶段抽样
随机化分组	纳入的研究对象，被分配到各个研究组的几率一样
随机化顺序	进行交叉试验时，随机化分组后的研究组接受不同干预措施的顺序是随机的

频率(frequency)：是指事件出现的次数与总试验次数之比。

概率(probability)：是反映随机事件发生可能性大小的指标，介于0与1之间。

变量(variable)：是指观察单位的某些特征，如调查对象的年龄、体重、血型等。
可分为以下几类：

	别名	定义	举例	分类
计量资料	定量资料、数值变量	通过测量某项指标的大小而获得的资料，一般有度量衡单位，可比较大小	身高(cm)、体重(kg)、血压(mmHg)等	连续型；离散型
计数资料	定性资料、无序分类资料、名义变量	通过观察单位某种属性或类别分组计数后得到的资料，表现为互不相容的属性或类别	性别(男、女)、血型(A、B、AB、O)
等级资料	半定量资料、有序分类资料	按照观察对象的某种属性的不同程度分成等级后分组计算、分类汇总各组观察单位数后得到的资料，具有半定量性质，表现为等级大小或属性程度	学历(文盲、小学、初中、高中、大学、研究生及以上)；治疗效果(治愈、显效、好转、无效)

	概念	举例	注意事项
因素	可能对研究结局产生影响的变量	研究年龄对激素分泌的影响时，年龄就是因素；研究激素对某种疾病的影响时，激素就是因素	某个变量是否为因素是相对于研究目的而言的
水平	因素的不同等级或分类	学历可有“文盲”、“小学”、“初中”、“高中”、“大学”、“研究生及以上”多个水平；性别有“男性”、“女性”两个水平

整理自：https://mengte.online/archives/173