你必须知道的医学统计基础
一.统计学框架
统计学包括两大类:描述统计和推断统计,其中推断统计又包括假设检验和统计估计。
1.描述统计(descriptive statistics),又称叙述统计,是统计学中,来描绘或总结观察量的基本情况的统计总称。其与推论统计相对应。
2.推断统计学(或称统计推断,statistical inference),指统计学中,研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。更概括地说,是在一段有限的时间内,通过对一个随机过程的观察来进行推断的
二. 统计常用概念
1. 标准差(standard error, SE):衡量抽样误差大小的指标,表示多次抽样结果的偏差;
理论上,应该通过多次抽样,根据多次抽样的结果计算标准差(SE),但实际中,很难实现多次抽样,因此只能利用一次抽样的结果来推算标准差,
2. 标准差(standard deviation, SD): 描述某一次抽样,数据对均数的偏离,SD = 方差的平方根,也叫均方根;
3. 方差(variance): 描述某一次抽样,数据对均数的偏离,计算公式
tips
1.集中程度:平均数、中位数、众数;离散程度:标准差、方差。 2.正态分布:\(mean\pm SD\) 非正态分布: median(25%,75%)
三:变量类型
1. 按照研究属性进行分类
自变量(independent), 因变量(dependent), 控制变量(controlled), 因素(factor)
2. 按照测量尺度
定性变量(分类变量): 次序变量(带有等级顺序,BIRADS分级),无序变量(性别) 定量变量:离散变量(脉搏,血压【等间隔】),连续变量(身高,体重【任何精度】)
tips
连续变量转为分类变量后,一定会损失一部分信息,但是在有些情况下,可以考虑转换,比如:CEA, PSA, BMI指数等等