1.1 医学统计核心概念

1.1.1 总体与样本

1. 总体

总体(population)是指根据研究目的所确定的观察单位某项特征的集合。比如我们想研究某大学所有在校学生的平均体重,根据此目的,我们研究的总体就是该大学所有在校学生的体重数据的集合。但是需要注意,总体分为有限总体和无限总体,上面的例子就是有限总体,毕竟该大学的学生数量是有限的,然而科研过程中大多数情况下面临的是无限总体,如茫茫宇宙中星体的平均质量;空气中某种物质的浓度等,我们是无法取得其总体进行研究的,那我们面对无限总体时该怎么办呢?

古人云:“君子生非异也,善假于物也。”意思是聪明的人并不是本质上就与一般人不一样,只不过善于利用某种工具罢了。因此,我们为了研究无限总体,发明了抽样的方法,就像我们想知道一锅老母鸡汤的咸淡,并不需要喝完所有的汤,只需要充分摇匀,尝其一勺就可以了,这种思想就叫“抽样”。

2. 样本

样本(sample)就是从总体中抽出的部分观察单位某项特征的集合,但是在抽样过程中应当遵守随机化的原则(random principle)。我们通常通过研究样本来推断研究总体的属性与特征,去探索事物背后的规律和本质。

生活中处处存在抽样的思想,如“一叶知秋”“豹窥一斑”“尝鼎一脔”“以小见大”,“3·15质量抽检报告”等。

抽样除了要求有代表性,还要达到一定的样本量,因为只有足够的样本,得到的统计量才会稳定,才能代表真正的总体。