总结|医学统计学中的基本概念

2023/8/22 18:04:27　阅读：164　发布者：

医学统计学中的基本概念

一、同质与变异

同质(homogeneity)是指根据研究目的所确定的观察单位其性质应大致相同。观察单位是研究的基本单元，可以是一个人、一个地点、一只动物、一份生物样品等。

然而，即使性质相同的事物，如果观察同一指标，各观察单位之间由于存在个体差异，也会使测量结果不同，这种差异称为变异(variation)。

同质即为观察单位所受的影响相同。

变异即为在观察单位在同质基础上的个体差异。

例如，同种族、同年龄、同性别的健康人，在相同的条件下测其脉搏、呼吸、体温等生理指标均可能存在很大的差异。

思考：案例：某年某地健康成年女子的雌性激素水平。同质性？变异性？

统计喵

二、数据类型

变量（variable）：反映实验或观察对象生理、生化、解剖等特征的指标。

变量值（variable value）：变量的观测值，亦称为数据（data）。

统计喵

1.定量数据也称计量资料。变量的观测值是定量的，其特点是能够用数值大小衡量其水平的高低，一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。连续型定量数据具有无限可能的值，例如身高、体重、血压、温度等。离散型定量数据通常只能取正整数，例如家庭成员数、脉搏、白细胞计数等。

特点：（1）有单位；（2）有数值大小

2.定性数据也称计数资料。将观察对象按某种性质、类别或属性进行分组，然后清点各组的例数所得到的资料。

变量的观测值是定性的，表现为互不相容的类别或属性。通常情况下，定性数据指类别（属性）之间没有程度或顺序上的差别，它可以进一步分为二分类和多分类，如性别分为男和女，血型分为A 、B 、0 、AB等。

特点：（1）分组组数≥2组；（2）各组无优劣（好坏、高低）之分

3.有序数据也称半定量数据或等级资料。变量的观测值是定性的，但各类别（属性）之间有程度或顺序上的差别，如尿糖的化验结果分为－、+、＋＋、＋＋＋，药物的治疗效果按照显效、有效、好转、无效分类等。

特点：（1）分组组数≥3组；（2）各组有优劣（好坏、高低）之分，且至少3个等级以上。

统计喵

三、总体和样本

总体（population）是根据研究目的确定的所有同质观察单位的全体，它包括所有定义范围内的个体变量值。

样本（sample）从研究总体中抽取部分有代表性的观察单位，对变量进行观测构成一个样本。

一般而言，进行科学研究直接获取到的仅是样本的统计量而已，可是研究目的却是想获取总体的属性特征，即总体参数。统计学存在的核心价值就在于可以通过描述样本的统计量去推断描述总体的参数，这是通过偶然去发现必然、通过一般去发现普遍的过程。

统计喵

四、误差

误差（error）是指观测值与真实值、样本统计量与总体参数之间的差别。根据误差的性质和来源主要可以分为系统误差( systematic error)、随机测量误差( random measurement error) 和抽样误差( sampling error)几种类型。

1.系统误差有时也称作统计偏倚。系统误差由一些固定因素产生，如仪器未进行归零校正、标准试剂校准不好、测量者读取测量值不准、试验对象选择不合适、医生对疗效标准掌握偏高或偏低等原因。系统误差的大小通常恒定或按照一定规律变化，具有明确的方向性。这类误差可以通过周密的研究设计和测量过程标准化等措施加以消除或控制。

2.随机测量误差在测量过程中，即使仪器初始状态及标准试剂已经校正，但由于各种偶然因素的影响也会造成同一测量对象多次测定的结果不完全相同，这种随机产生的误差称为随机测量误差。实际中，产生随机测量误差的主要原因是生物体的自然变异和各种不可预知因素产生的误差，这种误差往往没有固定的大小和方向，但具有一定的统计规律（如服从正态分布）。随机测量误差不可避免，但可以通过多次测量获得的均数对真实值进行准确的估计。

3.抽样误差抽样误差是随机误差中最重要的一种误差。由于生物的个体变异，从总体中随机抽取一个样本进行研究，所得样本统计量与相应的总体参数往往不相同，这种由于抽样而引起的样本统计量与总体参数间的差异，在统计学上称为抽样误差。抽样误差主要来源于个体的变异，如果没有个体变异，就不存在抽样误差。抽样误差可以用统计方法进行分析，一般来说，样本含量越大，则抽样误差越小，样本统计量与总体参数越接近。

统计喵

五、概率

在统计学上，统计推断的结论都是基于一定概率得出的，习惯上将P≤0.05的事件称为小概率事件，表示在一次试验中发生的可能性很小。如果小概率事件在现实中出现，就要追究其原因。如对两种药物降压效果的差别进行假设检验，由于抽样误差的存在，无论两种药物的疗效是否有差别，两个样本均数之间总会存在一定的差异，这种差异是否由于抽样误差造成，需要通过P值来确定。如果P≤0.05则说明当前试验结果显示的差别是由于“偶然”所致的可能性不足5%, 因此可以做出有差别的结论。

统计喵

参考书目：

《医学统计学》第6版，人民卫生出版社，马斌荣主编，2016年出版

《卫生统计学》第8版，人民卫生出版社，李晓松主编，2017年出版

来源：统计喵

转自：“斐然智达SCI学术服务”微信公众号

如有侵权，请联系本站删除！

上一篇： 样本量的确定依据和计算方法
下一篇： 经验|医学统计中的注意事项

投稿问答最小化 关闭

总结|医学统计学中的基本概念

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

总结|医学统计学中的基本概念

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭