1、简介
z 检验一般用于比较样本平均值差异性。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
对比平均值的差异性,包括一组数据与某数值的差异性或两组数据的平均值差异性,可使用 t 检验或 z 检验,二者区别在于小样本(n <30)只能使用t 检验;而大样本时(n >30)可使用 z 检验或 t 检验。
2、理论
统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策。
单样本 z 检验:比较一组数据与某数值的差异性。单样本 z 检验使用总体均值= 假设值 m 的原假设,并针对备择假设检验,备择假设可以是左尾、右尾或双尾。例如,抽取100个样品,标准差为8g,调查一家食品企业的罐装食品标准重量是不是 100g。
两样本 z 检验:比较两组数据的平均值差异性。例如,比较两个地区居民体重数据,分析两个地区体重是否有明显差异。原假设是:两地区的平均体重相同。
无论是单样本 z 检验,还是两样本 z 检验,均是对比数据的差异性,区别在于单样本 z 检验和一个已知数字进行对比;两样本 z 检验进行两组数据的均值差异对比。
进行 z 检验时,需要输入三项数据,分别是平均值,标准差和样本量。除此之外,z 检验还需要知道以下三个术语,分别是对比均值、置信水平和假设检验:
对比均值(差值对比):两样本 z 检验时,对比数字是指两组数据均值差,与某个数字进行对比,通常情况下是0(即两组数据平均值差值,与数字 0 进行对比PK)。
置信水平:指在多大程度上对假设有把握,通常为95%,可选为99%和90%。
假设检验:原假设是等于,小于,还是大于,通常情况下等于(即直接对比是否相等,即是否有差异)。
3、 z检验的适用情形
在基于单样本的总体均值的检验中,在下列两种情形下,可适用 z 检验:
取样的总体服从正态分布且方差已知,此时的 z 统计量为
取样的总体的方差未知,但样本量足够大,此时的z统计量为
上面式子中,σ 为已知的总体标准差,S 为样本标准差,μ0 为假设的总体均值。
4、步骤
检验实验组和对照组的平均数()有没有差异,步骤为:
建立虚无假设,即先假定两个平均数之间没有显著差异,
通过统计运算,确定假设H0成立的P值;
根据P值的大小,判断H0是否成立。
具体如下:
第一步:建立虚无假设,即先假定两个平均数之间没有显著差异,
第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法:
检验一个样本平均数与一个已知的总体平均数的差异是否显著。其Z值计算公式为:
检验两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式:
第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据 Z 值与差异显著性关系表作出判断。如下表所示:
第四步:根据是以上分析,结合具体情况,作出结论。
5、理论 z 值
通过 z 值计算公式,得到了一个差异值(单或两样本),如何判断这个差异值有大不大,是否显著呢?
可与理论 z 值比较。
6、均值 z 检验案例
收集某地区100名,20岁男子身高数据,平均身高为168cm,标准差为14cm。资料显示该地区10年前平均身高为165cm,分析当前身高是否明显比10年前更高 ?本案例样本数量为100 > 30,属于大样本,因而可使用z 检验,原假设是:168cm>165cm,只对比一个数字的差异性;此为单样本z 检验。
收集某 A 地区100名,20岁男子身高数据,平均身高为168cm,标准差为14cm。收集 B 地区200名,20岁男子身高数据,平均身高为170cm,标准差为13cm。分析 A 地区和 B 地区身高是否有明显差异?本案例两组数据样本数量均大于30,属于大样本,因而可使用 z 检验,原假设是:168cm=170cm(差值对比为0),只对两组数据的均值差异;此为两样本z 检验。
例如,某项实验,对实验组和控制组的前测和后测的数据分别如下表,比较两组前测和后测是否存在差异:
由于 n >30,属于大样本,所以采用 Z 检验。由于这是检验来自两个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的z检验方法。
计算前测 z 的值:
因为 |Z|=0.658<1.96,所以前测两组差异不显著。
计算后测 z 的值:
因为 |Z|=2.16<1.96,所以后测两组差异显著。
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!