本文根据汪雅霜的讲座视频整理而成,文稿未经专家本人审阅。
作者简介:
汪雅霜,南京大学教育研究院副教授、硕士生导师,厦门大学教育学博士,南京大学课程与教学研究所副所长,中国高等教育学会教育评估分会副秘书长。曾在美国加州大学洛杉矶分校(UCLA)访学。侧重于运用实证方法来开展学生学习评价、课程与教学设计、教育政策评估等方面研究。主持全国教育科学规划课题、教育部人文社科基金等科研项目。第一作者在《教育研究》、BMC Medical Education等CSSCI或SSCI期刊上发表论文二十余篇,单篇最高被引200多次,多篇被人大复印资料转载。出版《基于I-E-O模型的大学生学习投入度研究》等著作,以副主编身份连续五年发布《江苏省研究生教育年度报告》。
定量研究的方法比较复杂,对零基础作者难度较大。因此除了观看教学视频,还需要阅读大量相关书籍并实际操作。此外,大家需要明确一点,掌握了定量研究的方法不代表我们会写论文,因为定量研究的论文除了体现研究方法,还需要写引言、文献综述、研究假设、研究设计等,这些内容与我们掌握的研究方法没有太大关系,更多考查的是作者的问题意识与理论基础。定量研究不排斥理论,也不排斥阅读大量的经典文献。因此大家不要为了方法而做定量研究。在了解了上述事宜后,本节将为大家介绍定量研究的基本方法之一——探索性因子分析法。
一、探索性因子分析法可用于理顺多维度变量
探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构,并进行处理降维的技术。当量表本身维度未知时,采用探索性因子分析可以确定哪些题项属于哪个维度,也即找维度、做归纳。该方法在教育学问卷调查里十分常见,但在教育经济学里使用较少,因为教育经济学不需要做多个维度,一般只有一个指标,也即一个变量。
之前在《问卷调查法及案例解析》中,我们提到的案例,赵老师将“高中学生英语词汇学习情况调查问卷”分为词汇管理策略和词汇学习策略,其中词汇管理策略又分为四个维度(计划策略、评估策略、选择策略、调整策略),而词汇学习策略则分为六个维度(重复策略、查字典策略、记笔记策略、猜测策略、联想与试用策略),因此该问卷需要用到这种因子分析来进行降维。
如果大家经常做问卷调查,熟练以后只要浏览题目,大概就知道因子分析的结果如何,哪些指标需归为一类,哪些指标会归为另一类。如果能梳理归纳指标,对编写问卷也会有很大帮助,也即问卷调查做得越多,编写问卷会越简单,因此二者相辅相成。
在上节《定量研究的三步数据准备工作》中,我们将图1的12个指标分为三个维度,分别是人际关系、办公环境与工作回报。信效度里最重要的就是结构效度,这三个维度是我们整个问卷的结构效度,那我们能够用数据证实这三个维度吗?如能够证实,则说明问卷的结构效度很好;如不能,说明该问卷的结构效度不高。
二、探索性因子分析法的操作步骤
我们需要在SPSS里做探索性分析。点击图2菜单栏的左侧上方“分析”,然后选择“降维”里面的“因子分析”。之后,把我们要分析的12个题目(见图1)放到图3“变量”里。
点击图4右侧“描述”,就会出现图四左侧的“描述统计”,点击最重要的KMO和Bartlett的球形度检验。如果KMO值大于0.9或大于0.7,说明该数据适合做因子分析。此处注意,很多硕士论文提到“KMO值大于0.7,说明我的调查问卷结构效度较好”,这是不对的。因为KMO值只能代表数据是否适合做因子分析,而结构效度如何需要依据因子分析的结果才能判断,即KMO无法判断结构效度。
点击图5“抽取”,则会出现图5的页面,继续点击“未旋转的因子解”与“碎石图”,“特征值”大于1会自动出现。
点击图6“旋转”,选择“最大方差法”。原理如下:因子旋转可重新分配每个因子所解释方差的比例,使每个变量仅在一个公因子上有较大的载荷,在其他公因子上的载荷较小,从而简化对公因子的解释。
点击图7“得分”选择“保存为变量”。如果有三个因子,那么做完因子分析后会出现三个变量。
点击图8“选项”选择“取消小系数”,即让因子负荷小于0.4的数值不要呈现,这样数据会更直观。然后点击“按大小排序”。
三、探索性因子分析法的结果分析
下面我们来看上述数据的因子结果(图9),KMO值为0.812,球形度检验p<0.05,表明上述数据适合做因子分析。
公因子方差“提取”小于0.2的题目可以直接删除(图10),大部分在0.6左右,所以不需要删除。
经过旋转,有三个因子大于1(图11),表示我们可以得到三个因子。这三个因子能够总共解释变异量的71.738%,说明这三个因子个解释力非常高。
另外,通过碎石图(图12)也可看得出来要提取多少个因子,大于1的只有三个因子。
我们在上节根据字面意思将上述12个指标分为三个维度,现在我们用数据证实了三个维度是合理的。其中小于0.4的数值可以将其隐藏。当然,“工作回报、人际关系、工作环境”可以有不同的命名方式,具体根据问卷情况命名,没有统一标准。
综上,我们就得到了一个比较完美的因子矩阵(图13),与我们预想的三个因子契合,说明该问卷的结构效度较好。
然后在SPSS的变量视图里面会出现三个变量(图14),即FAC1_1、FAC2_1、FAC3_1,这三个变量对应的是工作回报、人际关系、工作环境。
我们可以用标准分的结果进行测量(图15),得到z分数(标准分数),即均值为0、标准差为1的分数。如果该数值为负值,表明低于平均数,正值表明高于平均数。如果负值不好解释,可以将其转化为t分数。
另外,得到这几个因子后,可以将经济收入、社会地位、成就感相加并除以3,然后得到一个1到4分之间的得分。这样的原始分与标准分数误差不会太大。
转自:“科研写作研究所”微信公众号
如有侵权,请联系本站删除!