本文根据汪雅霜老师的讲座视频整理而成,文稿未经专家本人审阅。
作者简介:
汪雅霜,南京大学教育研究院副教授、硕士生导师,厦门大学教育学博士,南京大学课程与教学研究所副所长,中国高等教育学会教育评估分会副秘书长。曾在美国加州大学洛杉矶分校(UCLA)访学。侧重于运用实证方法来开展学生学习评价、课程与教学设计、教育政策评估等方面研究。主持全国教育科学规划课题、教育部人文社科基金等科研项目。第一作者在《教育研究》、BMC Medical Education等CSSCI或SSCI期刊上发表论文二十余篇,单篇最高被引200多次,多篇被人大复印资料转载。出版《基于I-E-O模型的大学生学习投入度研究》等著作,以副主编身份连续五年发布《江苏省研究生教育年度报告》。
上次我们介绍了定量研究里最重要的收集数据方法之一——问卷调查法(参见《问卷调查法及案例解析》),本节我们将继续介绍另一个收集数据的方法——实验法。需要明确一下,在教育学领域,实验法使用较为广泛,本文仍以英语学习为例,向大家解析实验法的案例。
一、实验法的要素
(一)案例背景
比如,周老师是一位初中的英语教师,他发现有些学生虽然反复背诵单词表,但单词还是记不住、忘得快。该教师从一篇论文中发现,把单词放在一定的情境中记忆效果更好。于是他设想:如果把传统单词表(生词、音标、中文释义)配上情境例句,能否提高学生记单词的效果呢?因此他就有了一个研究问题,也即“单词配中文注释”与“单词配中文注释,附情景例句”这两种呈现方式,哪一种学习效果更好?
(二)研究问题
以前学英语单词时,我们也会面临词汇记忆这一问题。现在新课标更强调学习要有语篇、情境等,那么,新课标提倡的这种方式真的好吗?是否有研究来证实呢?因此我们可以将其分为两个子问题,一是词汇呈现方式对词汇测试总成绩是否有影响?二是词汇呈现方式对词汇分项(翻译题、填空题等)成绩是否有影响?与两个子问题相对应,本研究提出了两个零假设与备择假设。零假设是指,词汇呈现方式对词汇总成绩没有影响、词汇呈现方式对词汇分项成绩没有影响;反之,备择假设就是有影响。我们做定量研究的目的就是为了推翻零假设,证实备择假设。这也是统计学或定量研究的灵魂所在。
(三)研究设计
1.研究对象
本次实验的研究对象是初二年级两个班,每个班有48人。此处注意,我们在选择研究对象时,最好保证两个班的英语成绩无显著性差异。如果一个班成绩很好,另一个班成绩不好,将会失去研究意义。因为学生成绩不好,可能受多个因素影响。因此周老师选择了两个英语成绩相似的班级,为自己开展实验奠定了基础。他将其中一个班作为实验班,采用单词配中文注释加情境例句的方式学习新单词;另一个班作为对照组,仍采用单词加中文注释的方式学习新单词。
2.实验材料与测试工具
实验材料与测试工具可以评估实验结果的好坏。为了反映不同的词汇呈现方式,周老师开发了一套词汇测试题作为测试工具,该测试工具包括三个部分。第一部分是中英文对译,也即根据中文写出英文单词以及根据英文单词写出中文意思。第二部分是填空,给出15个单词(其中5个是干扰词)和10个句子,要求选择正确单词把句子补充完整。第三部分用给出的5个单词造句。总成绩为三个测试分项的得分总和。大家从中可以看出,这三部分测试材料的难度是逐步增加的。
除了研究对象、测试工具,实验材料也很重要。该研究的实验材料为两种词汇的呈现方式(词汇表)。第一种(对照班)是传统的英文单词配中文释义,如exercise n.运动;第二种(实验班)为单词配中文注释加情景例句,如exercise n.运动,并附上一个例句“Jane looks very fit because she does exercise every morning.”通过这种方式来检验哪一种呈现方式效果更好。
3.实验步骤
两个班学生用相同时间(10分钟)完成词汇学习。学生完成之后收回单词表,接着发放测试题,要求学生在20分钟内完成三项测试任务。然而,如果有些学生记忆力很好,那他就能得高分;可有些学生如果记忆力不好,即使用了最新的词汇呈现方式,可能也无法得高分,因此存在很多的干扰因素。鉴于这些干扰因素,周老师在两周后又进行了一次“延时”测试,考试内容与之前相同,但将词的顺序进行了调整。为了避免学生从后两部分获得提示,第一部分单列在一张测试纸上,规定5分钟内做完,待学生做完后再发后两部分试题。
综上,实验步骤包括单堂测试以及延时测试两个步骤,此外还要严格控制词汇的视觉呈现顺序、做题时间,尽可能剔除干扰因素。
4.数据分析
周老师有自己的评分标准,全部答对,可得35分。统计完测试结果后,下一步就是数据整理与录入,将学生总成绩与三个分项成绩录入到SPSS,并比较两组的得分。
(四)结果与讨论
1.总成绩
总成绩结果分为两组(下图),分别为即时测试结果与延时测试结果,我们可以看出p值均小于0.05(由于任何事情都没有百分之百的准确,抽样方式的不同也可能会导致数据出现误差,因此统计学家规定,p小于0.05就表示该结果推翻了零假设)。由此得出,数据结果支持备择假设,也即实验组(使用新的词汇呈现方式)的词汇成绩高于对照组。
在做研究时,如果只呈现总成绩,大家可能会认为“我不做研究也能得到这个结果”。因此我们需要细化结果,以此来回应“加了例句后词汇记忆效果确实更好,但每一个分项的测试结果都如此吗?”。这也是我们实验的研究价值所在。
2.中英文单词对译
我们再来看下各分项的成绩。首先是中英文单词对译(下表),在即时测试中,P值小于0.05,t值为负数,对照组(8.63分)成绩好于实验组(7.30分),也即在该题型即时测试中,加上情境例句后,词汇学习效果并没有表现得更好。但是两周后的结果显示,p值大于0.05,这意味着延时测验在不同的词汇呈现方式上没有显著差异了。实验组(7.08分)的延时测验分数低于对照组(7.24分),这说明新的词汇记忆方式表现不如传统的记忆方式。这与之前设想是不同的,进一步凸显了该实验的研究价值。
3.填空题
我们再来看填空题(下表)。在即时测试中,实验组的得分是7.54分,对照组为5.59分,实验组得分明显高于对照组,且p值小于0.05,说明使用情境例句的词汇呈现方式会让学生做填空题时得到更高的分数。但两周后的测试显示p大于0.05,表明实验组与对照组的结果不存在显著差异,这意味着不同的词汇呈现方式在填空题上有一定的效果,但该效果不可持续。
4.造句
造句对于学生的英语的输出、表达能力等各种语言能力的要求是极高的。如果学生在造句这一题型中得分更高,就能够反映出新的词汇呈现方式可能更有效果。在即时测试中(下表),实验组得分为13.44分,对照组只有9.88分,且p值小于0.05,因此实验组的表现更好。在延时测验中,p值小于0.05,意味着两周之后实验组和对照组也是有显著差异的,因此推翻了零假设。实验组得分为11.56分,对照组的得分为8.19分,这说明加了情境例句的呈现方式在中英对译和填空题中并没有优势,但在造句中占很大优势,该方法也最能提高学生的造句能力。这其实也是我们学习英语的目的之一——让学生学会自由使用英语。
词汇呈现方式面对不同的分项,其影响是不一样的。因此我们可以得出结论:加了情景例句的词汇呈现方式,对中英文对译和填空题这两种题型的影响较小,但对学生造句有着非常积极的影响。
(五)结论与建议
基于上述实验结果,教师在平常的教学过程中,应该多使用这种情景例句进行词汇教学,这也就是为什么新课标一直强调学生的情境化教学。我们用实证研究证实了该方法对学生掌握高阶技能是有帮助的,但对一些低阶技能可能没有太大影响。很多一线教师抱怨,他们虽然采取来一些新的教学方法,但这些方法对学生并没有明显的效果。这是因为很多测试题考察的是一些低级能力,所以新方法确实对这类题型的影响不够显著。如果将这样的科学案例呈现给教师,他们才可能会心服口服,并反思自己的日常教学是否指向了学生的高阶学习或学生的深度学习。这对于我们改进教学可能更有帮助。当然,除了英语学科,其他学科都可以使用该思路进行相似实验。
转自:“科研写作研究所”微信公众号
如有侵权,请联系本站删除!