来源|《教育研究》
一、计算教育活动与教育问题何以可能。
大数据在教育领域具有不同于金融、交通、商业等领域的特殊性,教育大数据还不具备皮特什等人所提出的“包含现象所有内容”“详尽无遗”的本质特征。“不管测量多么精细或者考虑得多么周到,它本身所能触及的总是片面的、部分的。”
因此,教育大数据并不能完全等于它所表征的教育本体,教育大数据不能完全替代教育活动、教育问题成为教育学的研究对象,我们不能直接地将作为数据密集型计算分析对象的数据替换成教育活动和教育问题。
简言之,计算教育学的研究对象是也只能是教育大数据,而非教育活动和教育问题。教育的整体性与数据密集型计算之间存在着研究范式通约的困难。大数据的全样本、总体、全过程、全数据、全景式描述之“全”都是相对性的、局域性的、有条件的,大数据之“全”并不等于教育整体之“全”,大数据并非是对教育整体的描述或教育整体的数据,被纳入大数据分析框架的“总体”只是某个维度、某个角度、某个方位、某个点的总体而非教育的整体。
局域性的大数据导致我们只能以类似于拆分的方式,对教育活动的一部分特征或属性进行测量与计算。大数据只能触及教育活动的一部分、一个层面或有限的几个层面。我们无法计算教育活动的全部属性,也很难通过“零存整取”的方式获取全部教育真相。即使我们了解了某几个维度上的教育属性的分布,对于预测整体性的教育行为基本上没有什么帮助,“分析、分离是可行的,合成、合并则困难得多,而且可能是不可能的”。
就教育而言,我们很难通过部分获取对整体的认知,同时我们也很难穷尽所有的“部分”,总是有一些“部分”因为无法测量、无法用概念描述而被忽略。算法会突出那些可计算的数据的重要性,会让我们只关注那些可以进行计算的现象,而忽略掉那些原本也很重要但无法测量、无法计算的现象,这就会因为被关注的现象缺乏代表性而导致以偏概全。局限于大数据的方法对教育的计算,就有可能只计算了我们收集到的数据而不是计算我们该去计算的数据,导致可测量、可数据化的发生在线上的教育被计算,而更重要的线下教育教学却因没有被大数据记录而被忽视。大数据将教育活动化约为数的同时也化约掉了活动背后的意义。
大数据的方法无法处理教育的意义问题,我们在关注“是什么”的时候,却忽视了“为什么”。因此,大数据的化约、数据化处理方式与教育的整体性特质并不完全相容。从研究对象以及研究方法来看,基于数据密集型计算的研究范式应用于教育学研究还存在很大的局限性,数据密集型科学范式还不足以支撑教育学科的研究。
二、教育主体是否可以被量化与计算。
教育活动或“教育人”的“数据”与自然科学之“数”具有不同的性质,教育活动或人的行为的数学化操作不具有自然科学的数学化操作那样的有效性和可行性。教育主体通过外显行为所表现出来的态度、情感、兴趣等的程度或强度复杂多变,不具有自然科学领域的物理性那样的稳定性和精确性,测量工具只能是一些尺度上具有很大模糊性的量表,测量工具的可靠性和稳定性完全不同于物理性测量所用的卡尺、测光仪等;对“教育人”的测量不具有物理性测量的确定的“测量单位”,测量所获得量值往往很难进行数学计算。
因此,对“教育人”的计算只能是一种基于经验的计算。教育活动各要素之间的互动不是由个别的因素以及概率决定的,而是由全部因素以及它们之间的相互作用决定的。我们在解释这种结构的运行时,不能用统计数字取代有关各个因素的知识;如果我们打算用我们的理论对个别事件做出预测,就要对每个因素都有充分的了解。对教育主体、教育系统各要素互动过程的化约只能是一种“等等式化约”,“对能够产生这种现象的那类事件的实例之性质的列举,并加上‘等等’这样的字眼。这种‘等等式化约’并不能使我们处理生物或精神实体,或能够用物理事件的陈述取代它们;它们仅仅是对某些类型的秩序或模式之一般特征的说明,对于这些秩序或模式,我们只有通过对它们的具体经验才能有所了解”。
对教育主体及教育系统各要素的互动过程我们无法做到如同物理学、化学等自然科学那样的化约。我们能够获取数据进行研究的方面是十分有限的,我们无法一览无余地列出构成教育活动、教育各要素互动过程的全部充分必要条件。对教育主体及教育系统各要素之间的互动过程,我们只能进行有限的、局部的、特定视角下的量化与计算,用数据密集型科学范式计算教育中的人与教育发展的目的存在很大的矛盾。
“真正的教育所面向的内在心灵和完整人性是无法测算的,即灵魂品质的形成、建构和完善是无法测评的。人的精神成长与经验的更新只有在实践行动中被证实,而无法被测评和估算,人的行动、成长的体验、精神发展的成果,只有在主体自身的反思中,由主体自身从内在进行把握或判断。”正如技术哲学家埃吕尔所批评的那样,当技术表现出对人的兴趣,它都会把人转化成一个物质对象。它只能通过这种方法对待人:贬低人以及量化人。因为技术的完善性只有通过量的发展才能够获得,而且不可避免地必然指向可测量的东西,相反,人类美德属于质的领域,针对的是不可测量的对象。所以,在技术的完善性和人的发展之间存在着尖锐矛盾。
三、数据密集型科学研究范式能否帮助发现教育规律。
计算教育学是否能够发现并揭示教育模式、教育规律在很大程度上取决于它所应用的计算工具。运用数理统计的方法可以帮助我们处理复杂的教育活动中相同类型的信息,为我们提供教育过程中某些行为或特征一起出现的相对频率,却不能告诉我们这些行为的构成因素以及它们之间存在的“因果关系”。
统计学的方法只是把这些因素中的某些相同的类型作为一个“数据”来对待,而无法对它们的统一特征做出任何说明。统计学方法的工作假设也间接决定了它会发现何种教育模式和教育规律。
传统的教育研究实际上一直在寻求一种“关系”解释,各种教育模式或教育规律本质上体现为教育活动中的各种“关系”(因果关系,不是相关关系),教育模式或教育规律实际上是对教育活动中各种关系的具体表述。统计学方法忽略掉了教育活动中的“关系”,实际上也就忽略掉了可能发现的教育模式或教育规律。
因此,计算教育学通过统计学方法的概率计算寻求教育模式或教育规律可能是一个悖论。统计学的方法不能帮助我们知道教育以及学习何以发生的条件和关系,我们无法搞清楚使学习发生的、对人的学习起作用的所有事实,也无法控制使学习发生的所有相关条件。我们对教育进行的规律性解释实际上都是针对某种教育模式的理论描述。
而且类似对教育模式的揭示也只能到此为止,我们无法控制一个心灵如何去影响另一个心灵,无法控制心灵之间互相影响的所有条件以获取预期的肯定性结果。我们研究发现的“规律”只是这种对教育活动特点进行描述的一般模式,而不是自然科学领域经过精确预测和计算所发现的精确模式,即使借助于大数据手段,我们也不可能期望掌握“灵肉交流”过程中各种变量之间的关系。所以不要期望以“数据驱动”发现某种可控制结果的模式,获取教育发生的必要且充分条件,并通过满足这些条件使预期的教育效果得以发生。教育领域并不存在类似于物理规律、机械规律那种隐藏在现象背后的简单规律,所谓的教育规律只能是关于教育的一些理论性阐释,而不是那种用两三个变量表达出来的“定理”“定律”或“公式”。
基于数据密集型科学研究范式构建起来的计算教育学是完全数据科学化的教育学。教育学是认识解释教育现象、解决教育问题的实践性学科,它告诉人们在教育实践中怎么做、如何教。教育学的知识体系建构基于范畴化的知识表达方式,是用因果关系反映出来的可理解的、清晰的、可在教育者之间交流的语言,而数据分析所得到的是数据之间的函数拟合关系(也就是相关关系)。这种结果“仅仅是随机波动的产物,并不代表所研究现象的任何本质的特征”。这与教育学的已有知识表示方式和话语体系存在很大差异。
我们无法想象一门由函数拟合关系表达出来的教育学的知识体系是怎样的,以及它如何可能应用于教育实践、实现在教育者之间的对话和知识交流。教育知识、教育规律的寻求和表达本质上是原理机制的研究和理论阐释,而不是数据分析。教育学的适切的研究范式应该是基于解释学、现象学的原理机制解释、经验概括,而不是基于计算科学、信息科学、数学的,以数据驱动、以计算为核心任务的计算教育学。从构建一门教育学的分支学科的角度来看,这种研究范式只相当于教育研究过程中的数据处理环节或只是研究的数据起点。构建一门教育学的分支学科仅仅以“数据说话”还远远不够,需要其他研究范式“接着说”。而且,仅用数据这种研究范式“无法触及教育领域的‘真实’和‘本然’,更无法揭示教育规律,似乎大数据时代的数据挖掘本身就与教育学科的人文性相抵触”。
因此,我们很难将计算教育学归属于教育学科。笔者更倾向于认同计算教育学中文概念的提出者所做的学科归属,“通过对教育全过程的大数据进行精确分析和计算,把以定性研究为主体、以经验为基础的教育科学,转变为以大数据为基本对象、以计算和模型为手段的定量精确科学。从而创造一门新的科学研究方向——计算教育学。它将成为信息科学的一个重要分支,进一步促进信息科学其他分支的快速发展”。构建一门以教育数据获取、管理、计算分析为目标的归属于信息科学的教育计算学或计算教育学,可能比以教育活动和教育问题为研究对象归属于教育学的计算教育学更为适切。
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!