摘要:学校教育机会具有“得到即满足”的充要特性,教育机会供给扩大意味着机会分布不平等下降。受教育年限的复合基尼系数是各机会基尼系数的加权平均。本文以数学推导和数值模拟证明,复合教育基尼系数随教育扩张而下降是其内在的固有性质。利用Barro-Lee世界教育面板数据,本文以实证研究验证了这一基本性质,并建立了教育基尼系数演化形态的解释模型。结果显示,各级教育衔接时序、扩展速率是影响复合教育基尼函数演化的直接因素。
关键词:教育扩张;教育不平等;复合教育基尼系数;数值模拟
作者:刘精明,清华大学社会科学学院教授
原文刊于《社会学研究》2023年第1期
一、引言
世界范围内的近现代学校教育是在与封建贵族教育、教会教育等精英教育形式的对抗中建立起来的(Archer,1979)。教育机会向全体民众开放是近现代学校教育内在的要求,这迎合并进一步激发了人们对教育平等权利的诉求。自联合国《世界人权宣言》将受教育权确立为基本人权以来,现代学校教育在世界各国飞速扩张(Meyer et al.,1992;Benavot et al.,2006; Barro & Lee,2015; Hannum et al.,2019)。教育扩张对人口、健康、经济、社会、政治、文化等都产生了十分复杂的影响(Hannum & Buchmann,2003),其中最先引起关注并持续发展为相对独立的学术主题的,是教育扩张与教育不平等关系问题。
教育扩张如何影响教育不平等?相关结论在不同研究传统之间以及各传统内部大相径庭。如哈尔西等人在观察英国教育不平等变化时就认为,教育扩张早期教育不平等是上升的,但随后会出现下降(Halsey et al.,1980)。后来拉夫特里与豪特(Rafterly & M. Hout,1993)、卢卡斯(Lucas,2001)等一些学者先后提出了不平等最大化维持(MMI)、不平等有效维持(EMI)等理论。但更多研究发现,随着教育的逐步扩张,教育不平等要么相对稳定,要么减弱或缩小(Erikson & Jonsson,1996;Breen et al.,2009;Blossfeld et al.,2015;等等)。不平等最大化维持理论提出20年后,一项新的研究回应了相应挑战,指出上层阶级的教育即使达到饱和也不会减少教育不平等,各国追求教育扩张的努力对降低教育不平等是一种阻碍(Bar Ham & Shavit,2013)。此外,以不同指标讨论教育扩张对不平等的影响得到的结论也大不相同。这使我们意识到,区分不同的不平等研究传统对理解这一对关系至关重要,因为学者们所谈论的“教育不平等”其实不完全是一回事。
不平等一般区分为分布型不平等和关系型不平等两种类型。所谓分布型不平等是相对系统均衡或均匀状态而言的,社会科学中特指资源或机会在人口总体中的分布状态,通常以离散统计量或某种“不平等指数”(如基尼系数等)来测量;所谓关系型不平等是指从一定的群体关系或相对结构位置来考察资源、机会的分配结果,不平等程度通常以一个群体相对另一群体的比较优势/劣势来体现。关系型不平等可进一步区分为数量关系型(如量的多寡、阶梯序次等)与具有实质联系的关系型(如剥削与被剥削关系),这是社会学由来已久的分析传统(布劳,1980;Kreckel,1982;孙治本,2001;刘欣、田丰,2018;李路路,2019;李煜,2019)。但有关“教育扩张与教育不平等关系”的讨论常常混淆或者忽略分布型不平等与关系型不平等之间的区分,如MMI理论中的“饱和效应”或“天花板”等术语就体现了这样的混杂特点。两类不平等间的相互关系是亟待拓展的研究主题,而认识分布型不平等的统计性质、特征则更为基本,因为它是我们理解群体间不平等的前提。为此,本文将集中讨论分布型教育不平等指数的建构、性质和特征,以此揭示并检验“教育扩张与教育分布不平等”之间的内在联系。
二、文献回顾
测量分布型教育不平等的指数较多,较为常见的有标准差、教育基尼系数等两类(偶尔也有采用广义熵指数等其他指标的),其中教育基尼系数已成为分析的主流。文献梳理围绕标准差、教育基尼两类指标而展开。
(1)以标准差测量教育不平等。较早的教育不平等测量经常采用“受教育年限标准差”这一统计量,如拉姆(Rati Ram)和多利乌斯(Shawn F. Dorius)的研究可以说是利用标准差分析教育不平等的典型代表。拉姆通过研究94个国家教育发展水平与教育不平等的关系发现,随着平均教育水平的提高,教育不平等(标准差)出现了先上升后下降的趋势(Ram,1990)。多利乌斯利用巴罗与李钟华(Barro & Lee)整理的76个国家和地区1870—2010年的教育扩张数据,考察了国家之间的教育不平衡状况的变化,其基本研究结论是国家间的教育标准差随着人均教育水平的提高经历了一个形似钟形曲线的变化过程(Dorius,2013)。以教育标准差讨论教育扩张与教育不平等关系的文献还有许多(Thomas et al.,2001;Wail et al.,2011;Meschi & Scervini,2014;Shukla & Mishra,2019;刘精明,2000),研究结论也都颇为一致,即标准差与平均受教育年限之间呈倒U形曲线关系,教育扩张使教育不平等出现先上升后下降的变化。
(2)以基尼系数测量教育不平等。人们发现,随着平均受教育水平的提高,教育不平等多呈递减趋势(Sheret,1988;Checchi,2000;Thomas et al.,2001;Castelló & Doménech,2002;Wail et al.,2011; Ziesemer,2016)。另有研究发现教育基尼与教育扩张呈反J形曲线关系,即随着平均受教育水平提高,教育基尼系数呈先下降后上升趋势(Meschi & Scervini,2014;Shukla & Mishra,2019)。
文献梳理表明,分布型教育不平等与教育扩张之间的关系形态,很大程度上取决于我们所采用的不平等指数形式。教育扩张对分布型不平等的影响可能并非纯粹经验问题,我们更应关注指数形式、指数的数学性质本身。
三、前提界定和概念操作化
讨论教育扩张条件下的教育不平等变化应先界定两个基本前提。首先,除非极少数例外,现代学校教育机会总是具有“充要满足”特性。也就是说若要满足个体对某种学校教育机会的需求,分配给他/她一次机会是必要的,同时也是充分的。一个人占有两次或更多完全相同的教育机会只会带来个人利益的损害,至少不会增加边际收益。这决定了任何教育机会的投入都将是机会覆盖率的提高。这是教育机会分配与收入、财富分配存在重大差异的地方。
其次,现代学校教育扩张是“循序渐进”的。近现代学校教育体系创建时所依据的蓝本就是儿童成长过程中循序渐进的阶梯。儿童接受学校教育总是先完成较前阶段的学习,而后才有可能获得较后阶段的受教育机会。在这样的制度框架下,面向大众的现代学校教育扩张必然要求先从最低阶的基础教育开始,然后依次扩张到更高教育阶段。
本文对“教育扩张”概念的操作化定义如下。
(1)机会扩张。机会扩张是教育扩张的基本方式,获得各阶段教育机会者比重的增加都意味着整体性教育水平提高。机会扩张水平(覆盖率)以λk表示,λk∈[0,1]。λk与常见的教育程度pk(各教育水平人口占总体的比例)既有联系,也有很大不同。pk是k类竞争性概率,存在∑pk=1,所以它是人口总体教育结构的恰当表达。λk表示的则是单一机会在总体中的覆盖率。
(2)平均受教育年限的提高。总体中平均受教育年限表示为:μ=∑λkEk。Ek是各阶段教育的学制年限。
(3)教育全程完成率(x)。由于各国各阶段学制年限(Ek)存在一定差异,“平均受教育年限”指标并不能直接比较不同国家的教育扩张程度,故提出“教育全程完成率”指标。设Ek是各教育阶段学制时长,TE=∑Ek(k=1,2,…,K)为特定社会中其教育系统设定的总教育时长。这时教育全程完成率可定义为:
x从0到1的变动实际上就是一个完整的教育扩张全程。式1包含了机会扩张λk与教育全程完成率(x)之间的关系。令mk=Ek/TE,∑mk=1。mk即各级教育学制年限的构成比例,因而也是教育体系的结构参数。这时式1可写成:
式2说明教育全程完成率x是各机会扩张水平λk的加权平均。
四、复合教育基尼系数的建构
(一)标准差的“是与非”
标准差是对绝对离散状况的测量,但它不满足指数建构的某些公理性原则,因而较少用于衡量收入或财富不平等(万广华,2004)。然而即便如此,我们还是要问,为何教育标准差与教育扩展水平之间总是存在倒U形曲线关系?
事实上,教育年限与教育机会具有一定程度的等价性质,从而使教育年限标准差与教育机会标准差之间存在内在联系。假设一个社会中存在价值为E年的某种教育机会,占人口比例为λ的人接受了该教育机会,没有接受者的比例为1-λ。不难证明,该社会中个体受教育年限(yi)的标准差是:
可见,教育年限标准差是比例方差之平方根与学制年限的乘积。比例方差有这样的性质:随着λ由0→1,λ(1-λ)是先上升后下降的,其轨迹形似“钟形”。由于E可以看成一个常量,所以利用标准差讨论教育不平等变化必然可以观察到教育不平等随着教育机会供给扩大经历先上升后下降的变动过程。
(二)教育基尼系数的传统算法
一般来说,采用基尼相对平均差计算教育基尼系数是一种较基本的算法。
这里,yi和yj是同一分布中个体i和j的目标变量(如收入、受教育年限等等),μy为这一分布的均值。它的具体计算通常需要利用个案样本数据。后来有学者利用教育年限的阶段性特征以及总教育年限与各阶段教育规模的关系对式4进行了一定改造,各自独立推导出了几近相同的教育基尼系数计算方法(Checchi,2000;Thomas et al.,2001;Castelló & Doménech,2002)。其中托马斯等人(Thomas et al.,2001)提出的教育基尼系数计算方式获得了广泛认可和应用。
式5即托马斯等人提出的教育基尼系数EL的计算公式,其中μ是平均受教育年限,Vi、Vj是达到教育水平i、j应接受的教育年限,pi或pj是达到相应教育水平者的百分比,∑pi=1。可见,要利用式5计算教育基尼系数,只需收集或计算达到各教育水平人口比例信息即可,数据处理和计算工作大幅简化,但其局限性在于人们很难从该公式去理解教育不平等的构成及其变化方式。
(三)教育机会基尼系数与复合教育基尼系数
1.教育机会基尼系数
在日常生活中,人们对机会不平等存在直观理解:一种机会如果只有一部分人获得而另一部分人没有获得的话,没有获得就是不平等。有趣的是,下面我们将证明,这种机会分布不平等的基尼系数正好等于没有获得该机会者的比例。
计算基尼系数有两种理论假定,一种以离散分布为基础,另一种以连续分布为基础。以连续分布看,洛伦兹曲线将三角形OZP分割成A、B两部分(见图1),基尼系数表示为A部分之面积与三角形OZP面积之比:G=A/(A+B)=2A。
然而教育年限是一种特殊的离散数据,它是对教育机会进行量的转换或重新赋值,其本质仍然是“机会”,而不是连续的量。一个人若获得某种教育机会便得到固定的受教育年限(学制时长E);若没有获得这种机会,量的转化是0。假设人口总体中获得该教育机会的比例为λ,未获得的比例为1-λ。针对这样一种机会的价值量(教育年限)进行洛伦兹累积,可参照离散分布的累积方式进行(徐宽,2003:762;Thomas et al.,2001:12),如图2所示。将人口按是否获得该教育机会排序,没有获得者排前面,获得者排后面;针对没有获得者,其累积人口比例为1-λ,累积受教育年限为0,洛伦兹累积线与横轴上的线段OQ重叠;获得过这种教育机会的人都得到了相同的受教育年限(E),于是,随着受教育人口的增加,受教育年限的累积百分比将匀速递增,因而这部分人的所有洛伦兹点都将落在QZ这一线段上。
这样,洛伦兹曲线便钝化为由线段OQ、QZ所构成的折线,洛伦兹几何A的面积就是三角形OQZ的面积。由于ΔOQZ的底OQ=1-λ,其高PZ=1,因此,表示该类教育机会分布不平等的基尼系数便可方便地得出:
式6表明,教育机会分布不平等之基尼系数(G)实际上就是没有获得这种机会者的比例,可称之为“教育机会基尼系数”。显然,在人口总体规模不变情况下,只要教育机会投入有所增加,没有获得该类机会者的比例1-λ就会降低。因此,从数学上讲,某种教育机会扩张同时就意味着以基尼系数衡量的机会不平等程度下降。二者实为语义上的同一反复。
式6还表明,如果一种教育机会在价值特征、价值量等方面都是同质的话,衡量机会不平等的基尼系数值与该机会的价值特征、价值量无关。比如,若某类高等教育机会是同质的,那么其机会不平等基尼系数就是没有获得过该机会者的比例,无关乎这种机会本身的价值高低,比如教育年限是多少,未来在收入、权力、社会地位等方面的回报有多高。总之,机会基尼系数与机会价值量无关。式6完美地简化了我们对教育机会不平等的理解。
2.复合教育基尼系数:多个机会基尼系数的合成
G=1-λ还只是表现了单一机会扩张与不平等的关系,但一个人所受的教育通常由多个阶段、多种多类教育机会所组成。如何利用式6来测量由多机会综合而成的“量”的分布不平等,是接下来的工作重心。
(1)按构成要素分解基尼系数。尽管根据人口分组分解不平等指数似乎更为普遍,应用也更广泛,但是,从价值来源或构成来分解基尼系数也具有重要意义(Fei et al.,1978;Lerman & Yitzhaki,1985;Pyatt et al.,1980;Shorrocks,1982),国内学者的介绍和相关应用也较为丰富(徐宽,2003;万广华,2004;戴平生、庄赟,2012)。不过,以此方法分解教育基尼系数者则鲜少见到。
比较而言,勒曼与伊扎基(Lerman & Yitzhaki,1985)等提出的分解方法相对直观而简洁。他们首先利用基尼平准差的积分形式将二分之一基尼平均差转换为收入与累积分布之间的协方差,然后将总的协方差再次转换为各分量与总量累积分布之协方差的和,从而得到总量基尼系数与各分量基尼系数之间的关系:
式7即为勒曼与伊扎基提出的按要素分解的基尼系数公式。其中,G表示总的不平等基尼系数,Rk为各分量与总量之秩相关系数,Gk为各要素本身的分布不平等基尼系数,Sk则表示各分量占总量的份额。
(2)复合教育基尼系数。现代学校教育体系通常包含多阶段、多种类教育机会。个体最高受教育程度可以看成从不同教育机会中接受的教育时长(Ek)之和。设个体i接受的教育总时长为Yi,它可分解为各阶段教育中获得的受教育年限(yi,k):
这里,yi,k表示个体i在教育阶段k上获得的教育时长,Di,k为是否接受该教育机会的指示变量,Ek为学制年限。这样,个体间受教育年限(Yi)的不平等基尼系数就可以借用式7来计算,式中各符号含义和计算方法如下。
Gk为各种各类教育形式的机会基尼系数。根据式6,有:Gk=1-λk。
Sk为各类教育分量占总量的份额,其计算方式是:
Rk是各教育分量(yi,k)与总量(Yi)的秩相关系数。Rk ∈[-1,1],但Rk 取值为1是最常见的情形。这是因为一个人接受教育总是从较低阶段开始,随后循序渐进地逐级完成。获得过较高阶段教育者必定接受过之前更低阶段的教育。因此,当按总量由低到高排序时,各分量也必定由低到高排列(各分量只有两个取值,即0和Ek),二者之间对应关系可以完全确定,故有Rk=1。
至此,式7就简化为:
即为本文教育基尼系数的新算法。由于
,故可将Sk看成各类机会基尼(Gk)的权重系数,因而式10还可以表述为:教育基尼系数GE等于各机会基尼(Gk)的加权平均,其权重正好是各机会的“价值量”占“价值总量”的份额(Sk)。故此,GE可称为“机会基尼合成系数”或“复合教育基尼系数”。
复合教育基尼系数与托马斯等人(Thomas et al.,2001)提出的教育基尼系数(EL)在计算结果上是完全等价的。这是因为教育基尼系数EL是利用汇总数据计算的相对基尼系数,或者说是相对基尼系数(式4)的一个特例,而复合教育基尼系数则是按要素分解基尼系数(式7)在各分量与总量之相关系数均为1时的特例,二者本质相同,只是计算方式不同。
五、教育基尼函数的性质与演化形态
单一机会基尼系数Gk与机会扩张λk具有互补关系,接受某种教育机会者的比例λk从0增长到1,同时也是机会基尼Gk从1下降到0的过程。但复合教育基尼系数GE是多个机会基尼系数的加权平均,其取值范围介乎各机会基尼系数(G1,G2,…,Gk)的最小值与最大值之间。因教育扩张符合循序渐进规律,故而一般存在G1≤G2≤…≤Gk,所以GE的取值范围是:G1≤GE≤GK。因为Gk(λk)是一个减函数,如果所有λk都必将扩展至1,那么作为这些减函数的加权平均,
最终也必然降至0,其长期的总体性趋势是下降的;但这并不意味着加权平均数GE(x)在教育扩张全程必然是减函数。各类教育机会的扩张水平、扩张速度、扩张时机共同刻画着复合教育基尼系数的演化形态。
(一)教育基尼函数的特殊形态与性质
复合教育基尼系数GE(x)与教育扩张(x)之间存在复杂的复合函数关系,我们称这类函数为教育基尼函数。这里以一个存在初、中、高三级教育的学校教育体系为例,从一些简单(或特殊)形式入手逐步探讨这类函数的基本性质和形态。
Type I:同步扩张模式。这种特殊模式假定三级教育的扩展进程完全相同,即在发展全程的任何时机(x)上,各级教育机会的扩张水平始终相同[λ1(x)=λ2(x)=λ3(x)],因而机会基尼也都相等:G1(x)=G2(x)=G3(x)。给定x,由于有S1(x)+S2(x)+S3(x)=1,复合教育基尼系数此时可表示为:
可见,在Type I模式下(见图3),若以教育全程完成率x为横轴,机会基尼系数Gk(x)、复合教育基尼系数GE(x)完全重叠,其值正好是教育全程完成率x的补数。
Type II:分段扩张模式。该模式的特征是前一阶段教育全面普及完成后,后一阶段教育才开始启动和发展。如图3右图所示,中等教育是在所有人都完成初等教育后才开始,而高等教育又是在中等教育普及完成之后才出现的。
令X1=E1/TE,X2=(E1+E2)/TE。TE是教育系统设定的各级教育学制年限之总和。Type II模式下教育基尼与教育扩张的关系实际上是一个分段函数。
式12分段函数式表明,复合教育基尼系数在各教育阶段即为各自的基尼分量。如初等教育阶段,中、高等教育阶段(机会)尚未出现,总的教育基尼系数即当前阶段的机会基尼系数:GE=1-λ1。从教育全程来看,因有x=m1λ1(见式2),即有
。中等教育开始启动并扩张时,初等教育普及化已全部完成、第三级教育尚不会出现,所以总教育基尼系数即为第二阶段教育基尼之分量S2(x)G2(x);同理,高等教育开始启动时,前两个阶段的教育基尼都降到了0,此时的复合教育基尼系数也仅是高等教育基尼分量S3(x)G3(x)。
此时Sk(x)的变动方式至关重要。由于Type II假定各阶段教育扩张是在前一阶段教育普及完成后才开始,且其后更高阶段教育均未启动,这时λk与x之间有着唯一确定对应关系,因此函数Sk(x)可以转化为Sk(λk)来讨论。设较前阶段已完成的平均受教育年限为E0(若本级教育为最低教育阶段如初等教育,则E0=0),本教育阶段的学制年限为E,令二者之比为a=E0/E。这样,正在扩张的教育分量k占总体的份额可表达为与λk的函数(为表述简洁,舍去下标k):
式13是倒数双曲函数,而λ是教育机会覆盖率,故S(λ)是该双曲线在0≤λ≤1、a≥0(λ与a不同时为0)时的一段特殊取值。原点(0,0)是S(λ)函数的起点,其取值区间是[0,1),y=1是其渐进线,a是其形状参数。为不失一般性,这时我们可将式12各分量基尼写成教育机会扩张(λ)的函数:
可见,f(λ)可以看成是具有特定取值范围的倒数函数S(λ)与λ的补数1-λ的乘积,因而也是一种双曲函数在λ∈[0,1]时的一段特殊取值。因为f(λ)在λ∈[0,1]区间二阶可导,且a≥0时f″(λ)<0,所以它是一个上凸函数;对f(λ)一阶求导并寻找驻点,可获得函数f(λ)的最大值坐标。将式14进一步变形和整理:
一个峰值出现在前1/2扩张进程的左偏态倒U形曲线,具有较强典型意义,可称之为“教育基尼函数”(参见图4)。
结合上面的讨论,可对式14教育基尼函数的性质作进一步归纳。
性质1:函数f(λ)是先上升后下降的左偏态倒U形曲线,其极大值坐标为(
-a,1-2[
-a]),极大值出现在该阶段教育扩张的前半程;函数在区间(0,
-a]单调递增,在区间[
-a,1]单调递减。
性质2:函数f(λ)取值范围是0≤f(λ)≤1-λ,由于它与横轴有2个交点(0,0)和(1,0),因此所有函数值均落在直线f(λ)=1-λ与两坐标轴所框定的三角区域。这一性质决定了函数f(λ)总体趋势是下降的,且最终将归于0。
性质3:a=E0/E是函数f(λ)的形状参数,a的取值越大,不平等的反弹幅度越小,反弹峰值出现的时间越晚;反之,a的取值越小,达到的峰值越大,且峰值越容易出现在本阶段教育扩张的早期。
(二)复合教育基尼函数的一般形式与性质
Type II假定在教育全程某个给定时点只存在一种教育机会扩张,而其他类别教育机会维持原有水平。这既是复合教育基尼函数GE(x)的一种特殊形态,同时也是GE(x)之分量Sk(x)Gk(x)的内在演化轨迹。接下来需要讨论的是,如果放开对Type II的这种约束,即一个分量演化的同时,其他分量也按一定方式协同变化,这时复合教育基尼函数GE(x)的演化会是什么情况?
回顾前文式2,有:mk=Ek/TE,∑mk=1,且x=∑mkλk(x)。在某个较为确定的时期内,可假定社会体系中各级教育的学制时长Ek相对稳定,故可将作为结构参数的mk视为一常数。同时应注意到,针对教育全程完成率x的第k个基尼分量函数fk(x),与给定x条件下相对λk的基尼分量函数f(λk|x=∑mkλk)是完全等价的。为方便书写,我们将f(λk|x=∑mkλk)记为f(λk)。这时有:
按照教育基尼函数中参数a的构造方式,当放开“其他分量不变”这一约束条件时,各分量基尼中的参数ak可进一步作如下构造,令:
ak是分量k扩张时系统中其他各教育阶段已经完成的教育存量(u-uk)与本阶段预期的教育投入Ek的比值,其解释与参数a相同。这时式15可写成:
比较教育基尼函数式14可知,放开约束条件后各分量基尼仍然具有与教育基尼函数f(λ)相同的函数形式。又,由于式15和式17是等价的:
因为结构参数mk是常数,所以式18左边的
与右边的教育基尼函数f(λk)具有相同的性质、形状和形式,只是取值发生了mk倍的伸缩变化。据此可构造一个新教育基尼函数 ,使
,并将式17改写成:
式18两边求和,复合教育基尼函数GE(x)就存在如下两种等价表达:
由式18~20可知,GE(x)既是给定x条件下k个比例方差λk(x)(1-λk(x))的加权平均数与的乘积(式20a),也是k个教育基尼函数的加权平均(式20b)。这说明不仅分段函数fk(x)受族函数f(λ)之性质的约束,GE(x)本身也是各水平教育基尼函数的加权平均,因此它的取值、性质和演化形态也都服从f(λ)函数的约束。也就是说,GE(x)就是f(λ)函数族的特殊成员。
有意思的是,式20a及f(λ)函数本身(式14)还表明,复合教育基尼系数、基尼分量与机会分布的比例方差之间具有内在关联。以式20a来说,给定x取值,复合教育基尼系数GE(x)是对各机会比例方差加权平均后的“标准化”。
作为f(λ)函数族的一员,GE(x)至少同样具有如下几点重要性质。
性质4:作为多个f(λ)的加权平均,GE(x)与f(λ)取值范围相同:0≤GE(x)≤1-x,即GE(x)所有取值均落在直线GE(x)=1-x与两坐标轴交叉所构成的三角形区域内。这一性质决定了GE(x)的总体趋势是下降的。
性质5:由于GE(x)是各分量函数的加权平均,GE(x)函数的单调性区间需要根据分量函数之极值点的组合来判断和讨论。
1.GE(x)在特定区间的单调性和特定取值特征
根据f(λ)函数的单调性特征,给定x=∑mkλk(x),k=1,2,…,K,复合基尼函数GE(x)存在如下特殊的单调性变化区间和特定取值。
以上说明,现代学校教育兴起之初机会分布不平等最大(逼近于1),而各阶段教育均趋于普及完成时,复合基尼最低(逼近于0);教育全程内尽管GE(x)可能经历起伏波动,但总体趋势是下降的,并会最终完成1→0的演化。此外,当各分量机会覆盖率均处于函数f(λk)最大值左侧时,整个教育系统必出现短暂的不平等上升;各分量基尼均越过函数f(λk)最大值时,GE(x)必处于持续下降过程。
2.GE(x)随扩张而下降趋势中的反弹和波动
复合函数GE(x)是各分量函数fk(x)之加权平均,而f(λ)函数有1个极大值和2个极小值,在权重SE与GK的组合方式不断变化的情况下,GE(x)理论上就存在出现多个峰值或拐点的可能。GE(x)由1→0的下行过程充满波动起伏。不过现代学校教育有自己的发展规律、惯性和特点,因此不平等下降过程中的反弹又是可预见的。对此我们将运用蒙特卡洛仿真与数值模拟技术予以呈现。
(三)复合教育基尼系数的演化形态:数值模拟
1.数值模拟模型
由机会基尼系数(式6)、复合教育基尼系数(式10)的定义,以及后来对函数式14、式17~式20等的讨论,均可看出决定复合教育基尼函数演变的核心是各教育机会扩张本身,而这又涉及λk的扩展速率、扩展时机及其与其他各阶段教育的组合方式等多种复杂情形。因此,若要描述复合教育基尼函数的演化形态,首先应对各级教育机会扩张过程加以恰当设定。机会扩张λk属于典型的累积概率,利用Logistic分布函数,我们建构数值模拟的算法模型如下:
这里下标j表示仿真模拟顺序号,λj,k(x′j,k)表示第j次模拟时,教育阶段k之累积概率的Logistic分布(k=1,2,3,分别表示初等、中等、高等教育之层级)。x′j,k∈[0,1]是模拟的教育全程完成率,由使用均匀分布的伪随机函数生成。K为教育全程,按照我国主体学制将其取值为16年。μ0是λj,k(x′j,k)函数中心位置之初始度量值,根据Logistic函数的特征可设定μ0=5。Cj,k是函数的位置变动参数,即第j次模拟时各分布函数中心位置的移动幅度。这里,Cj,k也是教育扩张的时序,它取值越大,表明该阶段教育起步越迟。此外,若要使分布函数在x′j,k∈[0,1]内得到较完整的观察,C的取值范围应设定为0≤Cj,k<(K-μ0)。rj,k是形状参数,也是表示增长速率的近似估计,其值越大意味着扩张的速率越快。
任意第j次模拟时,各阶段分布函数λj,k(x′j,k)最初都各自独立,若要使之成为同一体系内部同时存在的教育扩张,需要借助前文式2来建立它们的联合分布:
最后,利用式20a或式20b计算复合教育基尼函数GEj(x)的相应取值:
2.几种典型形态的参数设置
复合教育基尼函数GEj(x)的演化形态取决于各Logistic分布函数λj,k(x′j,k)的形状参数rj,k和位置参数Cj,k的取值。不同参数设置及其组合存在复杂的系列性流变,为简明起见,我们根据理论假设预先设置固定参数,从而在函数GEj(x)变化流中截取若干帧理论片段,选取不平等演化的典型形态来加以讨论。
由于GEj(x)是各基尼分量之和,且GEj(x)≤1-x,所以只要各阶段教育扩张并非完全“步调一致”,GEj(x)就会呈现“波动”下降。这意味着各级教育之间的发展衔接是影响GEj(x)形态的关键,而位置参数Cj,k的设置能较好地反映这种衔接性特征。所以,在片段截取时,我们先将速率参数rj,k设置为1,以观察各级教育在常规发展速度下,只是由于教育起步时间(Cj,k)不同而产生的形态差异;特殊形态模式的讨论则同时调整参数rj,k。在表1中我们尝试列举了8种形态的参数设置(8次模拟),每个单元格中有2个数字,分别对应rj,k和Cj,k的取值。
3.典型演化形态的模拟结果
根据循序渐进规律,作为由多个偏态抛物线函数f(λ)加权平均所形成的复合函数,GEj(x)首先就是指在有初等教育之不平等下降前提下的变化趋势。根据f(λ)函数特点,参数a越小,极大值(拐点)出现越早,极大值也越高。由于初等教育最初的发展是在没有任何教育存量前提下开展的(E0=0),因而当一个社会按照循序渐进原则发展教育时,初等教育将率先带动GE(x)跨入持续下降的轨迹中。现代学校教育机会扩张都不是一蹴而就的,而是依序释放、逐渐扩大,因此在教育全程完成率(x)最初扩张的一段时期内,因EK一定而E0较小,相对所有的fk(x)来说,都会存在较小的ak、较早出现的拐点、较长距离的协同下降。因此,在大多数社会中,当x较小时,GE(x)都会呈现加速下降模式。如图5之各图中,当x约小于0.35时,其左侧GE(x)的走势大体都呈线性下降形式。这也是当前平均受教育年限较低的大多数低度发展中国家正经历的不平等演化形态。
从教育发展全程看,前文图3左图显示的是Type I同步扩张模式,三级教育起步时序相同,发展过程中机会累积速率也都相同。因而符合这一条件的参数取值都能使GEj(x)=1-x(如表1中第1行参数设置)。图3右图的Type II分段扩张模式也是一种十分极端的形态,各阶段教育的扩展时序间隔较大,较之初等教育而言,中等、高等教育的起步时间要分别晚5年和8年,而这种间隔效应同时又被形状参数rj,k=3加以放大(见表1中第2行参数设置)。
相对Type II而言,三级教育分离模式(Type IIIa)是一种相对缓和的分段发展形态,其位置参数与Type II相同,但形状参数为1,这是一般扩展速率下先将初等教育发展到接近普及完成水平,然后再依次推动中等教育、高等教育由起步到完成的过程。因此,从图5的Type IIIa可以观察到初等与中等、中等与高等之间均存在一定的不平等反弹。Type IIIb初等教育分离模式与Type IIIa的区别在于初等教育与中等、高等教育间的启动时间分别相差5年、6年,但中等与高等教育间启动间隔相对较小(仅1年),因而在教育扩张全程的1/3至2/3处能观察到GEj(x)的一段上升形态,但随后又单调递降。一些受新教改革影响较大的西欧国家、北欧五国可能就属于这样的情形。这些国家的初等教育早在19世纪初就已基本完成普及,但中等、高等教育发展直到第二次世界大战结束后才启动,所以这些国家在平均受教育年限不高于中等教育程度时都会经历较大的不平等上升。Type IIIc则为三级教育有序衔接模式,各级教育启动间隔相对较小而教育发展速度大体相当,GEj(x)的演化通常不会出现较大的起伏波动。
Type IV呈现了人们更关心的高等教育扩张。扩张时机不同,所引发的复合教育基尼演化形态也有所差异。Type IVa、IVb分别是整个教育发展的早期、中期优先发展高等教育的模型,它的起步时机早于初等或中等教育,并以超常规速度发展(设定rj,k=3)。在早期发展模型(IVa)中,教育全程完成一半(x=0.5)左右时,其高等教育覆盖率已接近100%,其基尼分量(S3G3)经历了先上升、后下降的一个较大起伏,并拉动了早期总的教育基尼系数的快速下降。Type IVb则显示,高等教育基尼分量所经历的反弹之幅度相对较小,总的教育基尼系数更贴近参照线G=1-x。不过人们应该了解,这两类高等教育发展通常不能持续太久,特别是早期优先发展型。如违背教育的“循序渐进”规律,初等、中等教育不能为高等教育提供充足的合格毕业生,教育扩张必然出现倒退和回缩。印度教育发展历史中反复出现的教育退缩现象就是其鲜明例证。Type IVc是高等教育扩张相对较晚的情形,这使复合教育基尼系数在教育全程后期出现一定的反弹。
六、复合教育基尼演化特征的实证检验
本文实证研究的主要目标是考察世界各国现代学校教育发展过程中的教育不平等随教育扩张而演化的形态差异,以验证前述推导和仿真模拟所得到的主要研究结论。为此,本文采用一份包含111个国家和地区、跨度140年的教育发展面板数据展开相关实证分析。利用复合教育基尼公式,本文首先计算了各时点教育基尼系数,后续相关分析策略和步骤可简述如下:首先是关于“演化形态”的操作化测量。从数学形式看,演化形态可由基尼函数的曲线特征如曲率、面积、偏斜率、峰度值等来共同概括。但经过前期比较研究,本文最终选取教育基尼函数曲线所分割的面积作为演化形态的关键测量。要得到对面积的有效估计,先须获得教育基尼曲线的精确函数式,为此,利用分数幂多项式回归技术拟合了每个国家和地区教育基尼GEj随教育全程完成率(x)而变动的精确表达式。其次,利用仿真算法模型的变化形式拟合各水平教育的扩展过程(λk),从而建立不同国家的教育演进特征变量,如教育起步时点(时序)、教育扩张速率等。最后,以面积为因变量,以教育扩展特征、发展水平等为自变量,建立教育基尼演化形态的解释模型,进而对隐含在仿真模型中的理论判断(影响教育基尼演化形态的主要因素在于教育扩展时序与速率)作出相应的实证检验。
(一)利用Barro-Lee数据计算复合教育基尼系数
本文采用的是巴洛与李钟华在世界银行支持下整理和形成的一份国家与地区教育发展的面板数据(参见Barro & Lee,2015)。该数据出现过多个版本,本文采用的版本为李钟华2016版(Lee & Lee,2016)。用于本文分析的数据包含111个国家和地区29个数据时点(时间跨度为1870—2010年,以5年为间隔),主要变量包括各时点15~64岁人口总体的受教育状况。该数据将教育程度区分出四个层级、七个水平。这四个层级分别是未上过学和小学、中学、大学三个教育阶段,并将三个教育阶段均划分出未完成、完成两个水平(“未完成”者之学制时长设定为原学制的二分之一)。原数据不仅提供了各教育水平人口的比例,同时还按初等、中等、高等三级教育分别计算了各学段的平均受教育年限。
利用分组数据计算复合教育基尼系数,关键在于获得过各水平教育机会覆盖率(λk)以及各教育阶段的学制时长(Ek)。李钟华2016版数据中七个教育水平人口的比例 pk是已知的,覆盖率可通过公式
加以换算(p0表示未上过学人口比例);但数据没有直接提供不同国家在各时点的学制信息,而是给出了人口总体在各阶段的平均受教育年限。本研究根据巴洛与李钟华论文(Barro & Lee,2013)提供的计算公式将学制时长(Ek)反算出来。由此,数据中111个国家/地区在29个数据时点上的复合教育基尼系数就能方便地计算出来。
图6呈现了111个国家和地区29个数据时点全部的复合教育基尼系数值与教育完成率(x)的散点图。图6显示,所有复合教育基尼系数值都位于参照线与两坐标轴所围成的三角形中,这是对教育基尼函数性质最直观的反映。
(二)教育基尼演化轨迹的精确拟合
1.分数幂多项式回归(fractional polynomial regression)
为计算基尼函数的曲线特征(如曲率、面积等),需要获得基于教育基尼观测数据与教育完成率x之间较精确的函数关系。为此,本文运用罗伊斯顿与奥尔特曼提出的分数幂多项式回归技术(Royston & Altman,1994)来解决此类问题。分数幂多项式回归是一种数据驱动的模型拟合方法,它允许负数次幂、对数、非整数次幂和重复性多项式等参与回归,对精确地拟合非线性关系数据具有很大优势。以本研究来说,各国家或地区均以GE为因变量、教育全程完成率x为自变量设立分数多项式OLS模型(各模型均包含29个数据时点),其统一形式为:
为与前述基尼函数相区别,分数幂模型对GE的估计以g(x)表示;Hm(x)=x(pm)表示x的第m个幂次项,m=1,2,…,M是幂次项(也称维度)的顺序标记。当多项式Hm(x)存在幂次重复项(pm=pm-1)时,其构建方式为:
拟合分数多项式回归时通常需要对x进行去中心化处理,这时的分数多项式表述为:(x(p1,p2,…,pm)-c(p1,p2,…,pm))′β。就本文数据而言,由于各样本地区教育发展差异较大,对教育完成率x去中心化处理更有利于相互比较。本研究在拟合所有111个国家和地区的模型时,均设定x的中心值为c=0.5。利用上述模型技术对111个国家(地区)进行幂次项筛选,最终均获得较为理想的模型拟合,108个模型的拟合优度R2大于0.98,另外3个模型的R2也都大于0.93。
2.面积的含义及其计算
分数幂多项式回归使我们获得了较精确的教育基尼函数表达式,从而可产生诸多曲线特征变量,其中之一便是函数曲线对参照线与两坐标轴所围成的三角形面积的分割。前面已指出,参照线(G=1-x)是教育基尼演化的最大边界,而参照线与坐标轴所围成的三角形区域内的点均可以视为因各分量非同步扩张而产生的不平等降低效应。因此,我们将基尼曲线g(x)与x轴之间的面积(sh)称为基尼函数面积,它表示演化过程中仍然维持的不平等水平,参照线与基尼曲线g(x)之间的面积(ss)则称为基尼偏移幅度。可见,教育基尼演化路径偏离参照线的幅度或基尼函数面积都可当作衡量演化形态差异的辨识变量。
图7呈现了捷克和法国教育基尼的演化形态(面积图)。需要注意的是,捷克作为新教运动最早发生的地区之一,其初等教育普及化在18世纪中期就达到了较高水平,但Barro-Lee数据观测时点是从1870年开始的,之前的教育扩张过程并未观察到。基于同样原因,还有其他许多国家如北欧五国、大多数西欧国家等都出现了类似情况。为了比较这些国家教育扩展全程内的不平等演化,作者根据前面的理论逻辑对未观察到的教育基尼系数值以线性回归方法予以估计,如图7中虚线所示。这样,面积计算就可用求定积分办法来获得:
这里,a表示x(教育扩展全程)的最小观测值,b表示x的最大观测值,f1(x)=1-x是参照线,f2(x)是对未观察到GE的线性估计函数;g(x)则由分数幂模型(式24)估计而来。g(x)函数中分数幂多项式的原函数可方便获得,从而利用定积分方法计算面积也相对容易。面积的计算也可采用蒙特卡洛仿真模拟的方法来估计,事实上本研究同时采用了这两种方法以相互验证其计算结果。
在观察结束时点,不同国家的教育完成率各不相同,而面积大小又与之直接相关。为消除这类影响,使演化形态变量具有可比性,本文进一步构建单位面积率指标作为替代:shr=sh/b;ssr=ssb。shr和ssr是基尼函数分割参照线下方三角形时同时产生的,都可用来定义基尼函数的演化形态,二者面积上互补,但单位面积率的含义相反。一个国家或地区基尼函数的单位面积率(shr)越大,表明其所经历过的教育不平等程度越深;反之,基尼偏移幅度之单位面积率(ssr)越大,历史过程中消减的教育不平等也就越多。
(三)基于Logistic回归估计教育扩展特征
基于Logistic模型的数据拟合可使我们获得各国教育扩张的一些重要特征变量,如各教育阶段的起步时序(Cj,k))、扩张速率(rj,k)等。为利用Barro-Lee数据,我们对式21进行了一定的形式转换,经过移项、对数转化等处理后有:
这里,λj,kt表示国家/地区j第k教育层次在时点t的教育覆盖率,它是一个取值为0≤λj,kt≤1的累积概率值。这时式28形成了对式21的线性转化;x′j,t为对应的教育完成率观测值;模型中各符号之含义如前节所述。
式29本质上是λj,kt的Logistic方程,转化后获得了线性模型形式,可用OLS估计。利用式29对111个国家/地区、6个层次教育的覆盖率进行独立的OLS回归(共拟合666个模型),即得到各水平教育的起步时序、扩张速率的估计值:
OLS回归后还可通过事后估计公式
来还原机会覆盖率的拟合值,进而利用式22、式23间接估计出复合教育基尼函数的演化轨迹,不过这已不是此处关注的重点。
(四)教育基尼演化形态的解释模型
至此,我们利用分数幂回归、Logistic回归等模型技术,获得了对教育基尼演化形态及解释变量的取值,包括6个扩张时序变量C1~C6,六个扩展速率变量r1~r6,它们分别对应于六个层次的教育水平。教育基尼演化形态则以基尼函数曲线与横轴之间的面积sh及单位面积率shr表示。这些变量的相关系数矩阵显示,演化形态shr与扩展时序变量(除C1以外)均呈负向关系,与扩展速率呈正相关关系,且相关系数值较大;扩展时序、扩展速率二类参数内部的相关性也较强。6个扩展速率变量两两间相关系数介乎0.88~0.98。这些特征表明,同一教育体系内部各级教育发展的政策模式具有高度相似性,特别是在各级教育发展速率的选择上高度关联且具有内在的稳定性。
正由于扩展时序、扩展速率这两组变量内部存在高度相关,以此建立演化形态shr之解释模型时就容易产生多重共线性问题。为此作者对上述12个变量作了进一步归纳,构建了3个概念化程度更高的变量,其建构方式如下:
(1)中等教育与初等教育的衔接时序:d21=[(C3+C4)-(C1+C2)]/2
(2)高等教育与中等教育的衔接时序:d32=[(C5+C6)-(C3+C4)]/2
(3)教育扩展速率因子(facR):这一变量是从r1~r6六个变量中析取出1个因子而得到的(单一因子析取获得96.3%的方差解释)。
这样,我们最终建立教育基尼演化形态的解释模型如下:
这里下标j表示不同的国家和地区,变量xmax是已经达到的教育全程完成率之最大值(也是对教育发展水平的测量)。其他变量的含义如前所述。
表2记录了解释模型(式31)的分步回归结果。拟合优度显示,教育发展水平、教育衔接时序、教育扩展速率对教育基尼演化形态都具有较强的独立解释能力。模型M4显示,三个因素对教育基尼演化形态的综合解释能力可达92.8%,标准化系数反映了各解释变量的重要性顺序。从模型整体结果看,各国/地区复合教育基尼演化形态取决于各级教育发展过程中的衔接时序与扩展速率。
七、结论与讨论
教育扩张是教育机会分布的一种运动形式。本文主要以基尼系数为教育不平等的测度指标,推导和论证了教育扩张与教育分布不平等之间的函数关系。总体来说,教育扩张即意味着分布型教育不平等下降,这是一种基本规律。复合教育基尼演化形态上的差异形式上源于各级教育发展时序性的不同,但内在的原因还应从一个国家或地区的宗教、历史、文化和经济上的差异中去寻找。
复合教育基尼函数对扩大教育投入、缩小教育不平等方面具有非常明确的政策信号。随着教育的扩张,分布型教育不平等尽管可能出现一定幅度的波动,但从长期趋势看总是处于下降的运动过程中。所以,只要有教育投入的增加,就必然会收到教育不平等下降的功效;教育发展过程中分布不平等的反弹是教育扩张的自然反应,不应归于所谓社会竞争方面的原因。这对世界各国,特别是广大发展中国家制定教育发展政策、实施教育扶贫来说是非常重要的。
分布型不平等是关系型不平等变化的前提和情境条件。以往社会学关于教育扩张与教育不平等关系的讨论并未对两类不平等进行明确区分,教育扩张对教育不平等的影响也较少得到有效测量,有的学者甚至认为教育扩张不必然是降低教育机会不平等的有效工具(Bar Haim & Shavit,2013)。更多学者发展新的测量工具来分析教育供给扩大与教育机会不平等之间、分布不平等与阶级不平等之间的关系,为此展开的研究在方法和实证上都有先导性作用(Sorensen,1971;Hu,2015;Jackson,2021;Katrňák & Hubatková,2022)。本文认为,分布型不平等是关系型不平等的前提:一旦机会供给的增加确定下来,复合教育基尼系数就确定了。由于现代学校教育机会具有“得到即满足”的充要满足特性,因此若不改变教育体系结构,教育机会总量一定,那么无论机会如何在两个不同人群之间分配,都不会改变分布型不平等程度的大小。两种不平等的关系是单向的,只存在“分布型教育不平等的增强或减弱对关系型教育不平等会产生何种影响”的问题,而不会是相反。这种特殊性是将来可以继续探讨的研究议题。
与此相关的另一个研究传统在经济学领域,即有关教育扩张、教育不平等与经济增长、收入不平等之间关系的讨论。显然,如果说教育扩张与教育不平等之间存在一种规律性的变化模式的话,有些逻辑性关联就需要重新审视。经济学文献一般认为,由于存在教育的收入回报差异,教育不平等程度越高的地区收入不平等程度也相对更大(Psacharopulos,1985;Knight & Sabot,1983;Stiglitz,1973)。但是,对发展中国家来说,教育扩张是以经济增长为背书的,理论上存在“经济增长降低教育不平等”,进而可推导出“经济增长降低收入不平等”这样与库兹尼茨理论不同的研究假设。这些理论命题背后的逻辑基础与本文讨论的基本统计规律不无直接关联。
本文讨论的教育基尼系数公式(GE=∑SkGk)实际上是将复合教育基尼系数视为各级教育机会基尼的加权平均,其权重即各级各类机会之价值(如教育年限)所占份额。这种理解拓展了我们分析教育不平等问题的思路。比如,以教育年限来计算当前中国社会中的教育不平等,得到的结果是非常低的(1990年出生组中的复合教育基尼系数约为0.12)。但结合当前的社会感受,我们也许不禁会问,如此低的教育不平等为何会产生如此激烈的教育竞争?显然以教育年限为权重标准的计算不足以衡量老百姓心中真实感受到的教育不平等程度。那么,如果将权重的系数体系Sk切换到教育在收入回报、地位获得、社会流动等方面的功效的时候,结果又会如何呢?期待未来有更进一步的研究和讨论。
END
来源:“社会学研究杂志”微信公众号
转自:“中国学派”微信公众号
如有侵权,请联系本站删除!