投稿问答最小化  关闭

万维书刊APP下载

前沿 | 郑智航等:大数据在司法质量评估中的独特价值与应用逻辑

2023/5/4 14:51:54  阅读:119 发布者:

以下文章来源于吉林大学社会科学学报 ,作者郑智航 曹永海

大数据在司法质量评估中的运用

来源:《吉林大学社会科学学报》2023年第2期,“信息技术发展与中国法治创新”栏目。

[摘要]数字技术的应用为司法质量评估处理了海量信息, 因而能够提高评估的置信水平。 然而大数据于司法质量评估的价值远不止是对司法数据量的扩容。厘清司法质量评估大数据模式的运作逻辑和实践方式, 是大数据技术能度和风险控制的实现基础。大数据技术的应用能够改变传统司法评估体系自上而下的单一建设逻辑, 能够提高司法数据的数量和质量, 能够实现司法评估的跨界分析。 实践中, 案件工作量测算和裁判质量评估作为司法评估中的基础模型对于大数据的应用存在认识不足的问题, 究其根本是司法实践中对 “司法大数据应用” 存在认知偏离。 司法质量评估的大数据模式需要以数据驱动为底层逻辑, 以统一的 “司法大数据语料库” 为建构基础, 以足量的结构化司法数据为运作资料, 以司法区块链为运作载体进行建构。

[关键词]司法质量评估; 司法大数据应用; 大数据; 智慧司法

数字技术的发展引发了信息的几何式增长,由此带来的现实问题是信息处理技术和信息增量之间存在着巨大鸿沟,也即当下信息的处理速度远远跟不上信息的增长速度。这一情形在司法领域主要表现为司法相关数据的爆炸式增长同滞后的司法质量评估技术和评估体系之间的矛盾。相较于人工智能在司法审判中的主动适用,应用大数据技术展开司法质量评估在某些情形下表现为因传统评估存在失真而进行的被动适用。原因在于前者是为了提高诉讼效率减缓法院诉讼压力,后者在一定程度上则是因为数据增量导致的传统评估模式失真。从大数据技术的应用来看,一段司法信息最终能够形成司法质量评估的结果至少需要四个阶段:首先,需要就物理层的文本信息进行初步收集整理;其次,要将之转换为数据语言;再次,要有能够将之进行处理的算法模型;最后,通过计算展现出相应的成果。这一过程看似简单,实际上每一步运作都困难重重。

数据增量之所以能够倒逼司法质量评估体系应用大数据技术,源于风险的不稳定性与司法制度发展的稳定性需求之间的内在张力。但从另一个角度来看,大数据为司法制度在风险社会中的稳定发展提供了基础。随着后工业社会的到来,“风险、风险感知和风险管控成了社会形成与冲突的新源头”。一方面,社会发展变迁使得社会结构不断复杂化,进而招致社会矛盾的多元发展;另一方面,从国家建构的政治任务来看,法院还需要承担起国家权力下沉、政治话语进化、参与社会管理创新、执行公共政策、塑造司法文化等一系列功能。因此,法院不仅需要调解和应对多元化的社会风险,还需要承担一定的政治、文化任务。可见,当前我国司法制度的发展背负着重大压力,亟须通过有效的评估为其提供可行的发展方向。

基于传统司法质量评估模式同与日俱增的司法数据之间的矛盾以及我国司法制度发展与司法改革的需求,探讨如何应用大数据技术开展司法质量评估有着深刻的现实意义与理论价值。当前,大数据在法学领域备受关注,但绝大多数研究是着眼于数据相关的权利或是对数字技术的法律规制展开的,而以“大数据应用于司法领域”为相关主题的研究少之又少,这就易于造成对司法大数据应用的误解。仅就大数据在司法质量评估中的应用来看,应用大数据开展的司法质量评估是否就是“大量数据采集+线性因果关系评估”?当下司法质量评估中大数据应用的难点和重点是“自然语言理解”还是“数据收集”?当下司法大数据库建设的首要工作是“设备更新”还是“语料库建设”?这些问题在学术上或是实践中都没有达成清晰一致的共识,导致各地区法院在司法信息化发展中出现了较大的区域性差异。简言之,厘清在司法质量评估中如何应用大数据技术,对于我国司法质量评估体系的革新、司法改革的设计和司法体系的发展具有重要的理论和实践意义。

一、大数据在司法质量评估中运用的优势

大数据时代,传统司法质量评估之所以会面临失真的风险,源于传统评估模式难以实现对当下庞大数据价值的有效利用。目前来看,大数据技术的有效应用是应对这一风险的最佳手段。众所周知,大数据技术的提出和发展正是为了有效应对互联网时代信息的爆炸式增长。大数据虽然价值重大,但没有相应的分析技术支撑就不能够有效利用其价值。当传统计算模型无法在需要的时间内完成数据的处理时,建立和发展一类新的数据处理模型成为信息技术领域的重要需求。因此,当传统量化司法质量评估因无法实现对司法大数据的处理而面临失真风险时,从成本效益的角度来看,应用已有的大数据技术于司法质量评估之中不失为最优选择。

() 从小数据到大数据的应用思维

要想实现大数据在司法质量评估中的有效运用,就需要实现司法评估思维模式从小数据思维到大数据思维的转变。首先,应用大数据开展司法质量评估,必须要明晰大数据技术应用在司法评估中是否满足了“大数据”这一基础。其次,需要讨论大数据时代下应用大数据展开评估的原因以及传统量化司法质量评估失真的缘由。最后,要厘清以大数据思维展开的司法质量评估所具备的理论优势。大数据思维的评估模式应当建立在司法大数据的基础上,也就是以传统的量化分析无法实现对现有庞大司法数据的有效分析为前提。大数据是指,依照现有的计算机软硬件设备,难以在既定时间内有效处理的、大数量级、高复杂性、增量速度快、高价值的数据集合。这一概念是与传统信息技术中的“小数据”相对而言的。事实上,2015年由中国社会科学院法学研究所法治指数创新工程项目组完成的《中国司法透明度指数报告(2015)》就明确表示司法运行必须要适应大数据时代。2018年《法治蓝皮书·中国法院信息化发展报告》显示,法院信息化建设规划日益完善。如今,我国早已正式进入了司法信息化的时代,数字信息技术在司法领域的应用进一步加快了司法大数据的增速。

庞大的司法数据无法通过传统的算法模型进行有效处理,这既是传统量化评估模式失真的主要原因,也是当下司法评估应当采用大数据技术的原因之一。传统量化评估模式是在小容量的数据集基础上完成的,往往采用问卷调查的数据或是已公开(或半公开)司法数据进行运算。首先,以问卷方式获得数据需要保证有力的问卷效度与信度;其次,数据样本量的大小会对结果的偏差产生影响;最后,基于大数据集现实存在这一实际状况,调查能够得到的数据显然只是一方一隅。同时,传统量化评估以能够获得的公开或半公开司法数据进行运算,呈现出先天劣势。一方面,对于评测者而言所获数据量是有限且无法充分支撑评测研究的;另一方面,传统量化司法评估活动易于忽视测量的标准与方法,同时受限于原始数据不能全面共享,数据的运用和结论在某种程度上是一种自我说服。此外,传统量化评估采取单一的评价指标设计,其科学性是存疑的。现有评估指标的设计依赖于已有数据和经验,而小样本的评估模式又难以充分全面地对司法运行作出评价,导致评估指标与体系难以迭兴,实践中的评估便会为了评估而评估。这并不能有效促进司法的发展,反而有规训司法发展的风险。

大数据技术的发展正是为了有效实现对数据财富的挖掘。大数据技术的应用能有效实现对数据的捕获和分析,以最大效度提取价值。在司法评估领域,采用大数据技术进行评估的优势在于能够短时间内收集、分析、挖掘数据,从而为司法决策的制定和司法制度的发展提供可靠参考。相较于传统多项式时间算法求解大数据问题的低效,大数据算法更具优势。综上,大数据技术在司法评估领域的有效应用具有充分的现实基础与理论可行性,大数据司法评估的展开意味着需要脱离原有的小数据思维模式。这不仅意味着需要实现共建共享的司法大数据库,还意味着大数据算法的开发以及大数据思维模式下司法评估体系、评估机制和评估标准的建设。

() 从小数据采集到大数据抓取的统计范式

司法评估的实现立基于对司法数据的分析、挖掘,而大数据技术的应用改变了传统的数据抓取模式,提高司法统计数据的质量与速度、信度与效度。一般认为,大数据具有4V的特点,IBM公司提出其还具有Veracity(准确、高质量)这一特点。作为特定行业领域大数据的司法大数据同样具备5V的特点。此外,由于司法数据的公开程度具有相对封闭性,因此,司法大数据还具有获取难度高的特点。对于司法质量的评估主体而言,开展司法质量评估活动就面临着司法大数据增速高、流动快同获取壁垒高之间的冲突,因为一旦为了保障数据的捕捉效率势必要放弃数据采集的全面性,从而会折损数据价值的有效性。但如果为了保障数据的全面有效,就意味着需要耗费大量的时间和精力。然而,数据的高流变性又会导致数据价值的流失,也就是耗费大量工时采集的数据在采集完毕时可能已经过时,从而使得评估效果大打折扣。因此,面对大数据给传统司法评估统计造成的困境,采用大数据算法应对是必要也是必然的选择。

1. 传统小数据分析模型的数据采集困境

传统的量化评估对于数据的获取主要包括内部获取、查询()公开数据以及问卷调查三种途径。前已述及,无论是通过问卷调查或是查询公开或半公开数据进行的传统量化评估都存在着先天缺陷,而通过内部数据获取开展的量化评估,评估主体的中立性又难以保障,并且这种内部数据一般仍具有很强的区域属性,由于缺乏数据的比照,最后评估结果的呈现依然充斥着主观限制。总体来看,传统量化评估的数据采集总会出现数据可信度低、样本量代表性不足、评估主体中立性难以保障、问卷信度效度偏差以及所收集的数据重考核轻研判等问题。这导致传统的司法量化评估难以实现对司法问题的揭示,反而陷入了工具主义的技术泥淖。事实上,传统量化评估过程中的数据采集之所以会出现上述的诸多问题,源于上述三种数据采集方式无法实现对司法数据的有效收集。

2. 大数据技术的数据抓取优势

传统数据采集受制于司法信息的不公开、与信息生产主体对接困难、信息节点松散、司法信息数据化不够客观等原因,致使全面实现司法信息统计阻碍重重。相较而言,大数据技术在数据获取方面有着天然的优势。一方面,大数据技术在司法领域的全面应用,能够令司法信息的数据化与司法信息的生产在一定程度上同步,避免信息采集的延后。随着后现代社会中社会风险的进一步扩张,社会矛盾与社会纠纷的多元化发展进一步加剧了司法的运作负担,而构建司法数据库则能够有效辅助司法运作,提高案件的审判效率。在智慧法院的建设进程中,我国司法的数据化已然初具成效。另一方面,大数据技术的运行能够实现对不同主体间的信息勾连。相较于传统的小数据采集,数字技术构成的信息网络系统具备更强的数据形成、积累和流转能力。

3. 司法大数据获取的难点

大数据技术应用于司法信息统计极具优势,但在司法实践中,大数据技术对司法数据的捕获仍有难点。首先,以大数据技术展开司法信息统计仍要以信息主体的信息开放为首要前提。以《中国司法透明度指数报告(2021)》所公布的数据来看,我国各法院司法公开仍不理想。其次,信息接入是大数据技术捕获其相关数据的必要条件。然而,当前我国并未形成统一的司法计算机语言,各地方司法信息的数据化仍具有较强的地域色彩,单纯的信息接入与整合就变得毫无意义。最后,在司法运作过程中应用大数据技术虽然能够使司法信息的数据化同步进行,但事实上所获得的大多数是非结构或是半结构化数据,这类数据难以支撑司法知识图谱精准构建。对于此类数据,当前已有的大数据算法难以对其展开有效分析和挖掘。即使大图算法能够对部分非结构及半结构信息予以处理,但它仍处于探索起步阶段,更遑论应用于司法领域。欲要充分实现大数据在司法质量评估中的优势,就务必要攻克上述难点。

  () 从单一数据到数据跨界关联的全局分析模式

大数据技术能够推动司法数据同其他数据的跨界关联,实现司法评估在宏观层面的整体性评价,不仅有益于提高司法系统对风险的敏感度,也有利于明晰司法建设的困境。相较于传统小数据的测算分析难以有效抓寻不同系统之间的关联性,大数据技术能够利用大数据高流速的特性,构建数据网络形成不同数据库之间的数据关联,实现对不同领域数据的融合处理。一方面,大数据技术能够通过对跨界数据的应用全面刻画组织内外的风险,帮助组织应对社会变化过程中因信息不对称和不确定性而导致的风险;另一方面,大数据技术能够实现从宏观整体的角度对司法在社会中运行状况的描绘与分析。

具体而言,大数据技术除了能通过丰富司法大数据、增强数据的可用性、深化对数据的分析与挖掘来实现大数据价值,还能够通过应用转移、跨界植入、融合创新的途径来实现。应用转移就是可以将其他数据库的信息应用于司法评估,跨界植入和融合创新则是通过形成一个新的数据库实现数据价值。大数据分析思维着力于相关性分析,当一组数据能够被确定有相关性时,则可以通过对其中一者的检测,对另一者予以预测分析。正如Aviva公司将人们的生活大数据转移到健康领域用生活数据分析客户的健康一样,若法官性别或者合议庭成员间的熟识度会影响司法判决,自然可以通过对前者的检测去评估某一法院或某一份司法裁决的公正性是否受到了干扰。通过对其他数据库数据同司法数据的融合所形成的新数据库,对于求解特定问题同样具有实质意义。例如,某地区法院在某阶段的裁判文书公开情况较差,不一定是其无公开意愿,可能是因为这一时段的案件多属不应公开裁判文书的案件;或者案件量突然增多人手不足公开不及时;或者经济状况较差设备不足;再或者受疫情影响该时段结案数量骤降等等。这一分析思路类似于多元回归分析,即对于某一结果的原因探求不局限于单一线性因果关系,而大数据技术在探求相关性方面极具优势。

二、大数据与案件工作量测算

案件工作量测算可以简单地看做仅以司法大数据为基础即可完成的司法质量评估活动。司法质量评估的内容和体系繁多,中国近年来出现了多种司法质量评估方案,包括中国司法透明度指数、法治满意度指数、司法文明指数、中国法院“智慧诉讼服务”评估、中国法院“智慧执行”评估等等。一方面,针对这些内容进行的评估不得不通过跨界数据关联予以实现,因此难以透过一篇文章实现体系性的深入考察,而从技术应用层面来讲,大数据技术能够实现数据跨界关联,前文已有论述;另一方面,考察仅基于司法大数据就能够开展的司法评估,能够使测算评估模型更为简洁,清晰明了地展现当前应用大数据技术的司法评估活动所遇瓶颈,为进一步建设大数据司法评估体系奠定基础。相较于传统案件工作量测算的单一性与片面性,应用大数据技术对司法案件分析测算不仅能够精准地对不同工作差异化赋值,还能够通过测绘法官的工作饱和度,为保障法官在司法活动中的行为质量提供参考。当前,大数据技术在案件工作量测算中的应用已取得区域性成果,但同时也暴露了司法评估活动在自然语言理解方面的缺陷。

  () 法院案件工作量测算的传统方法

法院案件工作量测算最初被用于对法官和地方法院的工作绩效考核。传统的工作量测量就是单纯以案件数量为重心搭建的评估体系。用简单的模型来表示,就是“a法官的工作量/一个单位周期”,这里的工作量一般包括一审以及二审的收案、结案数量等等。这种“案/人”的评测方法,在世界范围内都较为普遍,也是我国目前各级法院主要的传统测算模式。然而,这种单纯用办案量来量化法官工作量的评估模式,测算标准单一,过于关注数量忽视了案件的难度、复杂性、社会影响性、法官办案质量等评价向度。同时,由于工作量评测同员额制度、绩效考核相关联,从而会导致在具体的司法过程中出现评估结果失真、司法工作唯指标化的问题。

第一,测算方案对评估指标的设置过于简单,造成了评估测算重数量轻质量的现象。一切与人相关的活动都是复杂的,由人际网络所构成的社会系统更是如此。“对于与人相关的复杂系统的整体认识,尚缺失一个环节,就是人类自身行为在时间和空间上表现出来的复杂性。”司法作为调节社会关系的重要手段,需要对复杂的案情予以解构、分析,再找寻对应的法律解释框架,这一过程本身就是复杂的。案件的归类不同、牵扯人数不同以及证据完整性不同等诸般因素,都会影响司法运作的难易程度。因而,法官在不同案件中需要投入的精力不同。如若只评价案件数量而忽视案件的复杂性,就会导致法官过分追逐案件数量,出现推脱疑难杂案、粗糙办案以及人为拆分案件增加统计量的情形。

第二,传统的案件工作量测评以案件数量为导向,忽视了对司法过程的评价,从而造成评测结果的失真。案件工作量测算的目的是评估法官在司法活动中的成绩,单以案件数量对法官的司法裁判工作进行量化的结果展示,显然无法真实有效地反映法官司法活动所创造的效益。一方面,当代中国法院不仅需要承担基本的审判职能,同时还需要承担其他的社会职能与政治任务。传统的测评指标因为缺少数据测算,难以实现公正的量化比较,比如它无法就“法官完成的一项研究性工作换算成多少办案量较为合理”这一问题做出回答。另一方面,司法裁判承担着一定的社会、文化和政治功能,案件数量测算并不能够对于一项司法裁判所实现的社会效应、文化效益以及政治效能予以评价,这就偏离了这一评估活动的根本目的。

第三,传统的量化工作测算有可能会导致法官对司法工作内容的懈怠,造成唯数据、唯指标的工作倾向。这种量化评估指标的设定,本意是为了激励法官在某一维度提升工作效益,但由于它同法官奖惩机制相挂钩,导致了法官在司法实践活动中对指标的狂热追逐。当法官开始一味追逐考评指标时,便会呈现出指标支配司法实践的情形,例如调解率的指标设置令法官不遗余力地迫使当事人接受调解。这种唯数据、唯指标的倾向显然背离了司法评估制度的设计初衷。综上而言,正是因为传统的测算方法不能够有效实现对“司法过程”的评测,才导致了指标单一、结果失真、唯指标化工作倾向。因此,实现对“司法过程”的有效评估是当前应用大数据技术于司法评估活动的期许。

据具有依赖性。

要素拆分测算方法依然面临着数据统计的难题。诸如各法院所采取的四要素或者三要素评估办法,很大程度上并不是因为这种要素分类客观,而是现有的技术能够对其进行统计和测算。大数据以及大数据技术的应用在一定程度上可以减轻数据压力。为提高测算的科学性,近年来各地方法院尝试将大数据技术引入案件工作量测算工作中,取得了一定的成就。例如,贵州省遵义市中级人民法院的民商事法官审判工作量饱和度分析系统,意图以审判前对案件的评估测算,进行智能分流。法院通过大数据技术进行案件评测的目的,一方面是要均衡法官的工作压力,另一方面就是要突破旧有的唯案件数量评估模式。

() 大数据测算模型的建构困境

大数据技术能够收集到丰富的司法数据,从多维度刻画法官工作量。实践中运用较多的审判工作量分析系统,或是法官工作量饱和度测算模型都是基于前述“要素拆分”测算模型而搭建的大数据测算模型。然而在司法实践过程中,能够直接用于评估的结构化数据,种类十分有限。司法大数据能够被充分运用的前提是,大数据技术能够实现司法自然语言理解。简言之就是需要实现对真实文本的信息化识别、定位、分类、分析等一系列技术操作,这是司法评估活动能够有效利用司法大数据构建测算模型的关键。从技术层面来看,目前大数据技术不能够全然代替人脑,难以实现对现实文本的精细化识别、分析等等。这就造成了在司法评估领域构建大数据评测模型的困境。

第一,基于“要素拆分”搭建的大数据测算模型,需要精准且全面地从一个完整的案件过程中进行要素切分。模型搭建时,要素拆分是基于主观认识来完成的,当前分析模型缺少成熟的数据集训练,也就不能够为要素的抽取提供可靠的分析,但是,仅凭借人的主观经验难以实现对于A={A1,A2,,Am}这一集合中所有要素的穷尽。

第二,大数据工作量测算模型的搭建需要对各个要素的权重进行测算和分配。实践当中,各地方法院一般采取要素权重的平均化处理。客观来看各个要素之间显然应当有轻重之分,但是主观的要素权重处理容易干扰配比的客观性,而且不同地区、不同案件之间又存在差异,这些差异也应当成为要素权重配比的参考。实践中自上而下的设计模式,意味着难以实现各要素权重的精细化,因而利用大数据技术自下而上的驱动模式测算要素比重就极为重要。

第三,当前算法技术对于文本的识别和定位技术尚不完善,分析系统在实际运行过程中难以实现对所有信息的精准识别。现有的技术主要应用于结构化信息文本的处理,而大量的司法文本数据是半结构或者非结构化的。同时当前的技术对于词义的识别难以做到精准的场景化识别,意即对于词义的理解并不能百分百地对应到文本语境中。以案件繁简分流系统为例,它基于诉讼文本进行文本分类,简单地说就是使用分类算法抓取文本中的关键信息,通过与预设的信息库进行比对将文件投档。然而在案件初期就对案件进行要素拆解量化,实际上是对诉讼文本提出了结构化的要求。此外,案件的难易程度并不是由某一个或者某一组要素单一决定的。比如可以将“争议标的额大”“连环杀人”等字样赋予较高的权重,将“小标的”“交通肇事”等字样赋予较低的权重,但实际状况可能恰好是前者为简单易结的案件,后者则极为复杂。

综上而言,在理想状态下大数据工作量测算模型应该能够通过动态的案件监测实时调整和测算案件权重。对于这一难题的破解有两种方式:一是实现技术升级完成人脑模拟技术,进而对大量半结构或非结构数据进行处理;二是通过人为的数据库建设以提高现有大数据算法自然语言理解的能力。显然后者更切合当前的实际,但事实上我国司法大数据库仍以非结构和半结构数据居多,司法裁判当中大量案件信息未能够实现结构化。因此,对于大数据司法评估体系而言,必须构建大量的训练集、验证集和测试集支撑算法模型的调整和发展。

三、大数据与裁判质量的评估

司法裁判质量评估不同于案件工作量测算对工作强度、难度、饱和量的量化计算,它是针对司法裁决的质效进行评价。传统的司法裁判质量评估是一种后期评价机制,其指标设计以案件效果为中心。这种事后的评价一方面有着引导司法裁判的旗帜性作用;另一方面这种事后评价并不直接针对裁判文书本身,因而会为法官司法裁判带来困扰。相较而言,当前各地方法院试点运行的辅助审判系统中大规模应用了事前、事中的案件评估机制,它通常被应用于辅助法官进行司法活动。出于伦理和技术上的原因,这种评价机制也只能发挥辅助性作用。一方面,一旦完全参照计算机系统给出的裁判建议进行司法活动,整个司法裁判就会陷入机械化的深渊,法官的主体性地位就会被淹没;另一方面,大数据技术在司法审判分析之中能力是有限的,它的运行以数据模型构建为基础,随着社会的复杂化和司法的发展,陈旧的数据模型会给出不合时宜的答案。从技术层面来看,针对司法文书的分析技术对于司法大数据语料的依赖性极强,因而建立和完善司法大数据语料库对于进一步发展人机结合的现代化评查机制极为重要。

() 传统的量化裁判质量事后评估机制

裁判质量评估意图通过建立量化评估模型,对各级法院的案件质量进行评估。相较于当前大数据辅助审判系统在司法裁判中的应用,这种评估是一种事后评估机制。案件质量评估能维持司法公信力,促进案件质量提升,但也存在成本偏高、地区差异明显、办案功利化的问题。

首先,传统的事后评估机制对于人力成本消耗较大,进一步加重了法院的工作负担。裁判质量的传统量化评估模式主要是通过对各级法院各个案件的信息录入、汇总、加权计算得出最终评估分数。一方面,信息技术的发展有益于案件信息的及时录入,有利于这一评估模式的进行;另一方面,这种评估模式目前仍需要各个法院通过人工进行数据的录入,这对于案多人少的法院来讲,无疑会加重法官的工作负荷。因此,当下裁判质量评估体系的建设应当充分利用大数据技术,一方面,应当规范案件信息的录入模式,形成格式化的信息模块;另一方面,应当实现司法系统内部的信息共享与信息流动,充分应用大数据技术进行数据核算。

其次,由于各地区在经济、人口以及文化等基础因素上存在差异,因而无论是区域化还是统一化的评价指标都难以实现评价的公平性。一方面各地区的社会矛盾在种类和数量上不同;另一方面法官素质以及案件审理水平也有着较大的地域差异。若采用全国统一的事后评价体系,那么对于身处社会发展速度较快、经济发展水平较高地区的法院,面对社会变迁所导致的新案、疑难案件,其裁判难以保证同处理简单的小额纠纷案件一样办得又快又好。由于这种地域差别的存在,一刀切的评价体系显然有失公允,但制定区域化的评价指标依然无法改变这一困境。一方面,区域化的评价指标不可能细化到区县级别,这可能会导致自测自评从而丧失评测的意义;另一方面,以各省为单位,由高级人民法院订立指标的方式,适用于那些地域较小且各地域发展较为均衡的地区。对于大多数省份,各中层、基层法院的法官素质、社会状况仍有较大差异。

最后,现有的指标体系设计并不能够促使法官竭力办好案件,办案宗旨反而会成为避免“负面效果”。传统的案件质量评估指标设计仅通过案件“效果”来进行评测,同案件实体处理的公正程度之间存在偏差。造成案件发改的原因很多,“二审或再审发回重审或改判的案件原审不一定存在质量问题”。通过自上而下的指标设计实际上很难覆盖司法裁判中很多重要的节点。当评估指标与司法公正裁决之间出现分歧时,基于奖惩机制和绩效考核,法官不得不为了个人利益与部门利益选择适宜评估指标的裁决方式。因此,基于充分的司法大数据,通过自下而上的数据驱动分析司法境况,架构动态的评估体系,对于司法裁判质量评估具有积极意义。

() 司法裁判质量的大数据评估模式

我国司法裁判质量的大数据评估模式当前广泛应用于立案以及案件的审理裁决阶段。这一模式不应当同绩效考核直接挂钩,因此主要应用于司法辅助系统。正因为大数据评估模式在司法活动中的辅助地位,所以极大避免了地域差异、法官功利化办案的缺陷。同时,因大数据评估模式没有采用“多次录入-评估”的传统量化评估模式,而是基于数据检索技术进行数据搜索、分析、推送,因而可以实现“搜索”“录入”的同步进行,有效减少人力成本。

 1.大数据评估模式的优势

相较于传统裁判质量量化评估,大数据评估模式具有促进同案同判、预警虚假诉讼以及减少法官工作压力等优势。首先,大数据技术的应用能够通过实时的信息录入与检索生成相应的案件评估分析报告为法官案件裁判提供参照。例如上海的“206”系统和最高人民法院的“智慧法院大脑平台”,通过对案件信息抓取、检索以及匹配,建立相关的审判预测模型或者进行类案推送,不仅能够促进同案同判,也能够促进量刑规范化。其次,立案阶段应用偏离度算法能够有效识别虚假诉讼,甄别风险案件。例如江苏省高级人民法院的智能预警系统,通过汇集司法数据和外部检测数据形成新的数据库,运用大数据技术构建了“套路贷”虚假诉讼案件算法模型,即对虚假诉讼案件及当事人进行数字模块搭建,再与立案案件进行匹配识别,从而甄别虚假诉讼。最后,大数据技术一方面能够通过裁判记录、裁判文书的数字化,提高裁判信息的“录入”效率降低人力成本;另一方面,能够自动化地生成格式化文本,减少案头压力。例如文书自动生产系统、证据查验系统、裁判文书纠错系统等等都能够有效减轻法官的工作负担。上述内容虽然只是司法裁判应用大数据的部分优势,但具有代表性,有利于后文的进一步分析。

2. 大数据评估模式的建设困境

司法裁判质量的大数据评估模式固然有优势,但这一模式的建设困境也显而易见。以上述三种应用场景为例,无论是立案阶段的偏离度预警还是审判阶段的类案推送、量刑评估,抑或是整个办案流程中的文书生成与证据查验,都是建立在“信息输入-信息矢量化-数据比对-报告生成”这一基础运算模型上的。无论是机器学习或是其他大数据算法模型,都无法处理纯文本数据,它们只能在数字组上工作。因此,NLP自然语言处理需要建构一个庞大的司法语料库以备于实现信息检索功能或者信息的挖掘分析预测功能。首先,司法语料库的构建需要以现有的文书为基础,进行切词标记和解析,从而形成一部“法律-数据”的语词库。其次,需要以现有的文本为基础,进行词向量处理,构建相应的信息库以便于数据匹配。最后,在司法裁判过程中,将立案信息、庭审记录或者裁判文书同样进行切词标记处理,然后通过命名实体识别(NER)与信息库进行匹配,继而完成类案推送。其他的评估报告或者文书生成也大致需要经过这样一个过程,并以此为基础进行进一步地分析运算。

从各法院的数字化建设层面来讲,各地区法院数据标准不统一、数据平台不连通将导致司法语料库建设和运行存在困难。第一,由于各地区的语词库建设工作相互独立,因而想要以融合后的跨区域数据开展评估工作十分困难。第二,各个法院受到地域文化以及法官个性因素的影响其语言风格难免存在差异,因而导致文本信息数据化后的统一性不强,不利于精确检索。第三,以文书之类的数据包为检索单位时检索难度大,数据无法实现对所有重要信息的标记。虽然通过算法技术进行去数据冗余、词干提取、命名实体消歧,一定程度上能够减轻运算负担,但无法彻底解决上述问题。

从算法技术层面来看,现有算法技术对司法文书的读取、分析和处理并不能实现结构化。一方面现有文书存在格式不规范、内容不完整以及旧有的瑕疵文书未整理等问题;另一方面,无论是正则匹配方法或者基于文本分类模型的方法抑或是序列标注模型方法,都需要通过对文本的结构信息进行识别才能够进行后续的运算。司法实践中,由于案件的复杂性以及司法语言的抽象,导致建构完全结构化的文书标准存在困难,但正如法律的滞后性一般,以现有复杂多元的司法案件为蓝本,统一和协调司法用语,构建标准化和结构化的电子文书体系实有必要。

3. 大数据评估模式的应用风险

相较于传统的量化裁判质量评估,大数据评估模式具有前述优势的同时也有着潜在风险。首先,虽然大数据评估模式没有直接与考核相挂钩,但实践中它依然被应用于审判监督从而与奖惩机制间接挂钩。通过实时的数据评估和监督预警,能够在第一时间实现审判监督以警醒提示的方式提高司法工作的纠错效率,但同时也可能会造成对法官自主办案的束缚,造成法官产生技术依赖的风险。其次,司法大数据在审判阶段对案件的评测可能会影响法官在案件中的独立性。由于我国司法语料库还没有形成统一的体系建设,因此诸如类案推送、量刑偏离度预警等功能实际上都建立在一个“模糊检索”的算法基础上,会降低评测报告对于个案的参照价值。法官过度依赖评测报告进行司法审判,虽然会避免数据预警,但可能会造成忽视个案特性、影响个案公正的问题。最后,这种事前事中的数据评测模型并不能够有效替代传统的事后评估机制。司法裁判质量评估的重要作用不仅在于对司法裁判的约束,更是为了描绘司法运作的图景,发现司法实践中的问题,为司法发展和司法改革提供参考。

() 人机结合的现代化评查机制

前已述及,传统量化裁判质量评估由于指标体系过度依赖已有司法经验,缺乏对当下司法实践与社会境况的模型建构,导致评估活动存在一系列问题。大数据驱动裁判质量评估模式虽能避免这些问题,并且其评估报告在立案、审判、监督等环节具有重要的辅助价值,但仍存在司法大数据语料库和文书结构化体系的建设不足以及技术依赖、影响个案公正等问题。因此,有必要构建一种以数据驱动为基础,贯穿审判活动且各个环节各有侧重的人机结合评查机制。

首先,事后评估机制能够发挥纲领性的旗帜功能,从宏观层面约束和指导法官的司法活动。由于传统的事后评估模型存在诸多弊端,因此有必要建立大数据驱动的事后评价体系。应当在充分应用司法大数据对司法运行境况进行模型构建的基础上,利用数据驱动的相关分析,发掘司法公正、司法效率等与司法改革和发展主流意识形态相关的指标体系。通过运用Map-Reduce等算法技术进行数据挖掘,寻找司法活动中可能存在的各种相关关系,继而通过大数据分析算法进行验证,最终形成相应的指标体系库,再通过“德尔菲法”进行指标的筛选和矫正,避免陷入“唯数据”主义。其次,应当重视司法数据的规范化、司法大数据平台的统一化,提升数据使用的安全与合理性,以消除司法数据应用的一系列副作用。最后,应当规范大数据评估体系在审判中的预警作用,完善“机器预警+人工审查”的机制,保障法官司法裁判的独立性,尽可能保障评估预警的提升作用而不是干扰司法审判。

四、大数据推动下司法评估的变革方向

人类行为是复杂的,传统的理论和分析工具对于人类社会的测算时常表现出一种无力,但大数据技术为分析和透视人类社会提供了新的理论、方法和技术支持。然而,这并不意味着对大数据及大数据技术在司法评估中的应用就是“司法”和“大数据”的简单叠合。明晰技术能力、技术应用难点以及技术风险是有效应用大数据的前提。202212月最高人民法院发布的《关于规范和加强人工智能司法应用的意见》表明,推动数字技术与司法工作的深度融合,加强司法数据中台和智慧法院大脑的建设已是势在必行。不同于传统量化评估模式,大数据推动下的司法评估应当更具有全局性,不应局限于对某一传统司法问题进行评估,要通过“互通共享的区块链联盟”对可进行大数据司法评估的问题进行跨界关联分析。首先,其运行应当以高可用的结构性司法大数据作为运作基础;其次,相关指标的设计应当充分应用大数据挖掘和分析技术来构建,以避免传统评估指标设计的主观性等问题;最后,建设有效互通的区块链联盟,从而推动和完善大数据司法评估的体系性建设。前文已结合司法评估的实践境况,讨论了我国大数据司法评估体系当前的发展困境,以下将从应然层面论述通过建立高可用的司法大数据语料库、数据驱动的指标设计模式以及应用区块链技术形成平台互通的多元化评估体系。

() 高可用大数据推动的司法评估思维变革

从技术路径来看,现有的大数据评估模型的建构需要通过“构建数据集合-数据整理-深度机器学习”这一简要路径来完成。尽管实践中司法大数据应用已经取得了一定成效,但依旧存在评估架构设计的人工依赖性强、自然语义理解度低、识别精准性差、算法训练的可用样本稀缺等问题。一方面是因为现有评估体系缺乏数据驱动的数据应用思维,另一方面是司法大数据的技术应用缺乏充分的司法大数据语料库支撑。

第一,数据驱动的司法评估模式是以大量可用的结构化司法大数据及非司法大数据形成的司法数据库为基础进行的评估测算分析。因此,在进行大数据司法评估之前需要首先进行问题分析,即讨论该问题是否属于大数据可计算的问题。一方面,并非所有的司法评估问题都可以量化计算,质性评估方法仍有必要应用于司法质量评估中,尤其是针对法官个体进行评估时质性方法具有重要的意义。无论是大数据还是小数据的量化测评,都缺乏对社会情境的理解与穿透,对于问题的分析更多以横向为主,缺乏纵向的深度理解。另一方面,并非所有量化问题都是大数据可处理的问题,也并非所有的评估问题都适宜大数据评估模式。大数据计算方式以相关性测算为重点,对于一些具有强因果关系的评测应该遵循传统因果关系评测的路径。对于司法改革和司法体系的建设发展而言,顶层的制度设计需要确定问题之间的因果关系。两个事物具有相关关系并不代表就具有因果性,大数据的相关性分析甚至可能会遮蔽因果关系,基于小数据展开因果分析于司法评估而言仍具有不可替代的作用。

第二,高可用司法数据库的建设是应用大数据技术进行数据计算的基本前提,亦是大数据司法评估体系构建的基础。一方面,高可用司法数据库的建设以足量的司法大数据为基础,足量意即不仅需要保证数量的充足,同时要保障这些数据质量的可用性。大体量、高质量的司法数据库可以通过两种方案进行建构。一种方案是可以通过对大量法律文本的统一标注,对同一词汇在不同场景中的使用进行区分标注,然后通过模型训练和强化算法学习,不断提高识别精准度,类似于当下ChatGPT的技术路线。另一种方案则是先进行司法用语的规范化构建,尽可能包含较多情形下的司法术语库,再对这些术语库中的自然语言进行标注,形成“司法术语的语料库”。另一方面,高可用数据库需要构成一个整体性的数据库架构,以保证能够对各节点请求提供有效服务,提升系统的稳定性。当前各地区司法数据库的独立运行阻碍了司法大数据的融合发展,而统一的高可用数据库架构就是要保障各个数据节点存储、访问功能的正常运行,通过顶层设计的数据规范体系来实现各类数据系统、平台协同运行。

第三,形成统一的结构化司法文书规范。从技术应用层面来看,文本的结构化特征更有利于算法标记,从而提高数据匹配结果的精准性。一方面,任何司法评估算法模型搭建都需要足量的结构化文书作为“数据集”“训练集”“实验集”,数据集在具体运算中的基础程序就是“标记-识别”;另一方面,只有结构化的文书才能够被算法精准识别。一般而言,算法通过NER或其他自然语言理解技术进行文本处理时,对文本的检索包括精确检索与模糊检索两种。前者容易因文本结构性不强导致数据缺失,而后者更能保障信息的全面性,但模糊数据可能会造成数据冗余等问题,从而不利于数据的进一步应用。如果只是简单的检索推送,模糊检索自然更有效率,但如果需要进一步应用数据进行挖掘和分析则必须在精确检索的前提下提高文本的结构性以减少数据缺失。此外,通过顶层设计形成结构化文书规范后,对于一些已有的具有代表性的非规范性文书也应当进行重制,以便于算法模型的设计和学习。

() 大数据算法推动的司法评估指标设计

以大数据算法为基础的司法评估指标设计,既需要应用自下而上的数据驱动思维,依靠大量的数据相关性分析,运用算法技术进行指标挖掘、分析和验证,也需要以数据评测为参考进行顶层设计。传统量化的司法评估指标设计采用自上而下的设计模式,这类指标的设计固步于已有的经验,虽然对因果链明晰事项的评测具有优势,也可以应用于对大数据评估指标的逻辑验证,但不能基于对信息社会的复杂性认识建构评估指标。由于信息社会的复杂性,“司法系统本身没有能力生产对司法判决至关重要的可靠的事实知识”。相较而言,基于数据驱动设计的司法评估指标更具对司法外社会的认知开放性,能实现对社会的信息反馈。

一方面,应优化具有描述性简单评估模型的指标设计。这类评估主要应用大数据检索技术完成评估工作,例如类案推送、量刑预警报告等司法辅助系统中的评测。由于它以检索算法为基础,因此指标设计也应当偏向于宏观分类,应以能够形成对司法物理世界的描述性评估报告为首要目的。司法实践中这类指标一般是基于文书中的结构化类型标签而形成的,例如北大法宝或者中国司法大数据服务网的裁判文书分析版块,检索模块中的“案由”“年份”“标题”等就是描述性的司法评估指标。随着司法文书结构化的进一步发展,相应的结构标签也会越来越多。

另一方面,应当充分应用大数据挖掘和分析技术,为司法裁判质量评估、案件工作量评估等复杂评估模型提供参考。第一,应确定某一评估问题为大数据可解问题。第二,通过挖掘算法能够进行预测性分析,即以大量的数据为基础进行相关性分析,探究与该评估问题具有相关性的关联指标。这一关联性指标即作为原评估问题的下级指标。通过大数据挖掘算法提供的相关关系指标,并不能直接作为关联指标应用于司法评估,例如谋杀率与某公司业绩可能呈相关性,但事实上二者并无因果关系。因此,还需要进一步通过数据分析对呈关联性的指标进行因果关系检验,以筛选出合适的评测指标,必要时也应当通过传统的量化评估和质性评估对筛选出的评测指标进行进一步检验和矫正。第三,待相应指标完成筛选后,应通过多元回归分析或其他测算模型测评各个指标应分配的权重。第四,多次重复前两个步骤,直到形成较为清晰可操作的评估模型。

  () 区块链推动的评估体系建设

大数据技术能实现对大数据的跨界存储和运算,有利于推动形成多元化的司法评估体系,但作为一种中立的技术工具,大数据在应用过程可能带来隐私侵犯、数据垄断等风险。而司法区块链的建设发展能够有效规制大数据的应用,也能够打通各地区的数据隔断,推进司法大数据及其应用的全国性统筹发展。20225,最高人民法院发布的《关于加强区块链司法应用的意见》提出,要“建设与社会各行各业互通共享的区块链联盟,形成共性基础技术支持能力,建立统一、开放的区块链司法领域应用技术标准体系,为跨部门节点接入、跨行业数据共同维护和利用提供规范化服务”。于司法大数据评估体系的建设而言,应用区块链技术能保障司法数据的真实性与完整性,实现高可用司法数据的互通与管理,有利于多元的大数据评估体系建设。

首先,去中心化的区块链技术于司法评估体系的建立而言,有益于保障司法数据的安全性,同时利用大数据评估技术可以实现对数据信度效度的检测,激励各主体上传真实、完整和有效的信息。作为分布式数据系统的区块链,其价值主要在于效率和安全。一方面,区块链技术具有安全共享信息的优势,能够降低信任成本,保障司法信息安全,促进有效信息的生产、传播与共享;另一方面,区块链作为促进信息流通的共享机制,能够解决因行政结构造成的信息传输失真,为外部评估监督提供了技术路径。

其次,区块链技术的应用能够促进司法评估的多主体协同研究,更有利于清晰地描绘司法境况,展开较为公正的司法评估活动。司法区块链不仅能够保障信息的安全性,还能够通过各节点间的信息关联保障信息的可信度,促进司法信息的完整、有效。数据时代知识信息的生产具有明显的协同性特征,当下庞大的司法信息便是由各法院协同生产而成。由于文化地域等因素的不同,各地区各级法院作为司法信息的生产主体展现出多样化的个性特征,而司法区块链的搭建就是为了打破各地方法院之间的数据屏障,为应用大数据技术进行司法评估活动提供技术支持。同时,由于各地方法院的信息化发展主要依赖于第三方服务购买,既不利于数据统筹,也使得司法信息有着泄漏或篡改失真的风险。因此,实有必要强化顶层设计,形成一套由国家管控的司法区块链体系,以保障大数据司法评估活动中数据的质量、容量以及安全性。

最后,数据的高流通和可复制性为多元主体参与司法评估提供了可能,但也意味着存在不法分子利用司法数据破坏司法公正的风险。因此,应当先搭建和完善司法体系内部的信息区块链,并形成数据管理规范,同时在跨行业跨平台的跨链联盟建设中也必须保障司法信息区块链的信息安全。司法评估体系的建设目的一方面是为了对司法境况进行测绘以图勾勒出司法体系建设的可行路径;另一方面是为了以司法公正、司法公开、司法秩序等作为司法建设的旗帜目标,通过评测、建议、警示、奖惩的手段规范法官司法活动。司法数据的公开流动提高了社会公众参与司法评议的可能性,但案件审判有其历史限制,不存在绝对公正与绝对理性的正确判决,依照大数据所得的评测并不一定就是最优解。一味追求大数据求解,可能反而会陷入片面技术主义的迷思中。因此有必要对司法领域的信息进行分级管理,例如公开的程度可以设定为“完全公开-半公开-部分公开-内部公开-内部半公开”。

总之,大数据技术应用于司法绝不是将“大数据”与“司法”简单叠合。通过对大数据技术在司法评估中运用的考察可知,当前我国司法评估的大数据模式还处于建设阶段,存在评估设计脱离了大数据思维模式的问题。当下大数据司法评估体系的建设需要建立在司法与大数据的融合基础之上。因此,建立司法数据语料库,形成司法文书的结构化规范,搭建数据驱动的评估指标设计模型,推动一体化司法区块链建设,应成为我国司法大数据和智慧司法建设的重要内容。

转自:“法学学术前沿”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com