刑事诉讼中的算法证据:
概念、机理及其运用
作者:张迪,南京大学法学院博士生。
来源:《河南大学学报(社会科学版)》2023年第3期。
摘要:刑事诉讼法学界对大数据相关证据的研究形成了“大数据证据”“人工智能证据”“算法证据”等三套话语体系,混乱的概念界定在一定程度上阻碍了相关理论的发展。算法是大数据相关证据的核心特征和主要规制对象,我们应在算法证据的概念下对大数据相关证据进行探究。算法证据既指案件发生时所产生的与案件相关的算法,又可指通过算法对案内外大数据进行分析后所产生的结果。前者属于电子证据,可直接证明案件事实;后者具有独特性,其借助算法生成具有相关关系的机器意见以证明待证事实。针对不同类型的算法证据应采用不同的审查方法。为保障算法证据的理性运用,我国应明确算法证据的法律地位,完善相关的审查规则,由官方主导并优化算法证据的生成、监督与公开。
关键词:大数据证据;算法证据;人工智能证据;算法;鉴定意见
一、问题的提出
针对大数据相关证据的刑事司法应用,学界已经展开了相应的研究,并初步形成了三套话语体系,即“大数据证据”“人工智能证据”和“算法证据”。其中,“大数据证据”是学界较为流行的用法,持此种观点的学者认为,大数据证据是指基于海量电子数据形成的分析结果或报告。持“人工智能证据”观点的学者认为,“人工智能证据是基于人工智能分析形成的可用于证明案件事实的机器意见”。持“算法证据”观点的学者则认为,“从证据法视角来看,算法证据是将海量的案件信息数据进行计算整合,形成结构化和信息化的案件场景自动解读与自动推理结果”。虽然上述研究成果推动了刑事证据法理论的发展,但客观地说,现有混乱庞杂的话语体系在一定程度上阻碍了相关理论的深入研究与实践运用。比如,就“算法证据”这一概念来说,学界对其内涵的界定就不清晰。“海量的案件信息数据”直接将案外大数据排除在外,同时又将案件所附带生成的裁判信息等包含在内,这直接导致算法证据的内涵过于繁杂且指向不明,我们很难对其进行聚焦性的研究。因此,为了更好地服务于立法和司法实践,在法律尚未确定大数据相关证据的概念和属性时,相关话语体系的审视与统一是我们首先要解决的问题。
更为重要的问题是,实践中大数据相关证据的审查运用规则处于“真空”状态,现有研究尚未对大数据相关证据的具体类型和证明机理等进行系统性的阐释,因此,所提出的审查、运用大数据相关证据的方案存在针对性不足、指导作用有限等问题。有鉴于此,笔者尝试从大数据相关证据的话语分歧出发,厘定算法证据的概念,进而对算法证据的实践运用进行类型划分和机理阐释,最终提出算法证据的分类审查方案和配套改革措施。这里需要说明的是,本文对于算法证据的概念界定并非在语词上的无用争辩,而是在理论反思的基础上,结合我国的法律规范及司法案例所进行的新阐释。重新界定算法证据的目的是将原有宽泛的研究视角更多地聚焦到专业的算法领域,以便提出更具针对性、本土化的方案。
二、刑事诉讼中算法证据的概念厘定
“法律概念并非措辞和语义的简单表达,而是通过该术语的语词构成、定义方式等向人们传达法律的调整对象。”就“大数据证据”“人工智能证据”“算法证据”这三个概念来说,其所传达的信息各不相同。下文将对这三个概念进行反思,并在此基础上,重新界定“算法证据”的内涵。
(一)大数据证据的概念及其问题
在大数据证据的概念下,海量的电子数据是“源”,分析得出的结果是“果”。主流学界所界定的大数据证据不仅包含了大数据分析报告,还包含了海量的电子数据本身。这一概念看到了海量电子数据的基础性作用,具有一定的启发意义,但却存在如下问题:
其一,大数据证据的概念混淆了大数据本身和大数据分析结果。在这一概念下,海量电子数据可被称为大数据证据,大数据分析报告也可被称为大数据证据。但这两者之间存在明显区别,将它们概括在同一概念之下不利于大数据相关证据的理论研究和实践运用。其二,大数据证据的概念界定虽沿用了证据法学者既有的研究路径,但其在一定程度上违背了概念界定的基本原则。虽说概念的界定没有客观上的正确或错误,重要的是某种特定用法是对于大多数人来说是否可以接受或正在被接受,但清晰的概念界定仍应是学术研究所追求的目标。具体而言,此概念存在如下两个问题:一方面,法律概念要向人们传达的是法律的调整对象。按照此种逻辑来看的话,大数据证据所要规制的对象是大数据,但相较而言,算法才是挖掘大数据价值的关键环节,因而应成为法律的首要规制对象。另一方面,概念是反映事物特有属性的思维方式,而事物的特有属性指的是某类事物所具有而其他事物所不具有的属性。就大数据相关证据而言,其所具备的特有属性并非数量巨大的电子数据,而是实现海量数据价值的算法。
(二)人工智能证据的概念及其问题
人工智能证据是指基于人工智能分析形成的可用于证明案件事实的机器意见,其更为关注刑事诉讼中人工智能技术的核心作用,着重研究人工智能技术的特点和作用,但这一概念的提出也存在一些问题。
其一,该概念并未认清大数据相关证据的内在运行逻辑。在大数据分析的场域下,大数据和算法是人工智能的核心要素,两者是并行的两个概念。大数据分析结果的产生包括大数据收集与储存、大数据预处理(数据清洗、数据集成、数据归约、数据变换)、大数据分析处理、大数据结果生成(可视化)等环节。其中,人工智能技术仅在大数据分析处理中发挥重要作用。因此,人工智能并不能标识出大数据相关证据的全部特点,它忽视了非智能、半智能算法的地位、作用和意义,因此并未表达出概念本身所应规制的主要对象。
其二,人工智能证据中“人工智能”这一语词的用法过于超前,因而脱离了审判实践。人工智能更多地强调机器的“自动化”“拟人性”等特点,而现行的算法离高度的人工智能还很远。具体到刑事司法实践中,人工智能本就应被定位在辅助功能之上,而以机器学习为基础的人工智能仍处于弱智能阶段,大数据的分析更多依靠设计者来构建特定的半智能算法来实现。
总而言之,算法是大数据相关证据的核心特征和规制对象,用算法证据对大数据相关证据进行界定更加科学。然而,算法一词本身就存在一定的争议,因此我们有必要在现实案例的基础上重新界定算法以及算法证据的内涵。
(三)算法证据的界定及其意义
1.算法证据的界定
前文已述,学界对算法证据的既有界定存在内涵庞大、指向不明等问题,因此我们有必要重新界定算法证据。在此之前我们先要明确算法的概念。算法的概念虽未在学界形成高度共识,但较为一致的看法是,算法指包含一系列复杂的数学规则、能通过预先设定的步骤解决特定问题的计算机程序。在刑事诉讼中,我们对算法证据的界定需要借助实践案例的比对和分析才能加以实现。
案例1 在陈德惠律师事务所偷税案中,一审检察机关指控被告单位陈德惠律师事务所采用设立账外账,少列收入,进行虚假的纳税申报,不缴或少缴应纳税款,构成偷税罪。大连市人民检察院技术鉴定处对被告单位提供的全部账目进行鉴定后,认为被告单位自1995年至1999年期间,少缴各类税款共计114.7449万元。
案例2 在李志超组织、领导传销活动案中,四川省丹棱县公安局对云数贸五化联盟会员管理系统备份数据库进行提取并固定。重庆市科信电子数据司法鉴定所对该备份数据鉴定后,出具了〔201705〕鉴字第015号《司法鉴定意见书》,用于证明李志超会员账号的下线层级、会员及获利的情况。该意见载明,案涉组织下线层级共有130 层,下线会员共有212088人。
在案例1中,被告单位在第一时间主动将全部账目交给税务部门的工作人员,这些账目是本案的书证。但因会计账簿具有特殊性和专业性,一般人无法对其内容进行准确的核算和认定,需要由专业人士来完成,以给出专业的鉴定意见。本案中的会计账簿属于书证,但却衍生出了“大连市人民检察院鉴定书”这一新的证据种类。这二者虽然同源,却属于不同的证据类型。
在案例2中,“会员管理系统备份数据库”系大数据库的一种,其本质上属于电子数据,但因该数据库中包含了20余万会员的相关信息,人力难以完成此数据库的统计和分析工作。因此,司法机关委托鉴定机构对上述数据库进行分析,出具鉴定意见。然而,本案中的鉴定并非依靠专家的个人知识和经验,而是依靠特定的算法加以完成。本案中的“会员管理系统备份数据库”本身就属于电子数据,“司法鉴定意见书”虽然名义上属于鉴定意见,但其实质上是由算法所给出意见,是一种新的证据类型。
归纳而言,对于海量电子数据的分析无法完全借助于人力,而需借助于算法。算法是大数据相关证据发挥证明作用的关键。因此,我们应当使用算法证据来指称实践中与大数据相关的证据。当然,算法证据虽能明确其所要规制的对象,但其本身也具有一定的争议性。事实上,在社会科学领域,有些概念本身就具有争议性,但争议性并不意味着含混不清。在概念存在一定争议性时,我们可以对其作出一些界定,以保障其在实践中被正确地运用。
首先,我们需要区分的是决策辅助算法与基于算法的证据。前者是指在庭审前、审判和审判后阶段为司法决策提供辅助信息的材料,比如犯罪数据挖掘以及用于保释听证会、判刑、缓刑等的材料;后者主要指基于算法所产生的证据,有学者将其分为计算机混成证据、计算机生成证据和直接证据等。本文所称的算法证据主要指基于算法所产生的证据,不包括用于决策辅助的算法。其次,需要明确的是,本文所界定的算法证据既与大数据本身相互独立,又与大数据直接相关联。算法是为了解决大数据而生的,其生成的原因是为了分析大数据,目的是挖掘大数据的内在价值。这是算法与以往普通的电子程序或软件所不同的地方。
在这些条件下,笔者认为,本文所称的算法证据既指案件过程中所产生的与大数据相关的算法,又可指通过算法对案内外大数据进行分析后所产生的证据。前者主要指算法本身,其直接可以作为证据使用。比如,在大众汽车“排放门”事件中,失效保护器算法就直接证明了大众公司的非法目的,属于算法证据。后者主要指运用算法分析大数据后做出的意见。
2.界定算法证据的意义
算法证据的重新界定并非无意义的争辩,在笔者看来,算法证据的界定具有如下重要意义:其一,可与既有的证据审查体系相适配。这主要因为算法证据的界定将大数据本身与算法证据相隔离,有利于独立地完善这两类证据的收集、固定和审查行为。其二,可与算法相关的理论研究成果直接适配。目前,在计算机、出版、公共管理等领域,学者们对算法的研究已经成果颇丰。以算法证据为基础,刑诉法学者可以与其他专业的专家就相关的研究成果直接进行对接,这有助于刑事诉讼中算法研究的发展和进步。
三、算法证据的主要类型及证明机理
充分利用算法证据的前提是,我们要掌握算法证据的证明机理。鉴于算法证据的复杂性和多样态,我们应先明确算法证据的实践类型,再对其证明机理进行分析。
(一)刑事诉讼中算法证据的主要类型
结合大数据相关证据的实践案例,我们可以从理论上尝试将算法证据分为三类:其一,对案生大数据分析的算法证据。这主要指依靠特定的算法,对案件中的大数据进行分析所产生的结果。其二,对案外大数据分析的算法证据。这主要指依靠算法和既有数据库中的大数据,对案生数据进行比对、分析所产生的结果。其三,案件发生时生成的算法证据。这主要指在案件中发现的特有的依靠算法运行的电脑系统,可以直接用以证实犯罪事实的证据。
1.对案生大数据分析的算法证据
案例3 在李林等集资诈骗案中,一审检察机关指控李林等人通过制定理财项目,向社会不特定群体吸收集资款,造成集资参与人损失巨大。检察机关提出的关键证据是安徽平泰司法鉴定所平泰司鉴字〔2018〕002号司法鉴定意见。该意见证实案涉平台数据反映运营中心共发展会员5737人,造成其中4464名会员损失89,821,160元。在案例3中,被告人所构建的“平台”所产生的电子数据是他们实施犯罪行为时所产生的大数据集,系案生大数据。案件中的“司法鉴定意见”系相应鉴定机构对案生大数据进行分析后所给出的专业意见,实际上属于对案生大数据分析的算法证据。本案中的“司法鉴定意见”就是算法对案件中的大数据进行分析后所产生的大数据分析结果。
2.对案外大数据分析的算法证据
实践中,对案外大数据分析的算法证据可以分为以下三种主要类型:其一,从案外的大数据库中分析出人与人、人与物、物与物之间的潜在关系,即关系圈分析。其二,在案外的大数据库中进行信息比对,锁定案内的个人信息。其三,在案外大数据中进行针对性的大数据分析,提供独立性的分析报告。
3.案件发生时生成的算法证据
算法本身可以直接作为证据使用,此时算法可以用于证明犯罪嫌疑人的犯罪目的等要件事实。与前述两种证据不同,案件发生时产生的算法证据类似于电子证据,可以直接用来证明案件事实,但因其与大数据分析相关,因此,对案件发生时产生的算法证据的判定需要专家意见才能加以完成。
(二)刑事诉讼中算法证据的证明机理
“司法证明机理是指由多方证明主体共同参与进行证据推理活动的内在规律和原理。”一般而言,证据推理的过程要经历几个环节:由证据直接证明“证据性事实”,由“证据性事实”推理获得“中间事实”,进而借由推理获得“要件事实”。不同类型的算法证据之证明的内在原理和规律存有不同,只有明晰不同算法证据的证明机理,才能理性地审查、运用算法证据。
1.对案生大数据分析的算法证据的证明机理
算法让我们看到了瞬间大批量处理非结构化信息的可能性,它能够弥补人类对庞大数据分析理解上的不足,为事实认定者提供了对大数据进行推理分析的“数据经验”或者“特殊经验”。这种理据在一定程度上超越了人类的日常经验,克服了一般推理所难以解决的证明困境。算法强调从案件中的大数据本身分析出具有价值的信息,其核心是通过对大数据相关关系的挖掘对信息进行分类和预测。具体来说,简单分析算法背后暗含的相关关系较易理解,审查者可以从中较为容易地分析出“数据”和“结果”之间是否存在因果关系;智能分析算法的可解释性较低,其背后暗含的相关关系较难转化为因果关系。这是因为智能分析算法主要依赖机器学习进而生成不同的算法类型,常见的类型有决策树、KNN算法、朴素贝叶斯、支持向量机及人工神经网络等。
2.对案外大数据分析的算法证据的证明机理
与对案生大数据分析的算法证据的证明机理不同,对案外大数据分析的算法证据的证明机理是基于案外大数据,通过算法对案生数据进行分析、比对,以推理出证据性事实。比如,实践中的“视频侦查报告书”“破案经过”等,有些就是基于案件中的特定信息,在相关大数据库中依靠算法进行比对、分析后所给出的结果。一般来说,对案外大数据分析的算法证据一般为侦查机关所运用,直接服务于特定的侦查目的,如锁定犯罪嫌疑人、发现新证据等,因而具有专一性。
3.案件发生时生成的算法证据的证明机理
案件发生时生成的算法证据的证明机理与一般的证据推理相同,其通过算法本身来证明特定的证据性事实或最终事实。换言之,其推理所依据的不是算法,而是日常生活经验法则。当然,在我们运用日常生活经验法则对此类算法证据进行推理时,需要先了解此类算法证据的运行逻辑、具体功能等特定信息。也就是说,案件发生时生成的算法证据与一般电子数据的区别在于,当案涉算法具有智能性时,司法人员仍然需要借助专业人员的知识才能对其作用机理和功能进行分析。
总而言之,不同的算法证据具有不同的证明机理。相应地,具有不同证明机理的算法证据,其审查运用方法也存在一定区别。
四、算法证据的审查方法及配套改革
结合实践中的刑事司法案例,我们可以发现,算法证据的提出和分类具有一定的现实必要性和理论正当性。面对实践中所存在的不同类型的算法证据,想要对其加以合理的运用,我们除了需要借助理性的、科学的审查方法外,还需要依靠相关制度的配套改革。
(一)刑事诉讼中算法证据的审查方法
以往学界对于大数据相关证据的研究大都聚焦于此类证据的单一审查方法。实际上,在刑事诉讼中,对算法证据的审查应分为两个方面,即单一审查和综合审查。单一审查可以沿用相关性(关联性)——合法性——可靠性(真实性)的证据分析框架对算法证据进行全面的审查和判定。综合审查则强调从整体主义的进路审慎地对待算法证据,重视自然事实背景的分析和经验法则的理性运用。这里需要说明的是,因案件发生时生成的算法证据与电子数据具有极大的相似性,对此类证据的审查可以直接参照适用法律所规定的电子数据的审查规则,故而下文中不再对其进行专门性的阐述。
1.算法证据的单一审查
正如对鉴定意见的审查无法忽略检材的来源、取得、保管等内容一样,对算法证据的审查也应当从大数据着手,注重对算法证据生成过程的全流程审查。
(1)对案生大数据分析的算法证据的审查方法对案生大数据分析的算法证据的审查包含两个环节:一是对案生大数据相关性、合法性和可靠性的审查;二是对算法相关性、合法性和可靠性的审查。具体的审查方法如下:
其一,针对案生大数据的审查。司法人员应当主动对案生大数据的相关性、合法性和可靠性等进行审查。就相关性而言,可以持有相对宽松的标准,对于符合机器意义上相关关系的大数据即可认为其具有相关性。就合法性而言,司法人员应当依据法律的相关规定对不合法的大数据进行排除。就可靠性而言,司法人员应当从技术上的大数据处理和程序上的大数据处理两个维度对大数据进行审查。技术上的处理是指侦查机关在技术上对大数据的筛选和处理。比如,通过分析大量的数据,排除一些明显不是被害人的账户信息。程序上的大数据处理指的是侦查机关在程序上对大数据的收集、保存等,司法人员对此也应当加以审查。
其二,算法的审查方法。因算法具有特殊性,其类似于美国的专家意见,所以对于算法证据的审查可以借鉴美国的相关做法,从证据准入资格的审查和证据可靠性的审查两个阶段着手进行。
证据准入资格的审查主要包括:一是算法的相关性审查。只要某一算法的结果与系争事实存在一定的相关关系,算法即具备证据资格。二是算法的普遍接受性审查。算法证据中所运用到的算法应是被公众普遍认可的知识或者在特定专业领域得到公认的规律、原理或技术。三是算法的可检验性审查。可检验性主要指算法多次运行的结果应当具有一致性。当然,此处的可检验性审查只是对算法的初步审查,属于证据资格部分的审查内容。四是算法的合法性审查。算法中如果含有违法的设计要素,就会影响算法输出结果的合法性。此处的合法性不能做狭义的解释,而应从广义上理解。具体来说,合法性不仅指算法应符合法律的具体规定,还应指算法不能违背基本的政治价值观和规范价值观。
证据可靠性的审查主要是针对算法准确度的多视角审查。审查者应重点关注算法是否存在科学性错误代码和技术性错误代码。实践中,除了对算法的源代码进行分析外,对算法可靠性的分析还可以借助于特定鉴定机构的黑箱测试,黑箱测试是通过测试来检测已知产品每个功能是否正常的一种测试方法。在测试时,把软件程序看作一个不能打开的黑盒子,在完全不考虑其内部结构和内部特性的情况下,在软件程序接口进行测试。
(2)对案外大数据分析的算法证据的审查方法
对案外大数据分析的算法证据的审查包含三个环节:一是对案生证据相关性、合法性和可靠性的审查;二是对案外大数据相关性、合法性和可靠性的审查;三是对算法的相关性、合法性和可靠性审查。具体的审查方法如下:
其一,针对案生证据的审查。通过算法对案外大数据分析时,有时需要借助案生的电子证据,对于这些证据的审查具体可参照我国法律中关于电子数据的审查方法。
其二,针对案外大数据的审查。首先,就案外大数据的相关性审查,仍应以机器意义上的弱相关关系为标准。其次,就案外大数据的合法性来说,对案外大数据进行算法分析所产生的结果大多应用于犯罪预测,大部分结果没有用于证明案件事实。但是,相应的分析结果一旦转化为算法证据,我们就需要对案外大数据的合法性,特别是其收集程序的合法性进行重点审查。最后,就案外大数据的可靠性来说,司法机关可以要求数据库拥有者提供数据库详细参数、收集过程等具体情况,以方便司法人员审查、判断其可靠性。
其三,针对算法的审查。具体可以参照案生大数据中对算法的审查方法。这里需要特别说明的是,预测性侦查行为(算法分析)启动的合法性问题。笔者认为,对于司法内部数据启动算法分析时应遵循“合目的性原则”和“比例原则”。就其他行业数据而言,公检法三机关对社会机构、商业企业收集的各种数据库启动数据比对和挖掘时,不仅要遵循“合目的性原则”,还需遵循“法律保留原则”“比例原则”。如果算法分析的启动违反上述原则,则产生的算法证据不具有合法性。
2.算法证据的综合审查
考虑到算法证据的潜在价值及相关关系的高准确率,我们在警惕算法证据可能存在不公正、不准确等问题的同时,应对其运用保持较为宽容的态度。在有些算法无法完全清晰地展现其因果关系时,如果能够排除算法证据存在合法性、相关性等问题,我们可以结合其他证据共同认定案件事实。具体而言,我们在运用算法证据时,需遵循以下规则:
其一,算法证据不能作为认定案件要件事实的唯一根据。“大数据挖掘的电子证据提供的不是最终答案,只是参考答案,为司法提供暂时的帮助。”算法黑箱、歧视等问题的客观存在要求我们在运用算法证据时应当十分慎重,因此,我们应当尽量避免单独依靠算法证据去直接认定案件的要件事实。其二,算法证据的运用应结合其他证据加以综合认定。综合证明模式是一种以“自然生活历程事实”为证明对象,容许或然性推论的综合型证明模式。借鉴综合认定模式的主要目的是将算法证据的相关关系归入故事的因果性关系之中,在充分发挥算法证据“超越人类经验”的证明机理的基础上,审慎地对待算法证据,以充分发挥其能效,准确认定事实。
(二)刑事审判中算法证据的配套改革
算法证据的理性运用离不开配套制度的改革。就目前的司法现状来看,刑事诉讼中算法证据的配套改革应从以下方面着手:其一,算法证据法律地位的确立及相关审查、质证规则的构建;其二,算法证据生成过程中的官方主导及优化。
1.算法证据的独立及相关规则构建
(1)算法证据的独立
界定算法证据的内涵后,首先需要考虑的是如何确定算法证据的法律地位。国内学界的主流看法是将其归入鉴定意见之列。鉴定意见说将算法证据纳入鉴定意见之列既具有形式上的亲缘性、可比性,也满足司法追求经济性的原则。但是,此方案存在如下问题:其一,这一定位与既有制度不适配。算法证据本质上是算法自主运行后的产物,而鉴定意见本质上是鉴定人员的知识产出,二者之间存在本质差异。其二,前文已述,这一定位将导致作为鉴定意见的算法证据和对算法进行的鉴定之间产生混淆。其三,这一定位不利于算法证据的运用。因鉴定标准的设置较高、鉴定人员具有准入要求,这有可能限制算法证据的运用。
因此,笔者认为,应在认清算法证据属于特殊性专家意见的基础上,将算法证据纳入专门性问题报告,并系统性地构建相关的制度和规则。
(2)算法证据审查规则和质证规则的完善
有关算法证据的审查规则,笔者的建议是,应参照《最高人民法院关于适用<中华人民共和国刑事诉讼法>的解释》“证据”一章的规定,对算法证据的具体审查事项进行罗列式的规定,以授权并引导司法人员对算法证据进行审查。
有关算法证据的质证规则,首先,我们还应从透明度和简明度两个方面着手优化质证规则:其一,应明确算法证据提出者及算法设计者的说明义务,以保证算法的透明度,进而保障被追诉人的对质权。算法由设计者生成、控制者部署、提出者在庭审中展示,算法设计者、提出者都有义务根据法庭的要求对其所设计的算法进行特定说明。其二,应借助可视化等技术手段实现算法的简明性,帮助案件各主体理解算法。但是,透明并非意味着简明,算法具有复杂性、专业性、易变性等特点,一般人无法轻易理解算法的源代码。因此简明性的要求便出现了,令人信服的科技公司会使用基本的术语解释其系统以便于他人理解。其次,我们应优化专家辅助人制度以保障有效质证。一方面,专家辅助人的人数应当适当放开。法律所规定的两名专家辅助人的限制恐难以满足算法质证的实践需求,建议对其适当放宽。另一方面,应当保障专家辅助人查阅算法相关信息的权利。
2.算法证据生成的官方主导及优化
官方主导算法证据的审查可以节约司法资源的同时,从整体上保障算法证据的合法性和可靠性,具体优化方案如下:
其一,官方机构主导并优化算法的生成。特别是针对侦查阶段的算法决策,应强化官方对于算法系统开发端、设计端及其核验端的全程可控。对此,可以借鉴荷兰警察机关创立犯罪预测系统(Crime Anticipation System)中的经验。该系统的开发、设计、审核全过程都是以侦查机关的专业人员为主体,采用了侦查机关内部专业评审与算法设计公司的外部测试相结合的模式,有力确保算法决策系统的设计、开发以及应用的全程可控。全程可控的前提是全过程的责任清晰,我国可以借鉴上述经验,对算法生成制度进行优化。
其二,官方机构主导并优化对算法的监督。在刑事诉讼领域,我们应着重构建由官方主导的监督体系。具体来说,对算法的监督可以分为事前、事中和事后监督。第一,事前监督。事前监督主要指特定机构对刑事诉讼中算法技术运用前所进行的审查和监督。我国可以尝试构建算法风险评估系统,对于算法技术的应用进行风险等级评定,严格限制高风险大数据技术的应用,并通过程序手段对风险加以控制。第二,事中监督。事中审查是指司法机关对算法证据生成的全过程进行动态监督。在我国,可行的方式是由检察机关主导算法证据生成过程中的全程监督。其原因在于检察机关具有客观中立性,且其是法律监督机关,本身就可以对刑事诉讼全过程进行监督。第三,事后监督。由此完善法院对算法技术的司法审查机制。普通公民对司法机关运用算法存在异议的,可以向法院提起诉讼,要求法院审查算法、算法证据的合法性、公平性等问题。
其三,官方机构主导并优化算法的公开。解决算法黑箱的理想方法是算法公开,但是,这种方式可能存在以下阻力:一方面,对于算法设计者和拥有者来说,算法公开意味着商业利益的损失,因此算法的设计者和拥有者不愿公开算法。刑事诉讼领域的算法设计一般采用外包方式交由科技企业进行研发,而算法设计者考虑到研发成本,一般都会在技术外包合同中要求司法机关对商业秘密进行保护。如此的话,司法机关基于合同的要求便不能主动公开算法。另一方面,司法机关自身不愿主动公开算法,因为算法一旦公开就可能遭到各方质疑,这将给算法的改革和运用带来阻力。因此,算法的公开需要权衡各方的利益,基于不同价值考量进行权衡分析,根据运用场景的不同进行类型化的处理。比如,针对具有垄断地位的算法,或目的是提供普遍公共服务的算法,人们应有权要求其公开。针对其他算法,可以由法官根据具体情境加以裁决。
五、结语
算法(特别是智能算法)的发展对于社会和司法的冲击巨大,算法的发展亟须构建一套全新的知识体系来加以应对。我们需要更新旧的概念集合,以促进刑事司法工作的有效展开。算法证据的提出将大数据的运用分为基础大数据和算法两个部分,突出了算法的核心地位,相较于以往笼统式的概念界定方式,在这一概念下的理论研究将更为聚焦和精细,同时能够更加适配既有的司法制度和规则。概言之,本文对于算法证据的重新界定并非否定已有的研究成果,而是对既有成果的一种适当“优化”,其目的是更好地聚焦实践中算法证据的运用问题,提出更加具体的解决方案。
转自:“法学学术前沿”微信公众号
如有侵权,请联系本站删除!