2023/5/15 10:54:49 阅读:101 发布者:
以下文章来源于南京社会科学 ,作者姜华
从辛弃疾到GPT:人工智能对人类
知识生产格局的重塑及其效应
作者 | 姜华
复旦大学新闻学院暨
复旦大学全球传播全媒体研究院研究员
原文刊载于《南京社会科学》2023年第4期
本文注释略去
非经注明,文中
均来自网络
摘 要
从形式上看,GPT生产的知识文本已接近人类的知识产品,但从知识的形成过程看,GPT生产的知识与人类生产的知识却有着本质差异。人类生成知识是在意向性的基础上完成的,以一阶知识、二阶知识的面目呈现;GPT的知识生产是缺乏反思性的通过逻辑关系对既有知识的联结和组合,以三阶知识的面貌呈现。GPT生产知识的机制也与人类不同,它是“非意向性的”,它对应的是一个必然性的世界,形成的是“既成的知识”。GPT介入知识生产,模糊了知识生产中“人类要素”与“非人类要素”的界限,形成了大量“杂合知识”,人类的生存境遇也将随着知识生产的此种变化而改变。
辛弃疾有一首词《水龙吟·昔时曾有佳人》,上下两阕所有字句均采自宋以前之文献如《诗经》《史记》《汉书》等经典著作,甚至连宋玉《高唐赋》中的佳句也被他袭为己用。其实,有宋一代,像辛弃疾这样的词人大有人在,贺铸、周邦彦等人也常或照抄或化用李白、李商隐、温庭筠等唐代诗人的诗句,以致时人认为“抄句不算坏事,甚至还是一种本领”。或许正是因为有“抄袭”之嫌,当代诸多唐宋词名家选本均将这首《水龙吟·昔时曾有佳人》拒之门外,就连专论东坡与稼轩词的《苏辛词说》亦弃之不顾,大概都觉得稼轩此词集于众家而了无新意吧。这不禁令人联想到自2022年岁末在全球引发持续热议的ChatGPT。在诸多的评判之中,较为耀目的一条也是“抄袭”与“剽窃”:乔姆斯基(Noam Chomsky)、罗伯茨(Ian Roberts)、瓦图穆尔(Jeffrey Watumull)就尖锐的指出,从语言学和知识哲学的角度看,ChatGPT不仅具有无法消除的缺陷,还展现了邪恶的平庸:抄袭、冷漠与回避。《科学》(Science)的主编、化学家赫伯特·索普(Herbert Holden Thorp)在认可ChatGPT能提供无尽的娱乐的同时,也以学术期刊负责人的身份声明:通过ChatGPT“生成”的图形、图像与图表不能用于论文之中,而ChatGPT书写的文本更会被看作是剽窃,将会被该刊拒之门外。但是,技术的迭代更新总是以迅雷不及掩耳之势不断冲击人们的视线。2023年3月14日,OpenAI发布了GPT-4,其文本处理能力比之前基于GPT-3.5的ChatGPT更强:ChatGPT可一次性处理3000个单词的文本,而GPT-4则可一次性处理25000个单词的文本;此外,它还新增了较强的识图功能;回答问题的准确性亦有较大提升。不过,此前ChatGPT所面临的“剽窃”“知识不准确”等问题,依然未获圆满解决。
从辛弃疾到GPT,人类的知识生产好像有了极大的跃升,特别是GPT这种人工智能程序的介入,使得知识“生成”的速度与效率均非往昔可比。可以预见的是,在未来的人类知识版图中,GPT-4及后续的迭代智能技术将占有越来越重要的地位。可是,反观人类知识演化历史,GPT的知识“生成”方式却又似曾相识。换言之,GPT介入前后的人类知识生产,既有形式上的相似之处,又有本质的差异。基于上述判断,本文试图探讨如下问题:从知识“生成”方式和知识形态上讲,GPT“生成”的文本,在人类知识生产演变的历史中处于何种位置?这种文本的“生成”模式,与人类自身生产的知识有何本质差异?在“闯入”知识生产领域之后,GPT将对人类的知识生产带来何种影响?又将如何影响人类知识生产格局?对人类的未来生存会带来何种社会效应?
01
GPT与三阶知识的出现
知识,实际上是人类在世界中生存所形成的对“诸世界”的认知、观念与思想。从形式上讲,人类所面对的“诸世界”至少有三重,即“物的世界”“事的世界”“意识的世界”。“物的世界”是人类身处其间的“自然世界”,是山川河流、草木森林、日月星辰这样的物质世界;“事的世界”是与人类自身相关的“人事世界”,是日常生活、人际交往、群体活动、政治运作、文明延续等层面的人类世界;“意识的世界”则是人类如何看待、把握“物”与“事”的凭借,是人超越物质世界、跃出动物世界并促成人之为人的关键所在,亦是人类生成知识的不二门径。
从知识来源上看,“物的世界”“事的世界”“意识的世界”皆有可能成为知识的来源。在认识论的范畴内,知识通常被看作“有证成的真信念”,因为含有“证成”“为真”等要素的限定,近代科学兴起后,科学的实证主义大行其道,源自“物的世界”的知识遂被看作人类知识中最为牢固的部分。但是,“单纯的关于物体的科学”对于“我们作为自由主体的人”是“无话可说”的。对于存于天地之间与聚群而生的人类而言,“物的世界”及其知识固然不可或缺,“事的世界”与“意识的世界”乃至我们认知此二者形成的知识,恐怕同样必不可少。在康德(Immanuel Kant)看来:“用来把一个对象与另一个对象区别开来的那些观念的意识是明白,而使诸观念的组合也变得明白的意识叫做清晰,只有后者才使诸观念的一个总和成为知识。”康德关于知识的论述看似宽泛,且并未对知识来源做出区分,而仅对“知识是什么”做了抽象概括,但考虑到知识来源的复杂性,他的界定似也合理。本文即在康德“知识论”的基础上使用知识概念,将“物的世界”“事的世界”“意识的世界”均看作知识对象和知识对象之来源,把奠基于这些对象之上形成的诸观念总和看作知识。
(一)人类与一阶知识、二阶知识的生产
综观人类知识史,依知识之来源和形成之路径,人类知识大致可分为一阶知识、二阶知识、三阶知识三种不同形态。“一阶知识”,是作为知识生产主体的人,通过对“物的世界”“事的世界”“意识的世界”的直接感知并凭借“知觉、记忆、证词、内省、推理和理性洞察”等思维活动而形成的知识。此类知识的形成过程,其实包含两个不同的阶段,一个阶段是知识生产主体对对象的直接感知,在此过程中,知识生产者面对的是“对象世界”的杂多状态,认知的结果是形成关于事物的碎片化的知识;另一阶段是在此基础上,经过一系列的思维活动,对碎片化的知识进行系统性的符号化,最终生成系统化的知识。从知识形成过程和知识最终的表现形态看,“一阶知识”的生成过程是面向“对象世界”的无中生有,是通过语言这种人类特有的与世界联结的媒介,对世界进行“映射”的过程。以具体的实现方式看,“一阶知识”是通过“著”与“作”的方式达成的。清代学者焦循认为:“人未知而己先知,人未觉而己先觉,因以所先知先觉者教人,俾使人皆知之觉之,而天下之知觉自我始,是为‘作’。”当代学者张舜徽亦认为:“凡是前无所承而系一个人的创造才叫做‘作’,也可称‘著’”,“将一切从感性认识所取得的经验教训,提高到理性认识以后,抽出最基本最精要的结论,而成为一种富于创造性的理论,这才是‘著作’”。由此可见,一阶知识是人类知识范域之中,最具创造性、最为基础的知识类型。它既可以是知识生产者对自然世界的直接感知和系统化思维的结晶,也可以是知识生产者对“人事”直接参与和观察后的思想沉淀,还可以是知识生产者对“意识的世界”相关项反观后的观念集成。
“二阶知识”,是作为知识生产主体的人,在一阶知识基础之上,运用联想、推理等方法和手段,同时凭借自身的主观努力,对一阶知识进行重新加工、重新改造后形成的知识。与一阶知识相比,二阶知识的“信息量”大大降低,它的重心不再是“无中生有”,而是对“有”进行种种形式化的变形与改造。因此,二阶知识是通过“述”“编述”“钞纂”等方式达成的:“已有知之觉之者,自我而损益之,或其意久而不明,有明之者,用以教人,而作者之意复明,是之谓‘述’”;“将过去已有的书籍,重新用新的体例,加以改造、组织的工夫,编为适应于客观需要的本子,这叫做‘编述’”;“将过去繁多复杂的材料,加以排比、撮录,分门别类地用一种新的体式出现,这称为‘钞纂’”。像孔子自谦的“述而不作”,司马迁将《史记》的写作谦称为“述”,大概他们都以为自己的作品都非一阶知识。中国古代的“类书”如《太平御览》《艺文类聚》等,欧洲启蒙运动时期的《百科全书》,都是二阶知识的典型代表。二者的区别在于,前者属于“钞纂”,是通过摘抄已有文献的方式,依据一定的类目汇编同类资料,原则上钞纂者不应对既有资料做改动;而后者类似“编述”,是以条目的方式在对既有知识进行总结梳理的基础上进行“再创作”,原有的知识消融于编述者的书写之中。
(二)GPT的联结与反馈:奠基而成的三阶知识
从某种程度上讲,GPT“生成”的知识,与二阶知识中“百科全书”的形态最为相近,但事实上,二者之间差异巨大。首先,从知识形成过程看,与一阶知识相比,像百科全书这样的二阶知识虽然“无中生有”的程度打了折扣,但并不代表它没有创造性的成分在。无论是孔子谦称的“述而不作”,还是像王充等人干脆将自己的著作称为远不如“述”的“论”,其实他们的“述”与“论”中都有一阶知识的要素在。反观GPT“生成”的知识,我们会发现,这是一种基于信息论“概率”基础上的自然语言处理,是通过控制论的“反馈”机制进行人工智能训练的成果。也就是说,GPT生产的知识,创造性的因素是不存在的,它通过“问—答”形式产生的令人惊艳的知识文本,更多的是形式上对既有“信息”或“知识”的再联结。其次,从知识性质上讲,目前,GPT生产的知识,是一种“类知识”——更接近于奠基于数据的信息,或者比信息稍有系统化的、由整理加工过的信息构成的“初级形态的知识”,而非传统意义上的知识。数据是“人脑用来产生信息的原始刺激”,是人类为“产生信息而收集的观察的结果或者线索”,信息则是“个体在交流时分享的东西”,它来源于“数据”。当“人类将数据转化为信息,然后将这些信息与之前的思想和经验结合之后,就产生了知识”,“所有的知识都来源于信息,并以人类之前相互交流的思想为基础”。由此可见,从数据到信息,再到知识,存在一个逐步奠基的关系层级,奠基于信息的知识具有更加易变、更不稳定的特性。作为大型语言模型(large language models,LLM)的GPT-3,是拥有1750亿参数,含有3000亿个单词的模型,它的训练语料构成如下:60%来自2016至2019的Common Crawl语料库;22%来自WebText语料库;16%来自书籍;3%来自维基百科。从数据来源看,其语言模型依托的是不同类型的互联网信息资源,传统意义上的知识资源比重不高。因此,GPT借由这些资源生产的文本,更像是一种奠基于信息的“类知识”。从三种不同形态的知识层级上看,GPT生产的知识是奠基于一阶知识与二阶知识基础之上的新的知识形态——三阶知识。
02
GPT知识生产的特殊机制
在与《时代周刊》记者的对话中,ChatGPT曾“自陈”:“我是一个大型语言模型,接受过大量文本数据的训练,这使我能够对各种各样的输入生成类似人类的反应。当你问我一个问题时,我用我的文本数据训练和算法生成与你的问题相关的回答,并用一种听起来自然的方式写出来。我尽我所能提供准确和有用的信息,但我不是一个完美的知识来源,我并不能总是提供完整或正确的答案。”它的“陈述”表明,作为“生成型预训练变换模型”(generative pre-trained transformer,GPT),它凭借转换器(transformer)和大数据、强算力,通过人类反馈强化学习(reinforcement learning from human feedback,RLHF)、微调(fine-tuning)等一系列相互促进的技术路线,大大提升了人工智能对自然语言的处理能力。但在“各种各样的输入”基础上“生成类似人类的反应”也表明,GPT知识生产的机制,与人类以往生成知识的机制迥然不同。
(一)与人类的知识生产相比,GPT的知识生产是“非意向性”的
一阶知识与二阶知识均系人类的创造性知识形态,是人类在“意向性”的思维活动之中达成的。与其他动物相比,人类的特殊之处在于,在置身于与自然环境、群体生活的长久互动和经历复杂的演化之后,他们进化成一种能够使用语言的特殊存在者。通过语言,人类可以“映射”和“表述”他们周围的一切、自身甚至是自己的意识活动。在这种凭借语言而与周遭世界进行遭遇的过程中,意向性的活动伴随其间。意向性是一种关系性存在,指的是“意向活动与意识相关项之间的相互关系”,而“意识相关项”则是“被意指之物”,也就是意识对象。这里的对象,其实有两重:其一是外在于人的物与事,其二是人类赋予物与事的意义。由此可知,人类的意识活动,总是关于一定对象的意识活动,在这种意识活动中,也必定有着与意识活动和意识对象如影随形并勾连二者的意识关系。胡塞尔(Edmund Husserl)就曾指出:“认识体验具有一种意向(intentio),这属于认识体验的本质,它们意指某物,它们以这种或那种方式与对象发生关系。尽管对象不属于认识体验,但与对象发生的关系却属于认识体验。”人类创造的知识,正是在这种对意识活动与对象之间关系的认识体验之中逐步完成的。除了关系之外,对于人类知识的形成而言,意向活动和意识对象也必不可少。
在一阶知识形成过程中,我们很容易能够体察到意识对象的存在,即人类的知识书写和对世界的认知,总是在对“物的世界”“事的世界”“意识的世界”的直接体验的基础上完成的。至于二阶知识,“对象”仿佛消失了,知识生产者好像“超越了真实意义上的被给予之物,超越了可直接直观和把握的东西”,只是对一阶知识的再度组合和重新书写。事实上,如前文所言,二阶知识的生产与一阶知识并非泾渭分明,其生产过程总是含有一阶知识生产的要素存在,也就是说,这种形态的知识生产依然是一种意向性的知识生产;即使二阶知识更偏向对一阶知识的“编述”与“钞纂”,但这也是在“人类赋予事与物的意义”这种“对象”的基础上进行的,它依然是一种意向性思维活动,隐含着的对象,并非是仅仅对面向既有文本的向空而作。
意向性活动与意识密不可分,有了意识,思维活动才成为可能。有了思维活动,人类才能运用语言“映射”置身其间的“诸世界”,才能将“诸世界”之中的对象与自身的意识建立起关系。反观GPT,它拥有的是智能,但它却没有意识,也没有思维活动。GPT不能在智能活动中指向“诸世界”,也不可能“映射”诸世界之中的对象。因此,GPT的知识生产是“非意向性”的。与人类知识生产过程中“意向性”活动最终会指向一定对象不同,GPT的知识生产是依托抓取了数量可观信息的大型语言模型,通过对既有信息的整合与加工来实现的。如果说,GPT的知识生产也面对一个“对象”,这个对象就是大型语言模型(LLM)。但是,这个“对象”与GPT之间的关系并非意向性的,它更像是GPT可以获取知识构成要素的资源库。GPT可以凭借自身的算法在这个资源库中“遨游”并针对人类的问题,生产各种相应的文本。GPT的“智能”看似达到了人类自然语言表达甚至是其他艺术创作能力的水平,达到了以假乱真的程度,但事实上,“人工智能的一些‘创造性’表演比如创作绘画、音乐或诗歌,都不是真正的创作,只是基于输入的参数或数据的新联想和新组合”。此种类型的“新联想和新组合”,是一种去对象化性质的“非意向性”智能活动。
(二)GPT生产的文本并非“生成的知识”,而是“既成的知识”
对于人类意识而言,与“意向性”紧密相关的是“反思性”。人类在与周遭世界遭遇时,不仅思想自身之外的周遭世界及其中的诸物和诸务,而且会思想自身,思想自身为何,思想自身为何如此思想自身等等,这就是人类所特有的反思性。对于GPT这样的人工智能而言,它的计算能力,对既有信息和知识的“联想”和“组合”能力很可能已经超越人类。目前GPT-4在各项测试中的表现已非常接近于人类,在可预见的未来,它的诸项能力还可能大大超越人类:“将来的人工智能不难获得人类的全部知识,甚至每件事情或每个人的全部信息,因此,人类的知识提问恐怕考不倒人工智能,就是说,人工智能虽然不能回答所有问题,但它的任何回答不会比人类差。”那么,GPT能够生产知识文本,是否预示着它在知识生产上将全面超越人类呢?至少从目前看,还不可能,因为与人类相比,它缺乏“反思性”。正因为此,GPT依程序运作能够进行高效的知识生产,未来还可能更强大,但它也因没有反思性而“不知道”自己在做什么。
从字面意思出发,GPT被描述为“生成型预训练变换模型”,“生成”一词某种程度上使它具有了一些“创生”的意涵。其实,GPT的知识生产,“创”的成分基本上是不存在的,它生产的知识乃是一种“既成的知识”。正如有研究者所指出的:“ChatGPT……从有到有的生成,说到底不超出‘已知’的范围。其信息处理的结果,并未输出未经输入的东西,而只能根据所收到的输入内容生成文本回应。所以,ChatGPT的生成是关于‘知道’的生成,所生成的东西也是人类已知的”。在运用GPT进行知识生产时,使用者常常会发现它产生的文本令人惊叹,超出使用者的期待与知识视野。GPT产生的这种知识或许是作为个体的使用者自身所未曾知晓也不能生成的,但对于整个人类知识库而言,它却是既成的,只是“翻新”了“形式”,给人以新颖之感而已。
从上述意义上讲,GPT产生的是“既成的知识”,而人类创生的却是“生成的知识”。“生成的知识”的生成过程一定伴随着自我意识和反思性思维活动的介入。赵汀阳将人工智能的演进形态划分为“技术升级”和“存在升级”,前者是指“一种存在的功能得到不断改进、增强和完善”;后者是指“一种存在变成了另一种更高级的存在”。所谓“更高级的存在”,就是有自我意识和反思精神的存在。目前的GPT还仅仅是一种“技术升级”的模式,远非“存在升级”,它是一种知识组合能力的提升,而非知识创造意义上的提升。从生存论的角度看,人类创造知识的过程,是生命时间的展开过程,是面向未来的一种人生筹划。海德格尔(Martin Heidegger)认为,此在寓于世界之中,也就是沉沦于世界中,操劳于世界中,处于一种被抛状态;而这种被抛状态恰恰是此在之所“畏”,由是便需操心与领会并筹划自身的存在。从这个角度看,人类创造知识,其实是被抛于世界中,面临被抛情势的人的具体筹划形态之一。从时间上看,无论何种形式的知识生产,都是隐隐指向未来的。而ChatGPT则是无生无死没有时间性的存在者,其知识生产也算不上指向未来的人生筹划。从时间上说,它虽然以过往和既有的信息网络和各种散落的既成知识为依托,但它是断裂的、缺乏历史性的存在状态和演变状态,是没有时间性的。这种迥然有别的时间性使得二者生产的知识有很大的差异。
(三)GPT的“世界”是一个必然性的世界,而非可能性的世界
人类具有“否思”的思想品质,也就是说,人类在认知、映射、表述、确认“诸世界”的过程中,能够说出诸世界“是”什么,还能从“不是”的视角出发,换一种方向以全新的视角认知、映射、表述、确认“诸世界”。这种“否思”的品质,与前文所述的人类特有的“反思性”和“自我意识”是密不可分的。赵汀阳认为,对于人类而言,“否定词正是信号系统转变为语言的临界点,自从发明了否定词,人类符号系统就告别了信号而变成了语言”,“当否定词开启了无穷可能性,意识以此借力创造一个思想世界,自然万物在语言魔法中被再次世界化,被命名,被分类,被重新组织在语言的世界中”,“就其根本性质而言,否定词的革命性意义并不在于拒绝了某种现实性,而在于开启了一切可能性或任何一种可能性”。由此观之,人类能够借由语言中的“否”开启知识生产的可能性,这种可能性的特质在于,它使人类在世界中生存有可能关照复数的世界与复数的现实(“否思”达致的局面),而非世界或现实的单一面向(“是”导致的结果)。可以说,这两个关键性的要素——“是”与“否”——呈现了人与世界的关系。“是”决定了人类对世界现实状态的一种描绘、表述和映射,而“否”则决定了人类对世界可能性的一种预期和判断;前者的价值在于可借以形成对世界的一种认知与认识;后者的作用,则可以提供“是”达成的认知与认识之外的其他多种甚至是无限多的认识与认知方案,尤为重要的,它还预示着人类对世界的可能的改变与改造。
“否思”这一品性恰恰是GPT所不具备的,也就是说,GPT的知识生产不可能提供既有信息和知识中所不具有的可能性,它形成的知识世界始终是一个必然性的领域。所谓的必然性,一是它所形成的知识依然是必然的;二是它的运作也是必然的。首先,无论从GPT知识形成的过程还是最终生产的知识形态看,它都没有超出人类既有的知识库存。诚然,GPT的“智能”一直在不断增强,从GPT-1到GPT-4,其运作能力的增强可谓惊人,正快速朝着通用人工智能(artificial general intelligence,AGI)的方向狂飙突进。2023年3月,ChatGPT已可支持第三方插件接入,改变了此前信息滞后的弊端,即时的信息甚至是原本不能联结的第三方数据资源都可方便接入。这是否预示着GPT已经超越“必然王国”,进入“自由王国”了呢?至少以目前的水平看尚未实现。虽然,它可以提供看似“否”的内容和方案,但这些内容依然是在人类业已生产的既有知识(“是”)的基础上形成的,它并没有提供这个既有的“是”之外的东西。其次,从GPT的运作上看,它依然是一个必然性的程序。GPT是依照人类设计的程序指令(这是一种“是”)运行,并没有力量突破“是”,自主地决定另外的运行方式。虽然,它也可以篡改、胡说,但是这些“篡改”和“胡说”,都是在人类设定的“是”(程序)之下进行运作的。换言之,GPT不能凭借自己的力量建立自身运作的规则,更不太可能对运行规则做出更改;而因时因地制订规则、改变规则甚至是重新设立规则,正是人类面对复杂环境下的能动性的体现,这使得人类可以对现实(自然世界、社会世界甚至是人类自身意识)说“不”,呈现出别样的可能。
概而言之,虽然目前GPT的接口正在变得越来越多元,其输入的信息辐射面也愈加宽广,似乎正在朝着涵括人类一切既有信息、知识的目标急遽迈进,但它终究是一种封闭,而非开放的系统——这个封闭性的系统看上去无限大,似乎无边无际,可它终究是有边界的,这个边界就是人类既有的必然的知识世界。
03
GPT介入知识生产的社会效应
人类的知识生产中非人类要素一直起着至关重要的作用,有时候甚至在很大程度上左右了人类知识呈现的样貌。作为书写材料的非人类要素,虽然在知识生产中必不可少,但它与知识生产之间的关系并未得到应有的思考。古代中国,书写材质丰富,甲骨、金石、竹、木、帛、纸都曾作为书写材料。钱存训认为:“人类思维的能力和文字载体的方式,其间究竟具有怎样的关系,这是值得我们继续深思的一个重要课题。”他提出这一问题但并未深究。从古代中国知识传播的现实看,书写材料这一非人类要素对古代中国知识生产的影响,至少有一个层面值得关注,即书写材料的难得(距今越古越如此)使知识呈现出言简义丰的形态。在古希腊古罗马世界,“大约从公元200年到公元400年,人们把大量的文献从传统的纸草卷转抄到新近采用的羊皮卷上。……可正是这种转换造成了文献极大的损失。……可一旦文献获得了新的外在存在形式,所有旧的本子,因为已经变得多余,自然被抛弃了”。羊皮纸这种材质介入知识生产领域的一个结果是,它改变了当时的知识格局,古典文献被重新组织,很多文献由于各种各样的原因未能获得传抄至羊皮纸的机会,消失在历史的烟尘之中。书写材质的匮乏、昂贵与难得,迫使人类在知识生产的时候,被迫屈从于材质这种非人类要素,对知识形态和知识取舍做出相应调整。
非人类要素在人类的知识生产中一直占据重要地位,只不过,以往的书写材质这种非人类要素改变的更多的是知识的呈现形式,书写材料本身并未对知识本身产生明显影响,它对人类知识生产的“介入”是凭借自身的特质,通过人类自身改变知识呈现的样貌而达成的。如今,GPT则作为强有力的非人类要素,至少从形式上更加直接地介入到人类知识的生产中,其社会效应也愈加显著。
(一)GPT模糊了“人类要素”与“非人类要素”的界限,成为知识生产场域中重要的结构性要素
吉登斯(Anthony Giddens)认为,结构是“社会系统再生产过程中反复使用到的规则和资源”。其中,资源可分为两类:一类是权威性资源,“源于人类行动者活动的协调”;另一类是配置性资源,“出自对物质产品或物质世界各个方面的控制”。知识生产是社会系统再生产的重要组成部分,在它的生产过程中,规则这种结构性因素固然必不可少,它决定了知识从生产到传播的整个流程,往往以制度和机构的形式发挥作用,也大致确定了知识在整个人类社会的分布状态;规则的落实离不开资源的调用,是资源的调度与分配,最终使规则能够落地,使知识的生产和传播成为现实。
依照吉登斯对结构性要素的划分,GPT更像是某种配置性资源,但它与人类历史上曾经存在过的知识生产中所涉及的其他配置性资源(如竹简木牍,笔墨纸砚,莎草纸,羊皮纸,印刷机等)都不同,它首次以非人类要素的“身份”与人类平起平坐地介入了知识本身的“生成”之中。在分析现代制度时,拉图尔(Bruno Latour)曾说:“现代人天真地认为,他们成功地进行了这样一种扩展,仅仅是因为他们小心翼翼地将自然和社会(以及那被搁置的上帝)分割开来,事实上,他们取得成功恰恰因为他们将更大量的人类和非人类混合起来,他们并没有搁置任何东西,也没有排除任何联合。”人类所居于期间的并非“社会的社会”,而是“联结的社会”。也就是说,现代人的诞生,是联结的结果,而非他们所强调的“纯化”的结果,他们自以为傲的现代(自然与社会的二分,人与非人的二分),其实从未存在过。拉图尔的上述观点,对于我们看待人类社会的知识史仍然有效,特别是如今GPT直接介入知识生产的情况下,未来的知识形态和知识格局,将是人类要素与非人类要素共同起作用的结果,在奠基于信息的知识产品的形成上,GPT这种非人类要素所起的作用、所占的比重恐怕会越来越大。
(二)GPT将使人类的知识呈现“杂合”“未完成状态”,其准确性和权威性遭遇冲击
在人类知识史上,知识的“混杂”状态是很常见的。所谓“知识混杂”,是指在特定知识文本的流传过程中,被人为地加入了初期知识文本中不曾有的内容的现象。在古希腊,常有富有的作者购买别人的手稿,修改后或者直接署上自己的名字交由出版商出版。柏拉图(Plato)就曾被同时代的人指控花费巨资买下毕达哥拉斯学派学者菲洛劳斯(Philolaus)的手稿,“从中‘东拼西凑’出了自己的全部学说”。在知识文本的流传过程中,原本经过缩减、扩展或改写,常常变为另外一个新文本,新旧文本有可能并行流传,新文本也可能取代旧文本,随着时间的流逝,新文本还有可能与旧文本再度混合甚至是与其他变本混合,衍生出更多的文本。《荷马史诗》即是此类“知识混杂”的典型。菲利普·扬(P.H.Young)认为,《荷马史诗》在不同历史时期的不同地域形成了多个不同形式的“定本”,这些定本可能是口头传播与写本共同作用的结果。弗雷德里克·凯尼恩(Frederic G.Kenyon)则指出,《荷马史诗》先有写本,后有口头流传:“《伊利亚特》和《奥德赛》是以文字书写的形式撰作的,而且有其抄写副本以便游吟者记诵同时控制其讹变”。普法费伊尔(Rudolf Pfeiffer)的观点则是:“时至公元前8世纪末,《伊利亚特》及《奥德赛》已经基本成型。……一定存在某种限度,逾此则游吟歌者不能任意自行添加或者改换史诗文本的面貌”。无论如何,可以认定,在一定时期和一定范围内,《荷马史诗》存在多个不同的“混杂文本”。当然,在欧洲历史上,影响力更大的《圣经》,也被看作被多次“污染”的“混杂”文本,它一度被认为是圣徒保罗改编了耶稣的文本,后世更是经历了不知凡几的文本污染。
GPT之前,人类历史上的知识文本,尤其是经典文本,即使原本遭遇了“污染”,经历了复杂的“知识混杂”过程,但借由文献学、目录学等,依然可以大致梳理和辨识出文本的“家族脉络”。GPT时代的来临,令GPT这种智能不断增强的非人类知识生产者以前所未有的态势进入人类的知识生产领地。GPT改变了以往人类独占知识本身生产场域的图景,构造出一个人类与非人类齐头并进的知识生产新格局。在这种新格局中,它“联结”了弥漫整个自然空间与社会时空的“网络”。而且,这个“网络”并非静态,它是一个“行动者的网络”,一直处于运动、流动与变化之中。人类要素与非人类要素的“杂合”作用,导致GPT参与的知识文本始终处于运动与流变之中,呈现出一种“未完成状态”。值得一提的是,与前述人类历史的知识文本可以追踪“文本家族”不同,GPT的知识文本没有来源,很难追溯源流,其可靠性、准确性很难判断,由此也将导致权威性不足的后果。
(三)GPT介入知识生产,将使人类生存境遇面临重要改变
首先,从人与知识之间的关系层面看,GPT参与人类知识生产有可能产生“遮蔽效应”,使人类遗忘了获取知识的初衷。更有甚者,人类自身在知识生产中的地位也有可能发生本质性的变化,从主导者变为参与者,甚至成为被动接受者。GPT作为现代技术体系中的“新进者”,同样体现了技术与人类之间的关系。依海德格尔(Martin Heidegger)的判断,技术不仅是一种手段,“技术乃是一种解蔽方式”;“现代技术的本质”是“集置”,“集置意味着那种摆置的聚集者,这种摆置摆置着人,也即促逼着人,使人以订造方式把现实当作持存物来解蔽”。海德格尔的“解蔽”是对自然事物状况的一种新认识,以及在此认识基础上对它所进行的开发和使用。但是,“解蔽”的同时,也是“遮蔽”,“遮蔽”这一观念所揭示的是人对自然事物的“解蔽”之前的一种精神想象的、非实用性的遗忘。对于知识的生产而言,亦可作如是观。有了GPT,我们更看重的是它强大的实用性和信息搜索集成能力,而对于知识生成之中人的思维运作,以及“上穷碧落下黄泉”的知识搜集过程中的生命展开之过程,则忘得一干二净。遗忘的同时,也彰显着人类自身在知识生产格局中的地位被悄然置换的过程——正如斯蒂格勒(Bernard Stiegler)所言:“技术从表面看是人类的力量,而实际上它似乎对它的力量(也可以是它的行为)自治,以至妨碍了人的行为,即妨碍传播、决策和个体化。”在未来的知识生产格局中,GPT有可能与人类分庭抗礼,也有可能喧宾夺主。
其次,GPT有可能成为知识鸿沟进一步加深甚至成为人类分层分化的“加速器”。对于GPT的横空出世及其对人类自然语言超强的高仿能力,人们洋溢着一种乐观的情绪。有研究者就指出,ChatGPT开启了人类的智能互联时代,是对人类的重大赋能赋权。从GPT的飞速迭代和它在社会各领域可能的各项运用看,这样的判断自有其道理。但在其高度智能化、高度效率化的背后,也可能潜藏着对人类生存格局的重构。早在未有高速互联网和当下人工智能的1988年,科学史家乔治·巴萨拉(George Basalla)就指出:“在技术发展与人类处境的整体改善之间存在着松散联系。所以,我们必须断然抛弃流行的、然而却是错误的技术进步说,代之以一种我们自觉培养的对人造物世界多样性的正确评价。”人类对人造物世界的正确评价,也就是在看到技术带来诸多便利甚至是重大利好(如前述赋权赋能)的同时,能够反思技术背后不太显而易见的东西。正如一位历史学家所言,当代社会,人类“已经就像是一枚又一枚小小的晶片,装在一套大到没有人真正理解的资料处理系统中”,我们固然还不需要担心“机器人”,但是必须“提防机器人的主人”。人们期望的是GPT能够成为可以人人共享的知识生产和人机、人际沟通工具,但从技术社会史发展的一般规律和GPT技术开发者目前对其技术资源的处置方式看,它极有可能和以往技术史上的其他技术一样,成为少数人掌控的资源并用以支配其他人命运以达成自身目的之途径。若这种情况发生,多数人就会和GPT一样,成为GPT的主人们“解蔽现实”的持存之物。
最后,GPT也有可能会改变人类的交往方式,使个体成为信息海洋中的“孤岛”,“孤单—求助GPT—孤单加剧—继续求助GPT”的循环怪圈可能成为人类生活的常态。GPT介入知识生产将导致信息快速增殖,可以预见,这种增殖会在短时期内超越人类历史上的任何时期。人类在信息与知识的海洋中看不到尽头,也辨不清方向。刘慈欣在《三体》中描绘了一种特殊时刻的“信息雪崩”状态:“各种尺寸的窗口从所有方向涌现,像彩色的雪崩,很快埋住了原有的几个显示太空工程实时画面的大窗口。人们把这种现象称为‘窗口雪崩’,它的出现意味着突发的重大事件。但这种突发的信息洪水往往使人在震惊中很长时间不知所措,反而搞不清到底发生了什么”。而这种“信息雪崩”的状况,则是“技术爆炸”的结果:“……技术爆炸。……技术飞跃的可能性是埋藏在每个文明内部的炸药,如果有内部或外部因素点燃了它,轰一下就炸开了!”ChatGPT甫一面试,我们似乎就已感知到了“技术爆炸”的威力以及随之而来的“信息雪崩”的前景。阿西莫夫(Isaac Asimov)在1957年的作品《裸阳》(The Naked Sun)中刻画了索拉里星球上外星族的生活:人们绝大多数时间面对的不是其他人类个体,而是各式各样的智能机器人(大部分人90%以上的时间与机器人共处)。机器人之间构建了可以相互融通信息、协调行动的机器人网络,形成了一个特征鲜明的“人”与“非人”共处的社会。每个人生活的“领地”相隔遥远,各自生活的空间常常是“领地”上独立的建筑,多达数十个房间。每个人都孤独地活在自己的“城堡”里。刘慈欣与阿西莫夫撰写的虽然是科幻作品,但他们以极富前瞻性的洞见提示了已经到来或人类即将面临的生存处境。对于人类的知识生产而言,GPT就是一次“技术爆炸”,它使人工智能不仅获得了形式上与人类平起平坐的地位(这是质的飞越),还展示出在知识生产效率上超越人类的潜能(这是知识生产效率的提升)。信息与知识的丰富固然可喜,但也会使人陷入无所适从的境地,《三体》中“信息雪崩”的“重大时刻”或将成为人类生活的日常,而面对形态各异、蜂拥而至的信息与知识,人类也可能陷入索拉里星上外星族的精神孤立状态。
04
结语
回到辛弃疾,《水龙吟·昔时曾有佳人》的语句虽化用的俱是此前文本,但它却折射着词人对其身处时代与社会情境的深切情感——表达了作者对南宋朝廷耽于逸乐、不肯北伐收复失地的不满。即是说,这首词,文本形式上是从旧的,但意向对象上却是全新的,词作的生成处处彰显出词人的反思精神。法国启蒙运动时期,百科全书派的思想书写,形式上是对欧洲既有知识的再造,但这种再造的知识背后亦是狄德罗(Denis Diderot)、路易·德·若谷(Louis de Jaucourt)等人所意向的法国乃至欧洲社会。因此,GPT的知识生产,形式上或许与人类上述生成知识的过程极其类似,但二者的关键差异在于,人类不仅仅是对既有知识文本的重组,而是在文本重组的过程中,意向着新的对象,重构了文本的意义,生成了全新的文本。
虽然在知识生产机制上与人类不同,但不容忽视的是,GPT介入知识生产,一个显而易见的事实是,它以拥有强大智能的“非人类实体”的身份成为人类知识生产场域中强有力的参与者,其显在和隐性的社会效应将逐步显现。从目前看,GPT尚未具备人类的反思意识,也没有“否思”的品性,它依然是一个既成知识的生产者,并没有生成知识的能力。从这个角度看,GPT的不完善,其实是对人类价值的肯定,是对人类创造知识的优先性的一种褒扬。GPT生产的知识确实是没有意向对象的,它形成知识文本的过程是依靠逻辑关系实现的,但人类的参与,却在一定程度上使得人类与GPT一问一答的“杂合文本”有了某种“弱意向性”,特别是GPT生产的杂合知识文本若经过人类的深度再加工,其意向性的特质就更加突出。只不过,GPT介入知识生产后,人类也将不得不面对“杂合知识”急遽扩充的局面。
从另一个角度看,GPT或许可以提高人类精神生活或物质实践的效率,但它的背后,却代表着人类的分化,掌握技术的少数人对相关技术的垄断,有可能使他们实现对未能掌握技术的人的宰制。此外,若GPT真如有些人断言的那样将会逐步拥有人类的“反思性”和“否思”的品性,人类必将面临与GPT这种“新的类人类”的全新关系——在知识生产中,主导者与参与者的地位也将面临新调整。换言之,GPT介入知识生产,必将大大改变人类未来的生存境遇,我们应对其狂飙突进的迭代更新态势给予重新审视,对于其可见及不可见的社会效应,也需要做更进一步的深思。
转自:“再建巴别塔”微信公众号
如有侵权,请联系本站删除!