0 引 言
人工智能是引领科技革命与产业变革的战略性技术和重要驱动力量,具有多学科交叉综合、渗透力和支撑性强、高度复杂等特点,呈现技术属性与社会属性高度融合特色。加快推动人工智能人才队伍建设,提升人工智能专业人才的培养质量和规模,将人工智能技术与产业场景深度结合,可以充分激发人工智能“头雁效应”,推动经济发展与社会进步。
人工智能引论是教育部在 2021 年底启动实施的计算机领域本科教育教学改革试点工作计划(简称“101 计划”)中所规划的 12 门计算机核心专业课程之一,承担了培养学生建立人工智能素养、了解人工智能算法、掌握人工智能应用的重要使命,具有深远意义和广阔前景。
人工智能引论课程以“厚基础、强交叉、养品行、促应用”为理念,旨在培养学生扎实掌握人工智能的基础理论、基本方法、架构系统和应用工程技术,使他们能够在我国人工智能学科与产业技术发展中发挥重要作用,并有潜力跻身一流的人工智能领域或相关领域人才。为此,以知识点为核心组织课程建设,结合“教材建设、课程共享和平台增效”三位一体的教学手段,在此基础上打造数字化和智能化的育人基座能力。教材体现了教育思想和教学内容,课程是教材的教学育人实践载体,平台则是将教材和课程增效的手段。三位一体理念将推动科教融合与产教融合,引领带动人工智能相关人才培养质量的整体提升。
基于图灵奖得主约翰·霍普克罗夫特对“101 计划”课程组织形式的建议,人工智能引论以知识点为核心组织课程建设。课堂教学、教材编撰和课程实践按照这些知识点进行迭代与改进。这样做既能保证教学内容的完整性和系统性,又能提高教学效率和灵活性[1]。同时,课程团队在教材编写过程中也积累了大规模高质量的人工智能语料数据以及坚实的人工智能软硬件算法基础。在这些基础之上,课程团队联合高等教育出版社推出人工智能领域大模型“智海—三乐”(wisdomBothttps://sanle.hep.com.cn),充分利用人工智能技术加快推动人才培养模式和教学方法改革。
1 以知识点为核心的课程组织
知识点作为教学的基本单元,在课堂教学、教材编撰和课程实践中起着重要作用。它代表特定学科中的具体概念、原理或技能,是构成学科知识体系的基本组成部分。通过对知识点的分类、连接和关联,可以构建一个相互关联、逻辑严密的知识体系,为教师的教学和学生的学习提供基本指导和框架。此外,随着学科的发展以及知识的不断积累,新的知识点可以不断加入到已有的知识体系中,以保持其时效性和完整性。
在完成课程知识体系构建后,可以将课件、讲义、教学视频、实训练习等教学资源与知识点进行关联,形成以知识点为核心的课程组织方式。教师和学生可以根据学习进度和个体需求,自由选择并组合教学资源,实现个性化的教学方式和学习体验。
以知识点为核心的课程组织方式有助于促进知识的联结与迁移。不同的知识点之间存在内在联系和相互依赖关系。通过将相关知识点放在一起进行学习与探究,可以加深学生对知识的理解,帮助他们构建知识之间的桥梁,促进知识的迁移与应用。此外,知识点的划分与组织也有助于培养学生的批判思维和综合能力,使他们能够从不同角度思考并理解问题,培养批判思维和综合分析能力。同时,知识点的划分与组织也有助于培养学生的学科思维和学科素养,帮助他们形成学科的思维方式和方法论。
对知识的分类最早可以追溯至战国至两汉时代的辞书类文学作品《尔雅》[2]。这部古代辞书最早将动物按照特征和类别进行分类,将它们划分为鸟、兽、鱼、虫四大类。《尔雅》的分类方式虽然相对简单,但它开创了对知识进行分类整理的先河,为后来的知识体系构建提供了启示与借鉴,促进了不同领域学者之间的跨学科知识交流[3-4]。
2 人工智能引论知识点介绍
按照“厚算法基础、养伦理意识、匠工具平台、促赋能应用”的培养目标,人工智能引论设置了 10 个模块和 63 个知识点(含 9 个进阶知识点),建议授课教学学时为 64 学时( 4 学分),同时安排了实践教学学时。课程面向计算机科学与技术、人工智能、智能科学等相关专业本科生或研究生,具体内容如图1所示。
10 个知识点模块之间相互支撑、互为一体,将算法、模型、系统、应用、伦理规范等有机结合。63 个知识点之间也不是互相独立,而是存在着层次递进、包含等关系。如图 2 所示,与算法和模型相关的知识点之间存在层次脉络结构,强调了从逻辑推理到问题求解、从策略搜索到数据建模、从浅层学习到深层学习、从单次式标注到序贯式奖励、从最优解到均衡解。通过对知识点关系脉络图的梳理,可以帮助学生了解构成人工智能知识“大厦”的“楼层”和“房间”,以及“房间”与“房间”之间的逻辑关系。这样,在教学过程中就可以使用导航图来引导学生,使其对当前在哪里、前方有什么、走过了怎样的道路、为什么来到了这里等,能有一个清晰的认识及规划。
3 数字化和智能化的育人基座能力
育人基座能力是指依托平台实现的人才培养基础能力。当前,教育教学目标正从“知识本位教育”向“能力本位教育”转变,而人工智能专业更加注重培养学生的知行合一能力。为了降低学生开发、训练和部署人工智能项目的门槛,智海平台推出了智海—Mo实训平台,将教、学、练、用有机地结合在课程中。智海—Mo提供了从教学项目到人工智能在线实训环境、教学管理等全流程一站式解决方案。人工智能引论这门课程的数字化教学资源及实训案例都是基于智海—Mo构建的,旨在实现优质教学资源的共享以及理论/实践的人工智能教学新模式的整合。
大模型技术因为其强大的语言理解、多轮对话等能力,与教育领域天然契合。在“教材、课程和实训平台”三位一体的人工智能教育教学新模式的基础上,浙江大学与高等教育出版社联合推出人工智能领域大模型“智海—三乐”,充分利用智能技术加快推动人才培养模式、教学方法改革,共同开启智能化教育新时代。智海—三乐以阿里云通义千问 7B(70 亿参数)通用模型为基座,基于核心教材、领域论文、学位论文等教科书级高质量语料和专业指令数据集进行预训练及微调,集成了搜索引擎、计算引擎、本地知识库等功能,目前已通过阿里云灵积平台(DashScope)对外提供API服务。
相比于通用大模型,教育领域(人工智能方向)垂直大模型有以下几点优势:①教育大模型可以根据教育领域的独特需求进行定制,提供更有价值、更可信赖的回答。比如,学生可能想要知道学习某个知识点的学习路径。如果用一个教育大模型去回答,它可以利用教学大纲等数据和知识,来给出更专业的建议。②教育大模型可以基于大量高质量的核心教材、领域论文等数据进行训练,使其能够为学生和教育工作者提供更准确可靠的信息。③教育大模型还可以结合自适应学习、个性化推荐等功能,促进个性化学习体验,满足不同学生的学习风格[5]。总之,教育大模型基于成熟稳定的基础大模型底座,针对教育场景具体问题进行能力的组合与调优,进而高效地解决实际问题。
智海—三乐的构建流程如图3所示。将大模型引入教育领域并弥补其不足的关键在于将大模型与教育理论相结合,从而使通用大模型能够支撑不同层级的教学能力。在众多教育理论中,布鲁姆教育目标分类法(Bloom’s Taxonomy)[6]为教育工作者塑造学生所需的多样化目标和能力提供了一个框架。布鲁姆教育目标分类法采用了一个包含“知识”和“认知过程”的二维框架。其中,“知识”指学习中的具体内容,而“认知过程”则指要掌握的学习能力。①根据布鲁姆教育目标分类法,为了提升大模型对教科书中“知识”的覆盖广度,从人工智能领域的语料中抽取、筛选、总结一组知识点集合,并利用大模型进一步扩展,以获得更为细致、具体的知识点集合。这种方法能够获得全面覆盖多个层次和复杂度的知识点集合,有助于提升模型的专业能力。②基于此,利用自我指导(self-instruct)[7]的方法,构建一个满足不同“认知过程”维度的40K中文指令数据集,涵盖知识问答、试题生成、智能辅导等教学需求。这些指令数据不仅涵盖各个层次的认知能力(尤其是高级能力),还包含前面提到的所有细粒度的知识点。通过将这些数据用作有监督微调(SFT)[8]过程的训练数据,可以显著提高模型对人工智能领域知识的理解能力,以满足教师和学生的问答需求。③为了增强模型对训练数据之外的知识的掌握程度,在推理过程中采用两种检索增强策略,即本地知识库检索增强和搜索引擎检索增强,作为额外的知识来源。
三乐出自《孟子》:“得天下英才而教育之,三乐也”,这是教育一词的起源,寓意重视教育是亘古不变的话题。为了辅助人工智能引论的教与学,智海—三乐计划于2023年9月开始,在全国12所高校开展的人工智能引论试点教学中进行试用。智海—三乐为试点高校的师生提供了智能问答、试题生成、学习导航、教学评估等智能化、个性化的教育教学体验,使得“教材建设、课程共享和平台增效”三位一体成为现实,推动科教融汇与产教融合,为国产人工智能技术体系入教学、人工智能主题案例建设、虚拟教研室赋能、学科交叉变革等提供支撑,形成数字化和智能化的育人基座能力。
4 结 语
“凡贵通者,贵其能用之也”,相信人工智能通用能力与教育场景的结合,在通用人工智能和专用人工智能之间取得平衡,能够迸发以前无法触及的赋能之力,从而推动新时代教育研究范式变革。希望以人工智能引论为起点,开启一种新的人才培养模式,通过数字化和智能化手段提升教育教学体验。
参考文献:
[1] 计算机领域本科教育教学改革试点工作计划工作组. 高等学校计算机类专业人才培养战略研究报告暨核心课程体系[M]. 北京: 高等教育出版社, 2023.
[2] 陈静远, 胡丽雅, 吴飞. ChatGPT/生成式人工智能促进以知识点为核心的教学模式变革研究[J]. 华东师范大学学报(教育科学版), 2023(7): 177-186.
[3] 吴飞, 陈为, 孙凌云, 等. 以知识点为中心建设AI+X微专业[J]. 科教发展研究, 2023(3): 96-118.
[4] 吴飞, 陈为. 人工智能交叉人才培养与课程体系[M]. 北京: 清华大学出版社, 2022.
[5] Papers. Education in the era of generative artificial intelligence (AI): Understanding the potential benefits of ChatGPT in promoting teaching and learning[EB/OL]. (2023-04-13)[2023-08-13]. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4337484.
[6] Krathwohl D R. A revision of Bloom's taxonomy: An overview[J]. Theory into practice, 2002, 41(4): 212-218.
[7] Cornell University. Self-instruct: Aligning language model with self generated instructions[EB/OL]. (2023-05-25)[2023-08-13]. https://arxiv.org/abs/2212.10560.
[8] Cornell University. Finetuned language models are zero-shot learners[EB/OL]. (2022-02-08)[2023-08-13]. https://arxiv.org/abs/2109.01652.
基金项目:国家自然科学基金重点项目(62037001);国家自然科学基金青年项目(62307032);上海市“科技创新行动计划”启明星项目(23QA1409000);浙江大学繁星科学基金项目(SN-ZJU-SIAS-0010)。
作者简介:陈静远,女,浙江大学研究员,研究方向为智能教育、多媒体分析,jingyuanchen@zju.edu.cn;吴飞(通信作者),男,浙江大学教授,研究方向为人工智能、跨媒体计算,wufei@cs.zju.edu.cn。
俞勇.“101计划”中数据结构课程与教材建设的思考与实践[J].计算机教育,2023(11):9-11.
转自:“计算机教育”微信公众号
如有侵权,请联系本站删除!