0 引 言
随着互联网、大数据、人工智能等技术的蓬勃发展,新科学革命对当前高校的工程教育提出了新的机遇与挑战[1]。2017年教育部积极推进新工科建设,全力探索形成领跑全球工程教育的中国模式和经验,助力高等教育的发展和强国建设。在这一背景下,大数据、人工智能等新一代信息技术成为探索新工科建设的新方向和新领域[2]。作为人工智能“皇冠上的明珠”的自然语言处理得到了学术界和工业界的极大重视,故该课程也逐渐被引入高等学校的教学课堂,并被纳入各高等院校人工智能和计算机相关学院的人才培养体系。
自然语言处理是人工智能和计算机科学与技术专业的核心专业课程之一,属于相对较新的交叉学科,涵盖了语言学、概率统计学、机器学习、数据挖掘等学科知识内容[3]。自然语言处理课程的理论性较强、知识体系非常庞杂,其主要内容涵盖语言模型、词法、句法、语义分析、文本分类、情感分析等基础知识和技术,同时自然语言处理也是一种应用技术,其研究内容包括机器翻译、信息检索、自动问题、信息推荐等应用领域[4]。在面向人工智能专业的自然语言处理课程体系中,如何在有限学时内兼顾基础理论知识与应用技术,如何从教学内容和形式上更好地提升学生学习的主动性和能动性,是专业任课教师在进行教学改革和实践探索过程中要积极研讨的重点。
自然语言处理作为一门专业基础课程,在短短一个学期的课堂教学中,要让学生系统深入地掌握繁多的相关基础知识和应用技术十分困难。在教学过程中,如果过分注重理论知识的讲述,难免会让学生感觉枯燥,看不到实际的应用价值;相反,如果只进行项目实践而不学习自然语言处理的基础知识,这也会给学生造成知其然不知其所以然的窘境,不能使学生在自然语言的知识结构和应用技术之间建立系统的体系。确定合适的教学内容和教学方法,精心地设计教学模式是确保课程教学效果的关键。
1 联动式实践驱动的自然语言处理课程教学模式
联动式实践驱动的自然语言处理课程教学模式,是将理论知识的讲授模式与实践驱动的教学理念相结合,将学生从枯燥的理论课程学习中解放出来,做到实践驱动理论知识学习,理论知识为课程实践提供实验方法和技术路线的指导,从而打通孤立的自然语言处理基础知识与各实践应用之间的鸿沟。在联动式实践驱动的教学模式下,学生既能系统地学习重要的理论基础知识,又能锻炼解决和分析自然语言处理领域实际问题的能力,真正做到理论知识学习与实践训练的联动式发展,调动学习该课程的兴趣。在具体改革措施上,将联动式课程体系与问题导向、串联对比等教学方法相结合,以实践驱动理论知识学习,从理论教学设计与方法、实验教学设计、课程考核等方面进行改革,以取得较好的教学效果。
2 理论教学设计与方法
自然语言处理课程体系一般涵盖了自然语言处理中的基础知识和应用技术[5]。由于自然语言处理的相关知识体系非常庞杂,当前针对该课程的教材基本上都是一些零散的基础知识讲解,如每一章节孤立地讲述中文分词、语言模型、文本向量化、降维、分类算法、聚类算法等,没有对自然语言处理的研究体系进行梳理,也没有形成一套完善的自然语言处理流程和框架,导致学生学习起来十分吃力,对各章节的知识不能形成体系化、系统化的认知,不知道这些孤立的知识在自然语言处理流程中所占的角色,也不能在自然语言的知识结构和应用技术之间建立系统的体系。为达到联动式实践驱动的教学改革目的,笔者对教学目标和课程定位进行梳理,对教学内容进行甄选,制订出理论教学和实践教学的内容与体系框架(如图1所示)。
在图1所示的课程教学体系中,对于语言学基础、分词、命名实体识别等自然语言处理基础知识,主要采用教师讲授和课堂讨论的教学方式;在此基础上,采用讲授与实践相结合的方式,让学生学习文本向量化表示方法及分布式表示方法,然后将传统文本分类与基于CNN建模的方法进行对比学习,并展示与讨论文本表示在系统分类建模中的角色和作用;最后教师与学生一起探讨自然语言处理的应用技术,激发学生的学习兴趣,增强学习的获得感。
2.1 联动式课程体系
在教学设计中,以智能软件系统开发为驱动,根据项目开发实践,将相关理论知识学习和项目实践串联起来,形成一套面向项目开发、多知识点联动的课程教学体系,如以“文本分类”和“情感分类”系统的建模为主线,将系统建模过程中涉及的分词与词性标注、特征选择、文本向量化等基础知识与分类算法、训练模型等融会贯通。通过本课程的学习,学生可以建立一整套系统化的自然语言处理知识体系,不仅能够掌握自然语言处理的基础知识,还锻炼利用机器学习方法建模智能软件系统的能力,同时树立在项目开发过程中的团队协作意识。
2.2 问题导向式教学
在自然语言处理理论课程讲授过程中,采用问题导向式教学方法[6],以自然语言处理领域的各种问题为学习起点,让学生围绕这些问题主动寻求解决方案;教师在此过程中扮演的是问题的提出者、课程的设计者以及结果的评估者等角色,以激发学生学习的主动性为目标,从而提高其在教学过程中的参与度,激起其求知欲。如在“中文分词”内容的讲解中,教师通过问题引导的教学方式,让学生很快了解什么是自动分词,如何进行汉语词汇的自动切割,需要什么资源支持,可以采用什么算法进行分词,分词算法设计过程中要注意的关键问题是什么。在“文本分类”的课程教学设计中,教师提问:人类是如何识别
库中的鸟类、老虎、猫、狗等动物的?图书馆的图书资料是如何进行编码分类入库的?电子邮件系统是如何对垃圾邮件进行过滤的?通过解答类似问题,学生能很快理清人类如何进行分类或者识别,主动归纳出智能模型对事物进行分类主要是以对象的特征为判别依据,然后利用识别到的特征进行对象分类。通过问题导向式教学,学生自己就可以了解清楚文本分类的概念,并主动归纳出在文本自动分类任务中,最重要的流程和任务是进行特征提取与选择,进而利用各种机器学习算法建立文本分类模型。
2.3 串联对比教学
由于机器学习技术的发展,特别是深度学习技术在人工智能各个领域中的广泛应用,针对自然语言处理领域中的各个问题也衍生出不同的解决方案。自然语言处理的发展历程大致经历了基于规则的方法以及基于统计的机器学习建模方法。笔者在自然语言处理课程设计时,也大抵遵循技术的发展脉络进行不断深入。如在讲解经典的“文本分类”时,通过串联的方式对不同的文本分类建模方案进行对比分析。首先讲解基于传统机器学习技术的文本分类建模方法及流程(包括特征提取和特征选择方法、数据降维技术等),在此基础上利用传统的分类算法进行建模。作为方法对比,紧接着讲解端到端的基于深度学习的文本分类方法,这一过程中探讨当前比较流行的分布式文本表示方法(如Word2Vec、Paragraph2Vec等),进而利用深度神经网络对数据进行建模;同时,在选择深度神经网络时,比较不同的神经网络架构在文本分类建模时的优劣性,如相比图像、视频等输入数据,循环神经网络和卷积神经网络在建模时对文本向量的特殊处理方式。引导学生思考在NLP中CNN网络的输入可以是什么;如果输入是词向量,每一行代表一个词,如何解决不同的文本长度不统一的问题。通过同一自然语言的应用问题,针对不同的建模方法和流程的对比教学,可以把前面学习的分散知识点串联起来,让学生形成一个清晰的自然语言处理知识体系。
2.4 实践驱动教学
在实践课程教学过程中,可以设计若干个实践项目将自然语言处理的基础知识和开发技能串联起来[7],让学生在项目实践中体会和深化理论课程中学习的自然语言处理技术和算法,如在构建“文本分类”项目中,驱动学生综合利用文本向量化技术、特征提取和特征选择、数据降维及各种机器学习算法等来训练分类模型,提升了学生对相关自然语言处理基础知识的理解深度和应用技能水平。通过项目实践可以充分发挥学生的主动性、能动性和创造性,锻炼其自主地发现问题、分析问题和解决问题的能力。
总之,通过以上这些教学设计与教学方法的灵活运用,有效地引导学生由单纯的课本知识学习向自主性探索和学术研究方向发展,为部分致力于研究生学习的学生培养初步科学素养,同时也激起了部分学生的科学研究兴趣和热情,让高年级的本科生逐渐明白大学生的课程学习不仅仅要学习书本上的基础知识,同时还要有一定的科学探索和创新意识,应该积极主动地探索与创造未知世界的知识和技术,为国家和人类的科技发展与技术进步贡献自己的力量。
3 实验教学设计
项目驱动的实践教学是本课程体系设计的一大特色。自然语言处理课程具有较强的理论性和实践性,对学生要求非常高,不仅要求学生掌握扎实的自然语言处理基础理论知识,而且要具备构建智能信息处理系统的实践能力[8]。通过本课程的实验环节,可以驱动学生将孤立的基础理论知识与项目实践技能有机地结合起来,使学生摆脱理论知识学习时的枯燥感。本课程设计的实验内容和实验目标见表1,安排4次实验项目,并在每一个实验项目中逐级增加难度,分别设置初级、中级、进阶3个等级,保证绝大部分学生可以较轻松地完成初级实验内容,同时给学有余力的学生提供了更高的挑战目标,通过选择性地完成中级和进阶实验题目,提高学生参与实验项目的充实感和满足感。
4 课程考核与效果
本门课程采用课堂讨论、课程实验、课程论文等相结合的方式进行考核。
(1)课堂讨论:以学生在课堂上的互动、内容讲述和项目展示作为评分依据。
(2)课程实验:本课程安排了4次实验,分别为中文分词实验、文本向量化实验、基于传统机器学习方法的文本分类实验、基于卷积神经网络或循环神经网络的情感分析实验。每次实验项目要求学生撰写详细的实验报告,增强了学生利用所学知识解决自然语言问题的能力。
(3)课程论文:针对课堂教学的内容,拟定若干个自然语言处理研究任务的选题,要求学生选定题目并完成一篇课程论文。
为验证本课程考核的效果,对学生近3年的考核成绩进行统计分析。对于本科生,期末成绩在80—90之间的学生占比为79.21%,成绩大于90分的学生占比达到10.15%;对于硕士研究生,期末成绩在80—90之间的学生占比为38.24%,成绩大于90分的学生占比达到61.76%。近几年的统计数据表明,这种教学和考核方案适应高校本科生、研究生自然语言处理课程的学习与考核。课程的理论教学与项目实践贯穿于整个教学过程,且二者得到了充分的联动,学生不仅较好地掌握了基本理论知识,也锻炼了开发自然语言系统的实践能力。
5 结 语
联动式实践驱动的自然语言处理课程教学方法将学生从枯燥的基础知识学习中解放出来,打通了孤立的自然语言处理基础知识与实践应用之间的鸿沟,有效地调动了学生学习的积极性和主动性,使其形成一套系统的自然语言处理知识体系。该教学模式极好地培养了学生设计、开发自然语言智能系统的能力,提高了其专业素养,教学效果良好。
参考文献:
[1] 孙锐, 谢红. 地方普通院校文本挖掘课程的教学实施和探索[J]. 计算机教育, 2021(10): 170-178.
[2] 陈龙, 张伟, 赵英良, 等. 新工科背景下大学计算机人工智能实验案例设计[J]. 计算机教育, 2022(3): 29-33.
[3] 傅迎华, 李江, 付东翔. 自然语言处理课程教学探索和实践[J]. 计算机教育, 2018(4): 56-59.
[4] 王晶晶, 高晓雅. “自然语言处理”课程教学分析与实践[J]. 电脑知识与技术, 2021, 17(18): 160-161.
[5] 艾山·吾买尔, 买合木提·买买提, 汪烈军. 基于人工智能技术的“自然语言处理”课程教学模式改革与探索[J]. 无线互联科技, 2021, 17(10): 92-94.
[6] 钟茂生, 黄晓辉, 张红斌. “问题引导+项目驱动”并举的自然语言处理课程教学改革实践[J]. 计算机教育, 2018(6): 72-75.
[7] 罗世奇, 田生伟. 自然语言处理项目式教学策略探究[J]. 中国教育技术装备, 2020(4): 104-105.
[8] 李红, 林珊, 欧阳勇. 基于深度学习的自然语言处理课程教学探索与实践[J]. 计算机教育, 2021(11): 147-151.
基金项目:重庆市高等教育教学改革研究项目“人工智能专业特色课程‘自然语言处理’”(193188);重庆市教委研究生教育教学改革研究重点项目“创新驱动战略背景下计算机类新工科专业学位硕士研究生培养质量评价体系研究”(yjg192035)。
第一作者简介:张宜浩,男,重庆理工大学副教授,研究方向为推荐系统、自然语言处理,yhzhang@cqut.edu.cn。
引文格式:张宜浩,刘小洋. 新工科背景下自然语言处理课程教学改革 [J].计算机教育,2023(1):96-99.
转自:“计算机教育”微信公众号
如有侵权,请联系本站删除!