摘要:AIGC时代高等教育的学术剽窃出现异化和升级的趋势,容易挫伤学生学习自主性,破坏教学评估的公正公平,引发教育信任危机并损害高校立德树人的目标。海外高校为应对该挑战出现了全面禁止使用和有条件准许两种模式,我国高校仍处于观望状态,且我国规范学术剽窃的传统资源也存在
AIGC时代高等教育的学术剽窃出现异化和升级的趋势,容易挫伤学生学习自主性,破坏教学评估的公正公平,引发教育信任危机并损害高校立德树人的目标。海外高校为应对该挑战出现了全面禁止使用和有条件准许两种模式,我国高校仍处于观望状态,且我国规范学术剽窃的传统资源也存在一定局限。我国高等教育应以开放包容的态度接纳新技术并及时建立应对挑战的综合治理体系。应优先采取技术治理路径,配合平台自治和政府监管,同时改革高校的教育理念、教学模式和学术诚信政策,在《学位法》及配套规章之下细化利用生成式人工智能的具体规则。
一、问题的提出
生成式人工智能(GAI)的诞生与推广正给人类社会各个领域带来剧变。2022年11月,美国科技公司OpenAI正式发布了深度学习领域里程碑式的大型语言模型ChatGPT-3.5,在短短两个月内用户就突破一亿。四个月后,迭代产品ChatGPT-4(以下统称ChatGPT)已经可以全面支持文字、图片、代码、语音等多种形式的输入与输出。2024年2月,能精准领会用户提示、生成引人入胜的文生视频模型sora诞生。可以预见,GAI很可能点燃新一轮科技革命,成为人类社会各个领域变革的基石性技术。GAI也给高等教育带来了机遇。第一,GAI可以助力创新。GAI能够作为学习活动的引导者,为学生现有的思维方式和知识结构提供建设性意见,从而推动学生将新领域的知识整合进已有体系,以激发新的灵感。第二,GAI可以减轻教师和学生的负担,实现个性化教学。例如充当助教角色,帮助教师完成准备工作并根据学生个体学习需求来提供个性化的辅导和反馈。GAI的个性化定制辅导能力还有助于消弭教育资源匮乏导致的地域差距。然而,机遇总伴随着挑战,GAI的滥用也可能助长高等教育的学术剽窃等不端行为。据报道,弗曼大学有学生在哲学课提交了通过检测软件的人工智能生成论文。北密歇根大学有学生在世界宗教课程中提交了ChatGPT生成的论文,导致授课老师不得不采取多项课堂改革,包括要求学生在有监控与限制的浏览器内撰写初稿并解释每一次修改初稿的原因。高校内部对学生使用ChatGPT的态度也有分歧。福布斯一项调查显示:在调研样本中,48%的学生承认借助ChatGPT完成作业或测验,2%的大学生认为应禁止ChatGPT进入大学网络;82%的大学教授知道ChatGPT,其中有72%担心它被用于作弊;超过三分之一(34%)的教育工作者认为应在中小学和大学里禁止ChatGPT,而66%的教育工作者则支持学生使用。
注意到GAI的滥用可能引发高等教育的学术剽窃风险,越来越多的域外高校出台了应对的政策。但由于认识上的分歧,这些政策对是否允许使用GAI的态度迥然不同。例如,纽约市教育部门宣布禁止在公立学校所有网络和设备上使用ChatGPT。悉尼大学最新的学术诚信政策明确指出使用人工智能生成内容(AIGC)是一种作弊行为。英国部分大学开始鼓励教师改进课堂评估方式。而加拿大高校则鼓励教育工作者和教师与学生互动,就该工具的利弊及如何避免学术不端行为进行透明的对话以决定最终的使用方式。
与国外情况不同,由于绝大部分国内学生使用国外GAI技术存在一定门槛,因此我国尚无与之相关的学术不端行为的大规模报道。但这并不意味着可以高枕无忧。恰恰相反,我国高等教育界应该把握好目前的技术空档期进行预防性的制度设计。这种现实性和紧迫性体现在:首先,我国高校一直以来都将学生书面作品作为教学考核与评价体系的重要组成部分,但目前各高校对学生使用GAI的问题却缺乏指导和监管,GAI的滥用会直接冲击我国既有的高等教育评估体系。其次,随着国内技术研发的跟进,高性能GAI工具必将在国内投入应用,我国高校很快也会面临类似国外高校同行的压力。再次,我国高等教育的学术剽窃现象一直比较严重,不仅日常作业的原创度堪忧,学位论文剽窃造假等情况也屡见不鲜,而AIGC时代的到来极有可能会加剧这种现象。最后,我国高等教育界尚未认真审视我国规制学术剽窃的现有资源在面对GAI的挑战时是否充足,是否必须进行新一轮的改革。
鉴于此,本文拟探究AIGC时代高等教育的学术剽窃现象及我国的应对方案。
二、AIGC时代的学术剽窃及负面影响
(一)学术剽窃概念的历史演进
唐代柳宗元在《辩文子》中提到剽窃,“其浑而类者少,窃取他书以合之者多,凡孟管辈数家,皆见剽窃”,其意为窃取他人作品并视作己出。韩愈的《南阳樊绍述墓志铭》中也有“惟古于词必己出,降而不能乃剽贼”的表述。英语剽窃(plagiarism)一词源于拉丁语“plagiarius”,本意为“窃取他人的奴隶或孩子”。罗马诗人马尔西亚(Martial)在公元1世纪创造该词以嘲讽同时代另一位诗人菲丹提纽斯(Fidentinus)窃取其诗句。早期的剽窃“曾引起过嘲笑,但却并非抨击”,也即借用和模仿他人的创作并非严重的失德事件。从古希腊、古罗马再到文艺复兴时期,一些作者对在先作品的思想、情节乃至表达的大量模仿和“改良”也不被当时的读者或同行视为不法行为。古人对剽窃行为的这种态度有多种原因:一是在交通和信息不发达的时代作者身份往往无法确定;二是当政府对出版审查很严格时,针对在先经典作品进行改良既是安全和便捷的创作方式,也是对经典作品的“致敬”;三是那个时代多将创造性理解为改良,从而广泛接受模仿行为。
对剽窃指控的增加与近代社会的技术、经济、政治和法律等因素密不可分。随着印刷术等传播技术在欧洲的出现和推广,书籍、版画等作品得以成为普通商品在市场流通。这迫使政府加强出版审查以明确出版者和作者的身份。文学财产权、浪漫主义作者观和版权法随之出现,确立并强化了作者对作品的权利。1710年英国作家迪福(Daniel Defoe)在呼吁政府立法保护作者权利时,就借用了罗马诗人马尔西亚(Martial)有关剽窃是“窃取他人孩子”的隐喻,提出“书是作者的财产,是其发明的孩子,是其大脑智慧的产儿”。在该背景下,18世纪初的英国诞生了世界上第一部近代版权法《安娜法》(Statute of Anne),宣告着文学财产保护的重点从出版商转向了作者。我国在20世纪末正式通过了《著作权法》,将剽窃行为定性为一种侵犯他人著作权的违法行为。
现代学术剽窃概念形成的更大推动力来自对作品所有权和归属充满热情的学术圈和教育界。国际学界将学术剽窃理解为“把他人的观点、方法、结果或话语据为己有,而没有给予他人适当的荣誉”,或者“使用他人的作品而‘漏失来源’(without attribution)”,且剽窃的对象不仅包括他人的表达,也覆盖了作品观点和方法等在版权法下因属于思想范畴而不予保护的客体。我国教育界也认可这种判断标准。教育部科学技术委员会学风建设委员会发布的《高等学校科学技术学术规范指南》(2017版)将学术剽窃定义为“行为人通过删节、补充等隐蔽手段将他人作品改头换面发表,且没有改变原有作品的实质性内容;或是窃取他人的创作(学术)思想或未发表成果作为自己的作品发表”。我国首个针对学术不端行为的行业标准《学术出版规范期刊学术不端行为界定》也逐一列举了7种不同的剽窃行为:观点剽窃、数据剽窃、图片和音视频剽窃、研究(实验)方法剽窃、文字表述剽窃、整体剽窃、他人未发表成果剽窃。综上,学术剽窃是将他人作品中的思想、观点、研究方法或表达据为己有而不归认来源。
(二)从互联网迈入AIGC时代的学术剽窃
高等教育的学术剽窃不同于市场经济活动中的抄袭侵权行为,是指接受高等教育的学生实施的学术剽窃行为,其发生在学生完成高校学习任务和考核评估的过程中;从行为主体和后果看,也有别于高校教职工的学术剽窃。在过去几十年间,随着计算机、互联网和专业数据库的出现,学生获取、复制作品的能力得到极大提升。过去需要花不少时间寻找、阅读并摘录的文献,现在能轻易获取,但学生剽窃行为也随之增多。美国一些研究表明,越来越多的大学生参与作弊,以致“剽窃之灾”成为“最热门的新犯罪”,引发“不断升级的学术剽窃之战”。杜克大学学术欺诈研究中心的调查发现,互联网助长学生的抄袭作弊行为:1999年接受调查的学生中有10%的人表示曾从网上抄袭,2001年则上升到41%。这段时期还出现了专门的反剽窃软件和“剽窃猎人”(plagiarism hunter)。例如,美国国立卫生研究院的科学家设计了一个用以识别剽窃的程序,并引发了美国历史学会对历史学家斯蒂芬·奥茨(Stephen B.Oates)的多次学术剽窃的调查。美国俄亥俄大学一名学生检查了该校二十年间的硕士论文,结果发现存在大量剽窃现象,引发了学术剽窃丑闻。近期美国学者的研究表明,学术剽窃行为从2004年到2014年呈下降趋势但2019年起又升温。
迈入AIGC时代,GAI正迅速进入教育领域。根据海外在线课程供应商Study.com针对1000名18岁以上学生的调查,每10个学生就有超过9个知道ChatGPT,超过89%的学生用ChatGPT做作业,48%的学生用ChatGPT完成测验,53%的学生用ChatGPT写论文,22%的学生用ChatGPT生成论文大纲。而在国内,和互联网时代不同,借助GAI实施的学术剽窃行为有更强的隐蔽性、专业性和定制化的特征。在ChatGPT等工具的帮助下,只要几十秒就能生成一篇结构完整、引注规范的学术论文初稿,学生只要稍加润色甚至直接提示机器进行润色,就可以轻松获得远超自己水准的“写作成果”。但学生在整个过程得到锻炼的仅是GAI提示技能和规避反剽窃软件(如Turnitin、GPTZero)的检测。在前文提到的北密歇根大学课程论文剽窃事件中,并不是教师通过检测手段判定学生使用了GAI,而是学生在教师追问下最终承认其行为。由于整个过程由学生控制,在缺乏准确检测技术的情况下,若学生不主动交代,教师几乎无法查明。更甚者,教师并非因学生作品质量差而起了疑心,恰恰相反,教师认为该作品是班上最好的论文,以“简洁的段落、恰当的例子和严谨的论据”探讨了罩袍禁令的道德性。鉴于使用GAI和雇佣枪手写作都有隐秘性、定制化和专业性的特征,且前者的风险和成本要低得多,可以预见,以“人工智能代笔”为表现形式的新型学术剽窃行为将大行其道。
综上可见,GAI的出现导致传统的学术剽窃与学术代笔现象出现异化、融合和升级,高等教育对学术不端行为的防范和规制注定是一项必须与时俱进的长期任务。
(三)对高等教育的负面影响
学术剽窃等不端行为对高等教育的负面影响是全方位的,GAI的出现将进一步放大这种负面影响。首先,滥用GAI完成学习任务将进一步挫伤学生学习的自主性,影响高校教学功能的正常发挥。高等教育区别于基础教育的主要特征之一就是学生学习的自主化。高校要求学生提交原创作品是为确保学生自主完成学校布置的任务从而真正提升能力。学生的学术成果本身并非高等教育的首要目标。相反,学生在创作过程获得的学术锻炼,在文献检索、归纳、思辨和运用中提升的学习技能才是目标所在。显然,滥用GAI将严重妨碍该目标的达成。因为学生会产生惰性,不再投入时间和精力进行自我学习,递交的作业也只是机器学习的结果,学习能力无法得到真正的提升。
其次,缺乏规制的GAI将严重破坏高校教学评估体系的公正公平。高校强调学生必须提交原创作品的另一个重要原因是需要确认学生的能力并对育人效果进行公正的评估。如果学生能够通过剽窃或者枪手代笔蒙混过关的话,学校就无法公正评估学生表现,其他学生也将遭受损害。
这种损害在GAI无法得到有效控制的情况下将被放大,因为部分学生可以借助技术获得相对其他学生的不正当竞争优势。如果高校就此一刀切禁止学生利用GAI但又缺乏有效监管,则有技术规避能力和强烈剽窃动机的学生将获得更高的竞争优势。即便所有学生都配备有GAI,也难以确保学业竞争秩序的平衡。利益驱动之下,总会有学生谋求更强的技术,正常的学业竞争遂转变为代笔工具的“军备竞赛”,教学评估的公正将难以维系。
再次,在技术普及但滥用的阴影下,高校、教师和学生之间容易互相猜疑,继而演变成高等教育的信任危机。由于GAI在利用成本和风险上远低于职业枪手,且隐蔽性和专业性又堪比后者,如果缺乏准确的检测手段,优秀作品的原创性很容易受质疑。即便有检测工具和学生创作过程的证据,可能仍无法获得信任,因为“人工智能也可以生成所有这些”。学生也可能随时遭遇学术剽窃的指控及惩罚。教育部发布的《高等学校预防与处理学术不端行为办法》(以下简称《办法》)第3条特别强调,“高等学校预防与处理学术不端行为应坚持预防为主、教育与惩戒结合的原则”。很显然,AIGC引发的信任危机无助于达成高等教育界提倡的从“如何阻止学生作弊”转变为“如何确保学生学习”的基本目标。
最后,利用GAI进行学术剽窃有违学术诚信,如果规制不力将损害高校立德树人的根本教育任务,助长社会各行业的不诚信行为。高等教育的目标是培养专业化的高层次人才,新时代大学生更肩负实现国家现代化发展的历史重担。为完成上述目标,高校育人应坚守学术诚信这一“必然要求”。放眼全球,在学习活动中诚实守信也是大学生应遵守的基本道德规范。如果大批高校学生可以借助GAI实施学术剽窃并最终获得优秀成绩的话,高校乃至社会所尊崇的诚信价值观将受到极大损害。
三、国内外高校的应对比较及分析
(一)国外高校不同模式的应对方案
为应对GAI的挑战,国外一些高校出台了针对性的措施。比较来看,主流做法包括全面禁止和有条件准许两种模式,后一模式的具体政策又有微妙差异(表1)。
表1 国外高校应对生成式人工智能的基本态度和具体政策
1.全面禁止模式:难以操作且效果堪忧
在GAI震动教育界的早期,部分海外高校为维护学术诚信,采取了全面禁止校园使用的措施。例如,2023年1月纽约市教育部宣布禁止全市教师和学生访问ChatGPT,并通过技术手段禁止学校网络和设备接入ChatGPT。同月,西澳州、新南威尔士州、昆士兰州等部分澳大利亚地方教育部门也宣布通过防火墙技术禁止师生访问和使用GAI。全面禁止模式本质上也是技术治理路径的一种,但这类方案过于简单粗暴,不仅操作上不可行,且实施效果堪忧。从可行性看,随着技术的进步,该模式无法持久。高校虽可监管和限制学校设备的访问,却无权监管学生个人设备。在好奇心和利益双重驱动下,学生必然会绕开高校的限制和监管,且作弊和抄袭的方式也日新月异。从效果看,高校全面阻止学生使用GAI虽在早期能够遏制部分学术剽窃行为,但长期是有害的。一方面,仅因为GAI可能被滥用就禁止技术的利用,实际是将技术放到了高等教育的对立面而忽视其正面效用。另一方面,当全面禁止模式存在漏洞时,势必出现大量隐秘的学术剽窃行为,进一步破坏高校教学评价系统的公正性。正因如此,纽约市教育部在重新审视其政策后于2023年5月解除了对ChatGPT的全面禁令,并在同年宣布组建人工智能政策实验室以确保高校正确利用该技术。澳大利亚教育部也宣布从2024年起允许境内所有学校使用GAI。4这些转变说明了有效的技术治理路径既不能规制不足,也不能规制过度,应在规制技术滥用的同时充分利用技术进步的红利。
2.有条件准许模式:两大分歧尚存
目前多数国家的高校都选择以开放态度拥抱GAI,但即便是同个国家的不同高校甚至同所大学的两所分校,其具体政策在内容设计和宽松程度上也可能存在分歧。首先,高校间在GAI的准许模式上存在一定分歧。大部分高校对使用GAI提出了“原则禁止、例外允许”的准许模式,学生原则上禁止提交含有AIGC的作业,教师也只有在需要实现特殊教学目标时才有一定的裁量权。这些高校往往对GAI的使用采取较为严格的态度。而有些高校则认为完全可以由教师自主决定或和学生商议后决定使用的细节,如不列颠哥伦比亚大学。有的学校采取了更加宽松的放权模式,如美国私立的莎拉劳伦斯学院仅给出了指示,完全放权给教师自主决定。其次,高校允许利用GAI的形式也存在一定分歧。一些高校原则上禁止GAI以任何形式参与学生的学习任务和评估考核,如加利福尼亚大学洛杉矶分校表示:“未经教师允许,不得提交由GAI以任何方式起草或编辑的作品。”另一些高校则持开放态度,认为使用GAI能进行语法纠正等常见辅助行为,如加利福尼亚大学伯克利分校法学院表示:“可使用类似谷歌等搜索引擎的方式进行研究、纠正语法和完成作业。”更激进的观点认为只要保证作品的原创性即可,如迪肯大学声明:“可将AIGC用作学习工具以获得灵感或指导,但最终提交的评估必须是自己的作品、创作和分析。”由此可见,许多高校对如何应对GAI仍有分歧。
(二)国内高校缺乏有效监管
与国外高校逐渐形成多元治理模式的情况不同,国内高等教育界似乎仍处在观望状态,至今仅有少量高校在学位论文的标准上提出所谓的“AIGC相似度”要求。这主要是因为目前国内高校学生使用国外GAI仍面临防火墙等门槛,能高效使用这类工具的学生数量较少,再加上利用GAI实施学术剽窃的隐秘性强,因此还没引起高校政策制定者的充分重视。但这种现状暗藏着种种危机。首先,国内年轻一代对新技术充满热情和好奇。根据GoogleTrends的数据,中国对ChatGPT一词的搜索位居全球第一,远超其他国家。在高校学业竞争“内卷”的背景下,很难想象国内高校学生会将GAI拒之门外。事实上,已有国内高校学生用ChatGPT写论文被老师发现的报道。其次,从技术治理角度看,防火墙设置类似“一刀切”治理策略,但学生总有各种各样的渠道。而随着国内技术的追赶和普及,国内高校学生获取这类工具的门槛将进一步降低。再次,目前国内高校的学术诚信政策并没有对学生使用GAI的行为加以定性,学生能否使用和使用方式等都处在无法可依的灰色地带。在缺乏明确规范指引的情况下,出现大量行为失序和学术诚信事件并非不可能。这就需要我们认真审视我国规制学术剽窃的现有资源,分析其应对AIGC时代学术剽窃的能力。
四、我国规制AIGC学术剽窃的现有资源及其不足
(一)学术剽窃检测技术之殇
目前国内外高校特别倚重查重等相似度检测技术来辅助认定和规范学术剽窃,但GAI的出现对这类传统检测技术及剽窃认定机制带来了巨大的挑战。目前提供学术剽窃检测服务的机构和工具众多,如海外的Turnitin、iThenticate和Scribbr以及国内的AMLC(中国知网)、WFSD(万方)和WPCS(维普)等。它们采取的检测包括基于字符、向量、语法、语义以及篇章结构的方法等。以中国知网为例,其采用了模糊算法进行认定,条件为文章每个段落超过5%的内容相似,或者文章任何一处出现连续13个字雷同。但即便是这些发展多年的检测技术依然存在容易基于检测原理修改、数据库覆盖面不足和图表数据剽窃难以检测等问题,在面对AIGC时代的学术剽窃时就更捉襟见肘。因为传统检测技术的判断基点是文本相似性,而GAI作为参数过千亿的大型语言模型,其能力恰恰是表达形式的丰富多样。例如,在一组使用“万方数据文献相似性检测系统”对AIGC进行的检测实验中,由ChatGPT-4.0生成的摘要整体的相似度仅有6.19%,这已远远低于绝大部分学术期刊的要求,现有检测系统的无力可见一斑。而且,学生还可以便捷地提示机器进行同义替换、多种语言重述和不同风格改写,完美躲过传统检测技术。
面对这种新挑战,新检测技术也应运而生,但应用时同样面临困境,甚至有负面效果。在海外,Turnitin在2022年12月发布了新产品Turnitin Originality,宣称其具备检测人工智能写作的功能并将该功能纳入其教育产品。其他检测工具还有GPTZero和AI Content Detector等。在国内,中国知网在2023年9月上架了“AIGC检测功能”,其原理为:“以知网结构化、碎片化和知识元化的高质量文献大数据资源为基础,基于预训练大语言模型算法逻辑,结合‘知识增强AIGC检测技术’和若干检测算法,从语言模式和语义逻辑两条链路,用AI检测AIGC。”该技术在同年11月被引入知网旗下的腾云采编平台,支持检测投稿稿件中疑似人工智能生成内容,并提供AIGC检测报告,但尚未大规模应用在教育活动当中。前述检测技术又被称为分类检测器,其特征是在事后区分AIGC与人类自然文本。但该思路存在很大障碍,因为随着技术的进步,AIGC与人类自然文本会越来越近似,区分两者将变得异常困难,无论对人类还是这些分类工具。而且目前尚无足够稳定的分类检测器。连OpenAI也承认其开发的分类检测器AIclassifier对ChatGPT生成物检测的准确性不够并不得不下架。而在辨别是不是AIGC时,使用不可靠的分类检测器将带来远大于收益的风险,因为误判是令人担忧的事情,会给师生带来十分负面的影响。2023年5月,得克萨斯农工大学商学院一名教师使用ChatGPT错误评估了学生们的期末作业,影响到了学生的顺利毕业和取得学位,但最后部分学生提交撰写作业的时间戳证明了ChatGPT的判断是错误的。同月,一名剑桥高中生的作业被AIGC分类检测器认定部分内容由人工智能编写,尽管该学生为证明清白而向教师展示了完成作业所做的准备工作,但教师仍表示“人工智能也可以生成所有这些内容”。鉴于这些新型检测工具没有经过全面测试,前文提到的不列颠哥伦比亚大学就明令禁止教师使用人工智能检测功能,并特别强调不能将检测工具的判断结果作为指控和认定学术不端行为的唯一考量因素。可见,在判断学生学术剽窃时,如果高校只是简单依赖人工智能检测技术的话,很可能产生有失公允的结果。
(二)以传统概念定性AIGC利用行为之难
AIGC使用行为的混合性导致其难以被学术剽窃等传统概念所界定,是当前高校没有明确学生利用AIGC行为性质的另一原因。GAI加持下的学术剽窃行为具有鲜明的混合特性,不仅学生、机器的实质性贡献交融一起,而且训练语料中不同作品要素也混合在一起。在没有解释说明的情况下,很难区分AIGC和人类作者的原创内容。这种混合特性冲击了传统学术剽窃概念的核心要义即“将他人的思想或表达据为己有而不归认来源”。第一,从权利归属的规范层面来看,如果学校认为使用AIGC的学生窃取了他人的思想或表达而不归认来源的话,则必须明确AIGC的权利归属——究竟属于训练语料的原版权人、AIGC工具提供方抑或用户本身。但业界和学界对该问题尚未形成统一的意见。第二,从来源归认的操作层面看,虽然合适的引注是避免陷入学术剽窃风险的最佳手段,但如何引用AIGC也因其混合性而存在诸多问题。首先,学生是否需要对所有使用AIGC的行为进行标注以区分作业中自己独立完成的部分。其次,假如得标注,论文中属于AIGC部分的“适当的荣誉”应当归认给谁,是GAI还是训练语料的原始作者。再次,如果必须将荣誉归认给后者,学生是否具备这种来源引注的能力。有学者就指出,由于神经网络的算法黑箱问题,没人能确切知道某一段AIGC究竟用了谁的哪些内容。最后,学界对AIGC的引注也没形成统一标准,部分学术期刊明确拒绝将GAI列为合著者,这也说明学界对这类行为的本质仍有不同理解。
与此同时,将GAI加持下的学术剽窃行为涵摄在学术外包、枪手代笔等概念之下也存在障碍。如前所述,GAI在高校学术不端行为中发挥的作用越来越接近学术代笔或枪手,似乎可归入《办法》第27条第6项的“由他人代写”的情况。国外也有学者认为,按照当前的学术标准,学者或学生将AIGC作为自己作品的行为应当属于学术外包。但学生使用枪手代笔的本质是学生委托他人代为完成学术作业的“协议作弊”(Contract Cheating)行为,委托关系的双方达成有关写作服务等合作协议。相应地,被委托人必须是自然人或学术外包机构。相比之下,学生使用GAI时并不存在这类具体委托的对象。虽然AIGC并非直接由人类作者所创作,但大模型在训练时就大量使用到人类作品而可能引发版权争议,学生论文包含AIGC显然也存在剽窃隐患。例如,2022年有程序员在美国对GitHub等提起集体诉讼,诉称后者为开发自动编程助手Copilot违规使用了众多开源代码进行机器学习训练而侵犯版权。从2023年OpenAI卷入的版权侵权案来看,GpT-1和GpT-3的训练数据集都包含了数据惊人的书籍。
正是大量人类作品的“投喂”促成了ChatGPT的进化迭代,但其中也潜藏着版权侵权和剽窃的风险。
(三)我国现有法律规制AIGC学术剽窃之缺
我国版权法、教育法、学位法等法律也有惩罚学术剽窃的法律规范,但因各自的原因,目前难以发挥最佳的规范作用。从版权法的角度看,根据《著作权法》第52条,高校学生滥用GAI有可能构成“剽窃他人作品的”著作权侵权行为,必须“应当根据情况,承担停止侵害、消除影响、赔礼道歉、赔偿损失等民事责任”。研究表明,GAI有能力记住训练的内容,模型越大记住的训练样本就越多,而目前市面常见大模型约80.0%的输出呈现出一定程度的记忆,记忆最多的模型通常反馈更高质量的话语。因此,学生利用AIGC完全可能构成对版权内容的剽窃。但版权法受限于立法目的和规则对象,在规制高校学术剽窃方面有明显不足。首先,版权法立足于调整因作品产生的财产、人身权益关系,立德树人的目标并非其初衷。即便该法惩罚剽窃的行为,也是为了保护权利人的署名权、复制权等著作权。其次,版权法严格遵守思想表达二分法,且不保护已经落入公有领域的作品的著作财产权,因此并不追究剽窃他人学术思想、原创方法或公有领域作品等行为。最后,版权侵权指控的成立一般需要证明侵权作品与版权人作品的实质性相似和侵权人接触作品的可能性,但因AIGC的混合性和黑匣子的特征,版权人往往很难确定相关生成物来自其版权作品,要指认版权侵权存在一定难度。可见,高校学术诚信政策对师生提出了高于版权法的道德约束,版权法难以承担起规制学术剽窃的职能。
从教育法、学位法的角度看,虽然其目标与高校立德树人的教育宗旨一致,但在AIGC时代存在针对性不足、覆盖面不全的情况。我国《教育法》在2021年修订时,增设了针对“以作弊、剽窃、抄袭等欺诈行为或者其他不正当手段获得学位证书、学历证书或者其他学业证书的”行为及其法律责任的相关规定,但该草案最终未能被正式的《学位法》所吸收,甚为遗憾。国务院2023年8月28日提请十四届全国人大常委会审议的《学位法(草案)》也注意到了新技术带来的挑战,在第82条增设了“学位论文或者实践成果存在……人工智能代写等学术不端行为的”由学位授予单位撤销学位证书的规定,但该草案最终未能被正式的《学位法》所吸收,甚为遗憾。科技部监督司也在同年12月颁布了《负责任研究行为规范指引(2023)》(以下简称指引),对在科研活动中使用GAI的行为作出了规范。但上述规范覆盖面偏窄,且较为模糊,必须配套更加详细的规范指引才能发挥实践指导意义。首先,《教育法》和《学位法》只对学生学位论文不端行为作了规定,而指引只规范科学研究活动。虽然高校学生部分承担着科研任务,但上述规范都忽略了学生日常教学培养过程同样需要监管。高等教育的质量保障并不仅仅在学位授予环节或科研活动,如果缺乏日常教学管理规范,同样难以实现教育目标。相比之下,《办法》第27条的规定更有弹性,其列举的“剽窃、抄袭、侵占他人学术成果”和“买卖论文、由他人代写论文”的学术不端行为并不局限于毕业论文,其字面含义能包括课堂论文和其他学术成果。但学生使用GAI代笔的行为依然难以被“剽窃他人学术成果”以及“由他人代写”所涵摄。其次,即使采取了《学位法(草案)》的做法,虽然对“人工智能代写”学位论文的行为作出了规定,但没有清晰界定该行为的边界。在技术检测能力不足的情况下,过于严厉的惩罚机制可能迫使我国高校采取一刀切的做法,完全禁止GAI应用到学生的日常学习和学术论文的创作过程,我国学生也就无法享受到先进技术带来的学习红利。
综上,在AIGC时代的学术剽窃面前,我国现有的规制资源存在明显不足,不仅传统检测手段捉襟见肘,新生的事后分类检测技术难当大任,且无论高校的学术诚信政策抑或国家的最新立法都没能对学生利用AIGC的行为提供清晰的规范指引。我国高等教育的政策制定者应积极和及时地回应挑战,提出应对AIGC时代学术剽窃的方案设计。
五、我国高等教育应对挑战的方案设计
AIGC时代的学术剽窃归根结底是由新兴技术引发的社会问题,正如弗雷(Frey)在《技术陷阱》一书中所指出的:“从长远来看……人工智能也有与工业革命一样造福每个人的潜质,但它的未来取决于我们如何把握当下。”当下我国高等教育需要从多角度入手对AIGC引发的学术剽窃进行综合治理。
(一)技术治理先行
由技术革新引发的社会问题,首先应考虑技术治理路径,借助有效技术手段从内部化解。技术治理的破局点应在AIGC与人类创作物的区分上。目前高等教育的学术剽窃绝大部分以文本和图像形式出现,而GAI生成能力又以文本和图像最强,分辨最为困难,造成的学术剽窃风险也最大。从技术治理路径看,目前主流技术路线有两种:一是前文提到的开发AIGC的事后分类检测工具,二是将水印融入AIGC生成过程的事先技术。由于前者存在难以克服的障碍,后一技术路线已经成为学界追捧的话题。事实上,事先数字水印技术并非新事物,其在图像领域已非常成熟并广泛用于区分电脑生成的图片和画家作品。随着GAI的崛起,该技术在文本领域的应用也开始受到重视。2023年7月,一篇有关事先数字水印技术的论文一举夺得计算机领域最重要会议之一“国际机器学习大会”(ICML)的杰出论文奖,且“可能对业界产生重大的影响”。与事后分类方法不同,新的事先数字水印技术充分利用了GAI的高性能,以技术手段将水印添加过程融入内容生成中,具有完整性(水印仍保留原始文本的分布)、隐蔽性(在没有关键密钥的情况下无法被外部检测到)以及鲁棒性(难以在小幅度更换单词和改写的情况下清除水印)等一系列能有效识别合成文本的特点。还有学者研究出了可携带更多信息的多位水印技术,可追踪生成内容的用户,这将使GAI工具提供商可以和执法机关合作,更准确识别、预防和规制技术滥用行为。从技术发展趋势看,事先数字水印技术在某种程度上已得到了计算机学界的认可,拥有非常广阔的前景。
当然,判断某段文字表达必然或大概率包含水印技术的技术原理是否成熟,多长幅度的文本才能发挥这类技术的功能,文本类生成物的表达质量是否会因为这类技术而受到影响,以及该技术的出错概率和纠错机制等问题,在技术层面和制度层面仍需要进一步研究。但如果事先数字水印技术真能发挥有效的识别功能,那么当学生提交的作业含有AIGC水印时,学术剽窃行为就可能被发现。这将倒逼学生正确对待GAI,仅将其作为提高学习效率的辅助工具而不是获得不公平竞争优势的“代笔”。多年前曾有学者认为,“互联网上有数十亿篇文章,教师很难确定学生可以从哪里获取这些材料”。但这些问题随着查重技术的出现而得到缓解。类似地,如果所有GAI都能事先配置有效的数字水印技术,那么AIGC时代高等教育的学术剽窃问题也能得到缓解。
(二)平台治理和政府监管的齐头并进
在规制AIGC时代的学术剽窃问题上,平台治理和政府监管都绝不应该缺位。首先,从收益与责任相匹配的角度,提供AIGC的平台有义务配合技术治理路径的推进。福柯在《规训与惩戒》中指出,知识是权力产生和掌握的重要手段。在海量数据和超强算力的支撑下,互联网平台已成为权威知识的新来源并获得巨大利益。GAI创造的知识具备同样的权威性并可为其平台争取到更多权力,因此平台在享受巨大收益时也应承担相应的义务。特别在AIGC学术剽窃可能影响社会教育公平时,平台有责任积极配合社会治理,而不应主张技术中立等特殊豁免。平台应该积极引入最新的技术治理手段,配合我国高等教育行业规制GAI的滥用行为。
根据我国2023年7月10日公布的《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)第4条、第9条和第12条的规定,在我国提供GAI服务的,“应当遵守法律、行政法规,尊重社会公德和伦理道德”,并“尊重知识产权”和“他人合法权益”;GAI提供者应“依法承担网络信息内容生产者责任”,且有义务按规定“对图片、视频等生成内容进行标识”。可见,作为信息内容生产者责任,GAI平台在我国难以主张技术避风港的责任豁免,应积极配合技术治理。
其次,从落实技术治理的角度,政府应当对GAI工具提供商设置准入和运营的监管,要求配置合格技术措施的GAI才可投入使用。这既需要建立相应的技术标准,在提供大模型之前将水印加密等标识技术内嵌进模型,也需要一套事前备案和事后审查机制。《暂行办法》也特别明确了政府对GAI的监管责任,其第16条要求“网信、发展改革、教育、科技、工业和信息化、公安、广播电视、新闻出版等部门,依据各自职责依法加强对生成式人工智能服务的管理”,并针对GAI的技术特点及其在有关行业和领域的服务应用,“完善与创新发展相适应的科学监管方式,制定相应的分类分级监管规则或者指引”。这为我国政府采取技术手段规制GAI滥用提供了法律依据。
再次,从平衡技术创新和抑制技术滥用的角度,政府监管应采取谦抑的立场。事实上,GAI仍处于高速发展的初期,无论产品形态、下游应用或产业格局都不明朗,因此技术治理的介入时机至关重要。GAI具有巨大的潜力,可以给我国高等教育带来明显好处,我国在设计监管方案时,绝不能采取一刀切的禁止模式。习近平总书记强调:“中国高度重视人工智能对教育的深刻影响,积极推动人工智能和教育深度融合,促进教育变革创新,充分发挥人工智能优势,加快发展伴随每个人一生的教育、平等面向每个人的教育、适合每个人的教育、更加开放灵活的教育。”在全球人工智能技术竞赛的背景下,太急切和严厉的监管会遏止我国人工智能技术和产业的发展,导致战略性错误。我国需要采取边发展边治理的谦抑政策立场,谨遵比例原则,谨慎采取监管措施。例如,尽管目前我国行政规章将所有GAI提供者都定性为网络信息内容生产者,但随着产业的发展和技术措施的升级,也不应否定某些类型的GAI提供者可能发挥更接近网络信息服务提供者的作用。与此同时,考虑到推动平台采用数字水印等技术措施的能动性,还可以在某些领域试点技术避风港类型的平台责任制度。例如,平台可以在配置了政府监管部门要求的技术清单项目(白名单型技术避风港)或主动提交的自评估报告通过审核后(自评估型技术避风港)获得相应的责任豁免。这类制度设计有利于持续激励平台技术的创新,甚至可能产生溢出效应,促使数字水印等预防技术滥用的技术成为AIGC时代真正的数字基础技术,帮助GAI更好地服务高等教育。
(三)高等教育行业内部的变革
我国高等教育界应首先改革教育理念。虽然GAI尚未在国内广泛使用,也有一些不足,但已有撼动传统教育的巨大潜力,我国高等教育界应尽快提升技术视野和危机意识,加速高校教育观念的转变。现阶段我国高等教育理念仍较为朴素,大量考核仅针对知识的记忆、识别和简单运用,对学生创新能力的培养不足。而GAI可以使用海量数据训练并不断迭代进化,展现出极强的理解、推理和生成能力,低阶机械化脑力劳动被机器所替代是必然的趋势。我国高等教育应着重培养学生掌控机器并在机器辅助下进行跨学科知识组合和创造的能力。为此,高等教育界在理念上不应将GAI视为敌人,而应积极为学生创造便利的技术和制度环境,鼓励学生重视、学习和运用新技术,确保技术的进步转化为学生的个人发展。
我国高等教育应顺应数字时代高等教育变革的计划,积极将GAI融合到教学模式中。党的十九届四中全会强调,要“发挥网络教育和人工智能优势,创新教育和学习方式,加快发展面向每个人、适合每个人、更加开放灵活的教育体系”。为利用GAI在教育中的潜力,发挥其庞大知识库和优异推理能力的优势,应积极转变课堂教学形式和调整课堂教学内容。
在课堂形式上,应鼓励高校教师大胆使用GAI的智能助教功能,活跃课堂教学。在教学内容上,应根据不同学科的特点,依照新教育理念调整培养目标和教学方案,强调学科核心能力的培养、创造能力的提升和跨学科视野的开拓。需警惕的是,高等教育在积极拥抱新技术的同时,也要避免因技术资源配套不均衡而引发的教育不公。教育数字鸿沟一直以来都存在,在算力资源决定模型能力的当下,不公平地配套资源可能会扩大地区和人群的教育差距,引发新一轮的教育不公。最重要的是,教育治理的现代转型不应异化成技术至上主义,应坚持教育善治的基本面向。
再次,高等教育界应积极回应《学位法》等顶层设计的修改,有针对性地升级高校学术诚信政策及实施机制。如前所述,我国《学位法(草案)》即便未被正式的立法所采纳,但该做法仍有借鉴意义。该草案虽已要求对毕业论文写作的“人工智能代笔”行为进行规范,但该立法建议在规范对象和操作层面存在不足。在该背景下,高等教育界应顺时改革我国学术诚信政策。一方面,教育部应尽快修订《办法》以回应《学位法》的颁布和当前AIGC的困境,将GAI的利用和滥用规制纳入法治正轨,明确“人工智能代笔”的性质、内涵和边界,明确哪种利用行为构成“人工智能代笔”。笔者认为,应将学生使用AIGC而隐瞒来源的行为归入新型的学术不端行为。尽管AIGC的归属存在争议,但不应妨碍其“学术不端”的定性。而该行为是由传统的学术剽窃概念抑或枪手代笔概念所规范,归根到底只是 旧法和旧概念的适用问题,这个问题在新法和新概念即“人工智能代笔”出台之后将迎刃而解。另一方面,我国高校学术诚信政策应对学生能否利用GAI的重大问题作出明确表态。高校学术诚信政策是学校指导、监管师生学术诚信行为的基本准则,对学生行为起到直接的规范和指导作用,不能长时间保持沉默。综合所述,我国高校可借鉴目前域外大多数高校所采用的附条件准许使用模式,并在《学位法》及其配套规范和标准之下细化利用GAI的具体规则,明确使用AIGC的标准和惩戒的措施。
最后,高校在对学生利用GAI的行为进行指引和规范时,应以教学设计的引导为先,技术检测和惩罚机制在后。一方面,学校可根据学科特点对考核方式进行改革,例如适当提高口试、小组协作的分值比例,降低书面作业的占比。在学习任务与测试的要素设计上,嵌入GAI辅助的考量,确保学生利用机器提升自我能力。例如,日本函馆未来大学规定,因基础文科和外语科目的教育目标就是提高语言和写作能力,因此原则禁止学生在这些科目的作业中使用GAI或机器翻译。另一方面,学校应与GAI工具提供商积极合作,落实事先数字水印等检测技术,对特定范围的学生作业进行事后检测以实现威慑之效。一旦怀疑学生以人工智能代笔,应进入常规的学术诚信调查流程。虽然技术检测结果是有力的证据,但不能以此直接判定学生存在学术不端行为。校方应结合学生日常表现、学生的原创性证据、教师证言和面谈确认学生知识掌握程度等传统方式综合判断。校方还应及时告知指控的理由和依据,提供充分的救济途径,以透明、公正的方式落实高校学术诚信政策。
来源:上海市法学会一点号