摘要:生成式人工智能是指可以根据已训练的数据创造或生成新内容(如文本、图片、音频和视频等)的人工智能。随着 ChatGPT于2022年底问世,生成式人工智能已普遍应用于医学各领域。我国目前麻醉医生培训发展不均衡,传统带教模式下 学生难以获得系统的临床麻醉知识。将生成
周瑞豪,郝学超,朱涛
四川大学华西医院麻醉手术中心 四川成都 610041
通讯作者: 朱涛 xwtao.zhu@foxmail.com (86) 18980601552
大模型时代——生成式人工智能在麻醉教学应用的机遇与挑战
摘要
生成式人工智能是指可以根据已训练的数据创造或生成新内容(如文本、图片、音频和视频等)的人工智能。随着 ChatGPT于2022年底问世,生成式人工智能已普遍应用于医学各领域。我国目前麻醉医生培训发展不均衡,传统带教模式下 学生难以获得系统的临床麻醉知识。将生成式人工智能应用于教学模式的探索,可为麻醉教学提供创新的教学模式,进一步提升麻醉教学的质量及规范化。本文就生成式人工智能的定义及其在麻醉教学的应用与局限进行综述,旨在揭示其用于麻醉教学的重要意义,以期为麻醉教学模式探索提供参考。
目前,国内麻醉医生培训仍存在发展不均衡,特别是在质量及规范化两大方面[1]。麻醉科传统带教模式单一,带教老师的教学经验和知识储备等存在个体差异,学生难以系统、全面地掌握临床麻醉知识[2]。而2017年国务院发布的《新一代人工智能(AI)发展规划》(国发〔2017〕35号),将“AI教育体系”列为国家发展重点任务,标志着AI将成为中国教育发展的主导趋势。不容忽视的是,由于AI的快速推广应用,我国麻醉学的教育培养模式受到了较大的冲击与影响。
“人工智能(Artificial Intelligence,AI)”最初定义为“制造智能机器的科学和工程”[3]。但随着AI技术的发展和应用领域的扩展,AI的定义也逐渐产生争议。在医学教育领域,根据欧洲医学教育联盟(Association for Medical Education in Europe, AMEE)[4]指南,AI被定义为“计算机科学、数学、统计学和医学教育领域的交集”。按其模型,AI可以分为决策式AI和生成式 AI。随着计算机技术和算法的进步,尤其是机器学习和深度学习的兴起,生成式AI在各个领域被广泛应用,如医学、艺术、教育、金融等。在麻醉教学中,生成式人工智能的应用为探索新的教学模式提供了可能性,有助于进一步提升麻醉教学的质量和规范化。
本文就生成式人工智能的定义及其应用与局限性进行综述,旨在揭示生成式人工智能在麻醉教学的重要意义,为麻醉教学模式探索与改革提供参考。
1、生成式人工智能
1.1 生成式人工智能的定义
生成式人工智能(Generative Artificial Intelligence,GAI)也可以称为人工智能生成内容(Artificial Intelligence Generated Content,AIGC),是指可以根据已训练的数据创造或生成新内容(如文本、图片、音频和视频等)的人工智能 [5],其可以学习数据中的联合概率分布对已有的数据进行总结归纳,并使用深度学习等技术,创作模仿式或缝合式的内容[6]。模型是AI的底层逻辑,GAI工具建立在包括Tansformer模型、GPT(Generative Pre-trained)模型、Diffusion模型和Deepseek模型等AI模型上,例如大语言模型(Large Language Models, LLMs)可以提供GAI的文本生成部分。1.2 生成式人工智能的应用
在医学领域中,GAI的应用范围正在迅速上升,包括医学教育[5]、图像识别[7]、药物研发[8]、辅助诊断[9]等。同时,麻醉学科作为典型的数据密集型学科,为GAI的渗透和应用提供了极为有利的条件。GAI的能力可应用于多个层面,包括评估麻醉深度、构建预测模型、建立临床决策支持工具等[10]。例如,Afshar等[11]提出了一个新的深度学习模型可以根据EEG信号精确估计麻醉深度和Hwang等[12]开发了一种可解释的深度学习模型用于低血压的预测等。一些研究[13, 14]已经证明了GAI,如 ChatGPT等,具有处理大量医学文献和提供生成内容的能力,使其成为麻醉教学的宝贵资源 。通过利用GAI,医学教育工作者可以提供交互式和动态的学习体验,使学生能够访问最新的医学信息、学习复杂的概念以及参与模拟场景等。此外,GAI可以提高知识检索的效率,快速响应医学查询并支持循证决策。将GAI整合到麻醉学 教育中可以培养医学生自主学习能力、批判性思维和分析技能,为下一代麻醉医生提供尖端资源,并促进麻醉学领域的可持续发展。本文将从提高教学质量、优化学习策略和辅助论文撰写和科学研究三个方面进行详细论述。2.1 提高教学质量
在提高教学质量方面,GAI能够创建虚拟模拟场景,为学生提供安全的实践环境,帮助他们更好地掌握知识和技能。同时,GAI也可以作为虚拟助手,通过动态问答、实时反馈和教学资源生成等,增强课堂互动,提升学生的参与度和学习体验。
2.1.1 创建模拟场景
生成式人工智能在提高教学质量方面最显著的便是其能够创建逼真的临床模拟环境,为学生提供安全、可重复的练习环境。这不仅提高了教学的现实性,还弥补了标准化病人短缺的问题,有助于学生掌握关键的临床技能。Scherr等[15]研究了ChatGPT在模拟高级生命支持临床情景中的应用,发现其在早期临床教育中可以创建高度逼真的模拟场景,帮助学生练习临床决策技能。在这些情景中,学生可以独立进行诊断和治疗思维的形成,逐步提高临床实践能力,也可以在模拟环境中遇到不同的麻醉挑战,增强应对突发情况的能力。它不仅可以帮助医学生从临床前快速过渡到临床状态,还可以为实践临床技能提供 了一个安全可控的环境。同时,GAI也是解决标准化病人短缺问题的一种高效方式。Gray等[16]利用ChatGPT生成了2个虚拟标准化病人,由2名有经验的医生独立审查并衡量其虚拟标准化患者反应的真实性(214/268,80%)、适当性(233/ 268,87%)和实用性(169/ 268,63%)。GAI可能会提供可行的培训材料来源,以扩展虚拟患者计划。
此外,GAI也可以和虚拟现实相结合,虚拟现实系统的纳入有助于增加模拟的真实感和提高效用[17]。Ali M Fazlollahi等[18]开发了一种名为Virtual Operative Assistant(VOA)的AI辅导系统,该系统使用机器学习算法对学习者的表现进行分类,并在虚拟现实模拟中提供面向目标、基于指标的视听反馈,在70名医学生的随机临床试验中,发现VOA组的医学生学习模拟操作的性能得分显著高于讲师指导组和无反馈对照组,证明其有效提升了学生的模拟操作表现。Zhen等[19]利用虚拟现实 和触觉反馈技术对20名麻醉实习生完成了30次腰硬联合麻醉的虚拟穿刺培训课程,发现第10节课后,学生穿刺时间稳定在2.4分钟,同时超过一半的麻醉实习生(70%)认为该平台具有很强的重复性,提高了他们的解剖识别能力。通过AI的强大计算能力与VR的沉浸式环境,这种技术能够生成高度真实的模拟场景,包括复杂的解剖结构、动态的患者表现以及真实的临床操作体验。医学生可以在安全且可控的环境中反复练习,提高操作熟练度,同时减少实际临床操作中的风险。2.1.2 支持互动课堂
利用生成式AI创建互动式学习内容,例如翻转课堂和基于问题的学习(PBL),可以增强学生与教学内容的互动性。Neil Sardesai等[17]利用“Convai”平台创建一个虚拟患者模型,让15名实习麻醉医师回答患者关于肌间沟神经阻滞的问题,发现其 在直观和用户友好程度方面,该工具评分的中位数(四分位距)为9(7-10),在模拟患者反应和行为方面的准确性则为8(7- 10)。学生通过回答相关问题,发展临床推理能力,同时提升医患沟通技巧,从而更好地为实际工作做准备。2.2 优化学习策略
在优化学习策略方面,生成式人工智能通过高效的信息整合和总结,帮助学生快速获取知识,节省学习时间,聚焦关键内容的深入理解。它能够提供即时解答和个性化学习建议,培养学生的自主学习能力和解决问题的能力。
2.2.1 高效性知识获取
GAI强大的信息收集和总结能力可以提高学生知识检索的效率,简化学习过程,节省时间,让人们更好地专注于学习。例如,邬春兰[20]等在麻醉专科培训医护人员中应用人工智能专家系统,研究发现实施后医护人员的理论知识评分、实践操作知识评分等均显著高于实施前(P<0.05)。GAI提高学员理论知识和实践操作知识掌握度,对促进整体临床麻醉教学质ᰁ提升有积 极意义。同时,学生可以对其询问特定的医学问题,并迅速获得准确和个性化的答案,以帮助他们建立知识库。2.2.2 个性化学习支持
GAI能够根据学习者的知识水平和进度提供量身定制的学习计划和反馈。这种针对性的指导帮助学生在薄弱环节上得到强化,同时巩固已有知识。Sallam[21]等的系统评价指出,ChatGPT可以提供的个性化互动,实现强大的自学能力以及作为小组学习辅助工具。利用GAI进行形成性和总结性评价能够显著提高评估的个性化和效率。这种评估方式能够针对每个医学生的 优势和劣势进行深入分析,生成独特的、量身定制的评估报告。同时,GAI还能够帮助考试准备。它能够根据学生的学习进度和需求自动生成个性化的考试题目,帮助学生提前适应考试形式和题型。在答题过程中,生成式人工智能还能实时分析学生的表现,提供详细的错误分析和改进建议,优化复习策略,从而提升考试效果。在麻醉学领域,ChatGPT已经使用来自几个题库的问题进行了评估。Angel[22]等比较了Generative Pretrained Transformer-3(GPT-3)、Bard和Generative Pretrained Transformer-3 (GPT-4)在美国麻醉学委员会考试中的表现,发现GPT-4在基础和高级笔试中分别达到78%和80%的准确率,显著优于GPT-3和Bard,并且在口试中也展示了较强的推理和表达能力。Yoon[23]等比较了GAI在韩国麻醉学和疼痛医学住院医师培训考试中的表现,结果表明GPT-4有可能超过韩国麻醉科住院医师在韩语和英语考试问题上的正确答案率,从而达到及格标准。这些研究表明,GAI不仅具备麻醉相关的专业知识,还拥有较强的推理和语言能力,能够为医学生提供高效的考试准备支持,帮助他们更好地应对相关考试。2.3 辅助论文撰写和科学研究
GAI在辅助论文撰写和科学研究中正发挥着越来越重要的作用,成为研究人员提升效率、优化流程的得力工具。首先,在文献检索与整理方面,GAI能够快速分析海量文献,提取关键信息,帮助研究人员高效筛选相关研究。Li[24]等开发了一种创新的检索增强生成工具RefAI,其利用PubMed进行系统的文献检索,采用新颖的多变量算法进行文章推荐,并利用GPT-4 turbo进行总结,发现其能够推荐高质量的文献并生成结构良好的摘要,有可能满足生物医学专业人士在浏览和综合大ᰁ科学 文献方面的关键需求。其次,在论文攥写过程中,GAI可以辅助生成初稿、优化语言表达,并提供语法检查和结构建议,使学术写作更加流畅和专业[25]。此外,GAI还能在研究设计阶段提供实验方案优化建议,帮助选择合适的研究方法或统计模型,从而减少试错成本。Daniil[26]等提出了一个由GPT-4驱动的人工智能系统Coscientist,它通过整合由互联网和文档搜索、代码执行和实验自动化等工具支持的大型语言模型来自主设计、规划和执行复杂的实验。总之,生成式人工智能正在深刻改变科研工作的方式,但其应用仍需结合人类判断力和创造力,以确保研究的科学性和创新性。随着技术的不断进步,AI在科研领域的潜力将进一步释放,为学术研究带来更多可能性。3、生成式人工智能在麻醉教学中的局限性
生成式人工智能(GAI)是一把双刃剑,其在医学教育领域的应用虽然潜力巨大,但仍存在显著的风险和局限性,而这些风险和局限同样体现在麻醉教学过程中。主要包括以下几个方面:
3.1 “幻觉”问题
所谓“幻觉”,指的是GAI生成的内容看似合理,但实际上并不准确、不符合事实,甚至完全是虚构的。这种现象尤其是在需要高准确性和可靠性的医学领域可能带来严重后果。例如,Gao[27]等使用ChatGPT根据论文标题生成相应摘要,并通过剽窃检测器、AI检测器和盲法人工审稿人将这些摘要与原始摘要进行比较,发现在ChatGPT 生成的摘要中,68%被检测到(真阳性),14%的真实摘要因聊天机器人生成而丢失(假阳性)。在麻醉教学中,如果学生依赖这些不准确的信息进行学习和实践,可能会导致错误的知识和技能传递,影响实际的临床表现。3.2 知识库的局限性
生成式AI模型的知识库通常是基于训练数据的,这些数据可能并不包含最新的医学研究成果或最佳实践。例如,Akhter等[28]等在使用ChatGPT撰写病例报告时发现,该模型提供的引用和数据可能停留在较早的时间点,未能反映最新的医学进展。这种知识更新滞后的问题在医疗领域尤为重要,因为医学知识和最佳实践在不断发展和变化。3.3 伦理问题
GAI在医学教育中的应用面临几个重要的伦理问题[29]。首先,隐私和数据安全[30]是一个关键问题。使用GAI工具时,学生和教育工作者可能会无意中泄露个人信息或患者数据,这不仅违反隐私保护原则,还可能导致数据泄露和滥用。其次,版权问题[31]也是一个重要考虑点。GAI可能在训练过程中接触到受版权保护的材料,从而生成与这些材料相似的内容,这可能涉及版权侵权问题,并影响生成内容的合法性。同时,学术不诚信问题[32]也值得关注。由于GAI能够生成高质量的文本,学生可能利用这些工具撰写论文或完成作业,从而绕过学习过程,影响学术诚信。此外,GAI可能加剧现有的教育不平等。数字鸿沟使得资源匮乏地区的学生无法获得必要的技术支持和互联网接入,限制了他们对GAI的使用。其次,GAI的训练数据通常以主流语言和文化为主,可能忽视少数语言或文化背景学生的需求,导致教育内容的不公平分配。GAI算法也可能会无意中使现有偏见长期存在或产生新的偏见,从而导致不公平的加剧[33]。为了应对这些伦理问题,必须采取相应的措施,包括确保数据保护、遵守版权法规以及维护学术诚信。3.4 法规和规范的缺乏
虽然已有一些法规和指南对GAI的使用进行了规范,如欧盟通过的《人工智能法案》对生成式人工智能工具提出了新的透明度要求[34]。2023年8月,我国首个针对生成式人工智能产业的规范性政策《生成式人工智能服务管理暂行办法》正式施行[35],但这些法规尚未专门针对医学教育领域的GAI应用进行详细的指导。目前,缺乏统一的指南和规范来指导如何在医学教育中安全、有效地使用GAI。这可能导致不同教育机构和个体在使用GAI时存在差异,影响整体教育效果。4、展望
GAI作为一种新兴技术,在麻醉教学中正处于普及和应用的普遍趋势中。其在提高教学质量、优化学习策略和辅助论文撰 写和科学研究等方面的作用可以显著提升教学质量和学习效果。随着Deepseek等新一代国产推理大语言模型诞生,GAI在麻醉教学中的应用前景愈发广阔,包括开发智能模拟训练系统、构建个性化学习助手、提供实时临床决策支持、实现自动化评估与反馈等方向。然而,其局限性和风险也提示我们在推广GAI应用时需更加谨慎。在早期采用阶段中,以负责任和深思熟虑的方式驾驭GAI的开发、采用和实施至关重要,将与GAI相关的潜在机遇和局限性置于每一步的最前沿。我们必须共同努力,制定强有力的伦理框架,促进跨学科合作,促进透明度和问责制,并持续监测和评估GAI的影响。
参考文献
[1] 曾因明, 喻田, 邓小明, 等. 我国麻醉学教育现状与发展思考[J]. 国际麻醉学与复苏杂志, 2019,40(12): 1091-1093.
[2] 钱柳, 刘进. 人工智能在麻醉学科的前景与挑战[J]. 临床麻醉学杂志, 2021,37(6): 565-568.
[3] RAJARAMAN V. JohnMcCarthy — Father of artificial intelligence[J]. Resonance, 2014,19(3): 198-207.
[4] TOLSGAARD M G, PUSIC M V, SEBOK-SYER S S, et al. The fundamentals of Artificial Intelligence in medical education research: AMEE Guide No. 156[J]. Med Teach, 2023,45(6): 565-573.
[5] BOSCARDIN C K, GIN B, GOLDE P B, et al. ChatGPT and Generative Artificial Intelligence for Medical Education: Potential Impact and Opportunity[J]. Acad Med, 2023.
[6] 丁磊. 生成式人工智能[M]. 中信出版集团股份有限公司, 2023.
[7] HUANG J, NEILL L, WITTBRODT M, et al. Generative Artificial Intelligence for Chest Radiograph Interpretation in the Emergency Department[J]. JAMA Netw Open, 2023,6(10): e2336100.
[8] GRISONI F, HUISMAN B, BUTTON A L, et al. Combining generative artificial intelligence and on-chip synthesis for de novo drug design[J]. Sci Adv, 2021,7(24).
[9] KANJEE Z, CROWE B, RODMAN A. Accuracy of a Generative Artificial Intelligence Model in a Complex Diagnostic Challenge[J]. JAMA, 2023,330(1): 78-80.
[10] LI C, ZHOU R, CHEN G, et al. Knowledge mapping and research hotspots of artificial intelligence on ICU and Anesthesia: from a global bibliometric perspective[J]. Anesthesiology and Perioperative Science, 2023,1(4): 33.
[11] AFSHAR S, BOOSTANI R, SANEI S. A Combinatorial Deep Learning Structure for Precise Depth of Anesthesia Estimation From EEG Signals[J]. IEEE J Biomed Health Inform, 2021,25(9): 3408-3415. [12] HWANG E, PARK Y S, KIM J Y, et al. Intraoperative Hypotension Prediction Based on Features Automatically Generated Within an Interpretable Deep Learning Model[J]. IEEE Trans Neural Netw Learn Syst, 2024,35(10): 13887- 13901.
[13] GHOSH A, BIR A. Evaluating ChatGPT's Ability to Solve Higher-Order Questions on the Competency-Based Medical Education Curriculum in Medical Biochemistry[J]. Cureus, 2023,15(4): e37023.
[14] DHANVIJAY A, PINJAR M J, DHOKANE N, et al. Performance of Large Language Models (ChatGPT, Bing Search, and Google Bard) in Solving Case Vignettes in Physiology[J]. Cureus, 2023,15(8): e42972.
[15] SCHERR R, HALASEH F F, SPINA A, et al. ChatGPT Interactive Medical Simulations for Early Clinical Education: Case Study[J]. JMIR Med Educ, 2023,9: e49877.
[16] GRAY M, BAIRD A, SAWYER T, et al. Increasing Realism and Variety of Virtual Patient Dialogues for Prenatal Counseling Education Through a Novel Application of ChatGPT: Exploratory Observational Study[J]. JMIR Med Educ, 2024,10: e50705.
[17] SARDESAI N, RUSSO P, MARTIN J, et al. Utilizing generative conversational artificial intelligence to create simulated patient encounters: a pilot study for anaesthesia training[J]. Postgrad Med J, 2024,100(1182): 237-241.
[18] FAZLOLLAHI A M, BAKHAIDAR M, ALSAYEGH A, et al. Effect of Artificial Intelligence Tutoring vs Expert Instruction on Learning Simulated Surgical Skills Among Medical Students: A Randomized Clinical Trial[J]. JAMA Netw Open, 2022,5(2): e2149008.
[19] ZHENG T, XIE H, GAO F, et al. Research and application of a teaching platform for combined spinal-epidural anesthesia based on virtual reality and haptic feedback technology[J]. BMC Med Educ, 2023,23(1): 794.
[20] 邬春兰. 人工智能专家系统在医院麻醉教学中的应用[J]. 中医药管理杂志, 2021,29(17): 192-193.
[21] SALLAM M. ChatGPT Utility in Healthcare Education, Research, and Practice: Systematic Review on the Promising Perspectives and Valid Concerns[J]. Healthcare (Basel), 2023,11(6).
[22] ANGEL M C, RINEHART J B, CANNESSON M P, et al. Clinical Knowledge and Reasoning Abilities of AI Large Language Models in Anesthesiology: A Comparative Study on the American Board of Anesthesiology Examination[J]. Anesth Analg, 2024,139(2): 349-356. [23] YOON S H, OH S K, LIM B G, et al. Performance of ChatGPT in the In-Training Examination for Anesthesiology and Pain Medicine Residents in South Korea: Observational Study[J]. JMIR Med Educ, 2024,10: e56859.
[24] LI Y, ZHAO J, LI M, et al. RefAI: a GPT-powered retrieval-augmented generative tool for biomedical literature recommendation and summarization[J]. J Am Med Inform Assoc, 2024,31(9): 2030-2039.
[25] HUTSON M. Could AI help you to write your next paper?[J]. Nature, 2022,611(7934): 192-193.
[26] BOIKO D A, MACKNIGHT R, KLINE B, et al. Autonomous chemical research with large language models[J]. Nature, 2023,624(7992): 570-578.
[27] GAO C A, HOWARD F M, MARKOV N S, et al. Comparing scientific abstracts generated by ChatGPT to real abstracts with detectors and blinded human reviewers[J]. NPJ Digit Med, 2023,6(1): 75. [28] AKHTER H M, COOPER J S. Acute Pulmonary Edema After Hyperbaric Oxygen Treatment: A Case Report Written With ChatGPT Assistance[J]. Cureus, 2023,15(2): e34752.
[29] 罗旭飞,吕晗,史乾灵,等. 大语言模型在循证医学领域的应用[J]. 中国循证医学杂志, 2024,24(4): 373-377.
[30] MURDOCH B. Privacy and artificial intelligence: challenges for protecting health information in a new era[J]. BMC Med Ethics, 2021,22(1): 122.
[31] LUCCHI N. ChatGPT: A Case Study on Copyright Challenges for Generative AI Systems[J]. SSRN Electronic Journal, 2023.
[32] PREIKSAITIS C, ROSE C. Opportunities, Challenges, and Future Directions of Generative Artificial Intelligence in Medical Education: Scoping Review[J]. JMIR Med Educ, 2023,9: e48785.
[33] KNOPP M I, WARM E J, WEBER D, et al. AI-Enabled Medical Education: Threads of Change, Promising Futures, and Risky Realities Across Four Potential Future Worlds[J]. JMIR Med Educ, 2023,9: e50373.
[34] BOCKTING C L, van DIS E, van ROOIJ R, et al. Living guidelines for generative AI - why scientists must oversee its use[J]. Nature, 2023,622(7984): 693-696.
[35] 生成式人工智能服务管理暂行办法[M]. 中国法制出版社, 2023.
本文出自:CASA Bulletin of Anesthesiology 2025年第一期 授权刊发
未来已来
来源:新青年麻醉论坛