大语言模型在心理学应用中的前沿探索:一项综合性综述(下)

B站影视 港台电影 2025-08-25 19:41 2

摘要:Ke, L., Tong, S., Cheng, P., & Peng, K. (2025). Exploring the frontiers of llms in psychological applications: A comprehensive rev

Ke, L., Tong, S., Cheng, P., & Peng, K. (2025). Exploring the frontiers of llms in psychological applications: A comprehensive review. Artificial Intelligence Review58(10), 305.https://doi.org/10.1007/s10462-025-11297-5

6 大语言模型作为心理学的研究工具

在第 2–5 节探讨了 LLMs 在认知与行为心理学中的理论基础与实践应用,并强调其在推动心理学研究方法发展中的作用之后,本节将重点关注 LLMs 在研究中最重要的应用之一:其在系统综述与元分析自动化与优化方面的潜力。这一部分凸显了 LLMs 作为基于认知与行为原理的工具,如何能够革新证据综合(evidence synthesis)过程,并为心理学家提供可操作的洞见。换句话说,尽管前文主要聚焦于 LLMs 作为心理学研究中客观性工具的作用,但本节将关注点转向心理学家自身的科研工作流程。与第 5 节中讨论的生产力提升类似,LLMs 也能够在心理学家工作的各个环节提升效率。具体而言,LLMs 作为科学研究工具,可以帮助心理学家完成从文献综述、假设生成、实验设计、实验被试、数据分析到促进学术交流的全链条任务(见表 5)。

表5.大语言模型(LLMs)作为心理学研究工具的应用

6.1 自动化文献综述和元分析

进行文献综述与元分析是一项复杂而繁重的工作,需要大量时间与专业知识(Michelson & Reuter, 2019)。《Nature》曾报道,研究人员已开始使用 GPT 作为科研助理来总结文献(Dis 等,2023)。在一项研究中,研究人员利用 GPT 完成了部分系统性文献综述任务(Qureshi 等,2023)。在另一项研究中,作者借助 GPT 撰写了一篇关于数字孪生在健康领域应用的文献综述,结果显示,在 LLMs 的帮助下,知识汇编与表达得到了加速,但其学术有效性仍需进一步验证(Aydın & Karaarslan, 2022)。此外,研究人员还专门训练 LLMs 以支持科学研究的实际需求(Taylor 等,2022),包括执行系统性文献综述的能力。

近期研究进一步强调了 LLMs 在支持元分析方面的高效性。例如,Luo 等(2024)证明,LLMs 可以对文献进行筛选、数据提取,并生成用于元分析的统计代码,在显著减少工作量的同时,保持了与人工整理相当的召回率。类似地,Tong 等(2024)使用 LLMs 从 43,312 篇心理学文章中提取因果对,通过自适应提示实现了 86.98% 的提取成功率。正如第 3 节所述,LLMs 在从大型文本数据集中提取因果关系方面表现出很强的能力,这凸显了其在简化系统综述与元分析的证据综合过程中的潜力。然而,尽管 LLMs 在整理定性数据与识别概念模式方面表现优异,但在提取元分析所需的精确数值数据时仍存在挑战。例如,虽然基于 LLM 的工具可以检索并总结结果指标,但在处理复杂图表或数据表时,人工验证仍然必不可少,以确保准确性。

总之,LLMs 可以加快文献综述与元分析的进程。研究人员可以利用此类模型系统性地回顾与整合现有研究,从而提高循证心理学的研究效率。

6.2 假设生成和实验设计

假设驱动型研究是科学活动的核心。LLMs 能够从科学文献中生成假设、基于数据进行推断,并通过解释来澄清结论(Banker 等,2024;Zheng 等,2023)。尽管 LLMs 具备成为“假设生成机器”的潜力,但其逻辑推理与数学推导能力仍需提升,以消除事实性错误、快速检验假设并从错误中学习(Y. J. Park 等,2024)。作为创新性工具,LLMs 在心理学实验中具有巨大应用潜力,尤其是其能够为实验设计提供基于文本的材料,从而优化研究流程并降低实验复杂性。研究人员可以利用此类模型轻松创建实验刺激、设计测试题目,甚至在受控环境中模拟交互环节(Aher, Arriaga, & Kalai, 2022;Akata 等,2023),从而在实验过程中实现高度的可控性与精确性。

总之,从假设生成到实验设计,LLMs 为心理学研究提供了功能强大且灵活多样的工具,能够帮助研究人员实现更精准、高效的科研目标。

6.3 大语言模型作为心理学实验的受试者

尽管大语言模型(LLMs)能够模拟某些人类行为和反应——这为检验有关人类行为的理论与假设提供了机会(Grossmann 等, 2023)——但关于 LLMs 是否可以作为心理学研究中人类被试的替代者仍存在争议。尽管研究者认识到仍有一些问题存在(例如偏差和训练数据不足),一些学者建议,LLMs 可以作为人类被试的替代方案,以节省时间和成本,并可应用于不适合人类参与的实验(Hutson, 2023)。还有研究者提出,根据其在特定研究主题、任务和样本等因素下的表现,在合适的情况下可以将 LLMs 作为研究被试的一种替代方法(Dillion 等, 2023)。然而,也有人认为,尽管 LLMs 可能会对科学研究产生重大影响,但它们不太可能以任何有意义的方式取代人类被试(Harding 等, 2023)。与此同时,一些关于将 LLMs 作为被试的研究表明,LLMs 的表现与人类相似(Orru 等, 2023;P. S. Park 等, 2024),这可能意味着 LLMs 在一定程度上有潜力取代人类被试。

总之,虽然 LLMs 能够模拟人类的判断,但其对人类思维的模拟仍然有限,因此在将其作为心理学被试时,其输出结果应谨慎验证和解读。

6.4 数据分析的工具

各种形式的人工智能(AI)早已被用于分析心理学数据,例如用于飞行员选拔的飞行数据分析(Ke 等, 2023)。机器学习算法能够促进大规模数据集的处理,识别原本可能被忽视的模式和相关性。然而,大语言模型(LLMs)将这一能力提升到了新的水平;它们能够以前所未有的规模高效分析海量文本数据,从而获得有关人类行为和情绪的洞察(Patel & Fan, 2023)。对于心理学研究而言,这意味着更快速且更全面的数据分析,从而产生更加可靠和细致的研究发现。LLMs 可以分析多种语言的文本数据,准确识别其中的心理结构(Rathje 等, 2023),并能基于社交媒体数据生成心理画像(Peters & Matz, 2023)。LLMs 还在医学领域展现出一定的能力,例如,它们能够针对特定的临床表现预测最优的神经影像学检查方式。然而,LLMs 仍无法超越经验丰富的神经放射科医生,这表明在医学应用中仍需持续改进(Nazario-Johnson 等, 2023)。这些研究结果表明,LLMs 在数据评估与分析方面具有巨大潜力。

6.5 促进学术交流

学术交流是学术研究的基石,涵盖了知识的创造、评估与传播过程。这包括撰写研究论文、开展同行评审,以及确保研究成果的透明与合伦理传播。在心理学领域,由于其理论框架和方法路径的多样性——从实验研究到质性研究——这一过程尤其复杂。该学科关注人类行为,并与技术产生交叉,因此对精确且合乎伦理的交流实践有着更高的要求。

有观点认为,当前的大语言模型(LLMs)尚不能完全取代人类写作,而只能回答问题并生成自然流畅且信息丰富的内容,但缺乏真正的智能——即基于先前所见词汇模式生成的文本(Stokel-Walker, 2022)。一项研究中,学生在写作时使用了 GPT 作为辅助工具。结果发现,使用 GPT 的实验组在写作质量、速度和真实性方面与对照组相似;作者认为,这可能是因为有经验的研究人员能够更好地引导 GPT 生成高质量的信息。相比之下,写作经验不足的学生发现 GPT 的表现不够理想(Bašić 等, 2023)。另一篇文章讨论了 GPT 在学术写作中的前景与潜在威胁,并强调在学术研究中使用 GPT 时应优先依赖经过同行评议的学术来源。同时,该文也指出了 GPT 在学术研究中的潜在优势,包括处理海量文本数据、自动生成摘要和研究问题(Dergaa 等, 2023)。此外,LLMs 还可在同行评审中发挥潜在作用(Van Dis 等, 2023)。在一项文本评估任务中,LLMs 的判断结果与人类专家保持一致(Chiang & Lee, 2023)。

总之,像 GPT 这样的大语言模型是心理学学术交流的有力工具,能够处理海量文本数据,并自动化完成原本需要人工进行的任务。它们可以用于扫描学术论文并提取关键信息,生成客观且无偏的摘要,并在社会心理学中提出研究问题(Banker 等, 2023;Tong 等, 2024)。然而,研究人员在使用它们时必须保持谨慎,因为它们也可能将虚假或有偏见的信息引入论文,从而导致无意的抄袭或概念的错误归属(Van Dis 等, 2023)。

7 挑战与未来方向

7.1 挑战与局限性

大语言模型(LLMs)在模拟复杂认知过程方面具有巨大潜力,为研究者提供了全新的工具,以探索人类认知与行为的机制,并在临床与咨询心理学、教育与发展心理学、社会与文化心理学等多个领域广泛应用。然而,LLM 的输出不应被误认为具备思维,而应视为基于概率建模的复杂模式匹配(Floridi & Chiriatti, 2020)。尽管 LLM 的表现令人印象深刻,但这与意识或真正的理解不同。对 LLM 能力的解读必须建立在对其局限性和运行机制本质的理解之上,而这些可能与人类认知存在根本差异。因此,必须在关注 LLM 在心理学研究潜力的同时,正视可能出现的技术与伦理挑战。

首先,尽管 LLM 的能力不断涌现(Wei 等, 2022),但从认知与行为心理学的角度,其内部工作机制仍是“黑箱”。例如,LLM 在需要形式语言能力(包括对特定语言规则与模式的掌握)的任务中表现优异,但在需要功能性语言能力(理解并在真实世界中使用语言所需的认知能力)的测试中却屡屡失利(Mahowald 等, 2023)。它们在类比推理与道德推理任务中表现出色,但在空间推理任务中表现不佳(Agrawal, 2023)。

其次,虽然 LLM 加速了人工智能在临床与咨询心理治疗中的应用,但也可能带来隐私与伦理问题(Graber-Stiehl, 2023)。例如,守门人、患者,甚至使用 GPT 评估自杀风险或辅助决策的心理健康专业人员,可能会收到低估风险的不准确评估(Elyoseph & Levkovich, 2023),或在临床决策中受到偏见影响,从而导致医疗不公平(Pal 等, 2023)。此外,在精神病学研究与实践中,LLM 的使用还可能带来潜在的偏差与隐私侵犯风险(Zhong 等, 2023)。

第三,LLM 在教育、发展以及社会与文化心理学等领域的应用同样面临挑战。在教育应用中,LLM 可能出现输出偏差与被滥用的风险(Kasneci 等, 2023)。有研究发现,GPT 生成的文本并不总是一致或逻辑自洽,有时甚至相互矛盾(Stojanov, 2023)。在社会与文化心理学中,LLM 展现出与人类相似的认知偏差(Talboy & Fuller, 2023)与文化偏差(Atari 等, 2023),并隐含更为负面的个性特征(X. Li 等, 2022)。Bender 等(2021)指出,LLM 的训练数据可能反映并延续社会偏见,这些偏见可能在研究环境中被进一步固化。

最后,LLM 作为科学研究的辅助工具也存在一定局限。例如在写作方面,当前的 LLM 尚不能完全替代人类,而是通过回答问题与生成自然流畅、信息丰富的内容来辅助,但并不具备真正的智能(Stokel-Walker, 2022)。尽管宏语言模型在作为实验被试时可以模拟人类判断,但它们对人类思维的“理解”仍有限(Dillion 等, 2023)。Van Dis 等(2023)指出,LLM 可能加速创新、缩短发表周期,并提升科研的多样性与公平性,但也可能降低研究的质量与透明度,并从根本上改变科学家作为研究者的自主性。

综上所述,LLM 在心理学研究中具备非凡能力,但同时也伴随偏差、伦理问题、数据安全、透明度以及技术能力等方面的挑战。研究人员在使用 LLM 时应充分认识到这些挑战,并在研究项目中采取负责任的应对措施。表 6 总结了 LLM 在心理学应用中的挑战与局限性。

表6.大语言模型(LLMs)在心理学应用中的挑战与局限

7.2 未来方向与新兴趋势

目前,大语言模型(LLMs)已被应用于心理学的不同领域,包括认知与行为心理学、临床与咨询心理学、教育与发展心理学,以及社会与文化心理学。随着 LLM 能力的不断提升,其在心理学中的潜在应用将持续发展。

首先,在认知与行为心理学领域,随着多模态 LLM 的出现(OpenAI, 2023),有可能将视觉、听觉信息与文本数据相结合,更好地理解和建模情绪、行为与心理状态,以促进认知研究。此外,神经影像数据可用于优化 LLM 的架构与参数,并与传统文本数据相融合,从而构建更为准确且符合生物学原理的人类语言与思维模型。

其次,在临床与咨询心理学领域,一方面,可以利用个人数据(如社交媒体发布内容、病历记录或可穿戴设备数据)来创建个性化的 LLM,从而更精准、更具针对性地洞察个体心理状态。同时,将人类临床与咨询专业知识的优势,与 LLM 的可扩展性和计算能力相结合,有望开发出新的诊断、治疗与干预工具。此外,在教育与发展心理学以及社会与文化心理学领域,构建具备伦理性的 LLM 至关重要,并需确保其设计与应用过程尊重隐私、合理且负责任地使用数据。

归根结底,LLM 是一项系统性工程,其未来发展离不开心理学、计算机科学、语言学等多个领域研究者的跨学科协作。对于心理学研究者而言,易于获取的开源 LLM 框架与工具或将成为未来科研工作的重要组成部分。表 7 总结了 LLM 在心理学应用中的未来发展方向与新兴趋势。

表 7. 大语言模型(LLMs)在心理学应用中的未来方向与新兴趋势

8 结论

随着人工智能技术的快速发展,尤其是大语言模型(LLMs)的不断进步,机器学习已能够识别人类语言并生成自然语言。这一发展不仅是心理学领域的技术突破,更为一系列潜在应用打开了大门。

首先,在认知与行为心理学领域,LLMs 在多种认知任务中表现优异。尽管在因果认知与规划方面仍存在一定局限,这些模型复兴了“联想”这一原理,展现出跨距离联想和复杂推理的能力。同时,将 LLMs 与认知模型相结合的能力,是心理学研究的一大优势,使得研究者能够对人类认知与行为加工机制展开新的探索。

其次,在临床与咨询心理学领域,LLMs 可用作心理健康的初步诊断工具。传统心理健康诊断依赖专业人员的经验以及与患者的直接交流,而 LLMs 可以通过分析个体的语言表达与文本内容,快速识别潜在的心理健康问题,如抑郁和焦虑。需要强调的是,这类诊断不能完全取代专业心理评估,但可作为一种有效的辅助手段,帮助心理学家更快了解患者的状况,或在基础心理健康干预中发挥作用。同时,个性化心理干预也是 LLMs 的重要应用方向之一。通过结合个体的健康数据与生活习惯信息,这些模型能够提供定制化的心理建议与干预方案。这种个性化路径有望显著提升心理干预的有效性。

第三,LLMs 在教育与发展心理学,以及社会与文化心理学领域也具有广阔的应用潜力。例如,LLMs 可以提供互动式、个性化的学习体验,或基于真实情境生成研究任务,从而提升学习动机并促进学习效果。此外,通过分析海量社交媒体数据,这些模型还能帮助研究者追踪与分析公众情绪变化,更好地理解社会心理动态。

最后,在心理学研究中,LLMs 能够显著提升研究效率。研究人员可以利用这些模型快速整理与分析大量文献,从而节省时间;它们还可辅助实验设计、数据分析,甚至推动学术交流,使心理学研究更高效、更精准。

综上所述,LLMs 在心理学中具有广阔的应用前景,包括科研支持、认知建模、个性化干预以及个性化学习等。它们还有潜力显著加深我们对人类交流、思维过程与行为的理解,从而推动更为全面的心智理论与认知科学的发展。然而,也必须正视相关的风险与挑战,确保遵守伦理规范,尤其是在涉及个人隐私与数据安全时。同时,我们应认识到,无论技术多么先进,LLMs 也只能在一定程度上替代人类专业人员的判断与经验。因此,这类模型应被视为辅助工具,而非一体化的解决方案。

(完结)

来源:彭凯平教授一点号1

相关推荐