“人机共生” 打造更强竞争力——对话清博智能副总裁、创新院院长李祖希

B站影视 欧美电影 2025-03-26 17:13 2

摘要:今年初,由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室撰写的《DeepSeek 从入门到精通》等系列专业文档问世。该系列文档以通俗易懂的方式,全面介绍了 DeepSeek 的使用方法,并针对其如何赋能职场应用提出专业建议。

今年初,由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室撰写的《DeepSeek 从入门到精通》等系列专业文档问世。该系列文档以通俗易懂的方式,全面介绍了 DeepSeek 的使用方法,并针对其如何赋能职场应用提出专业建议。

借此机会,本刊记者采访到了清博智能副总裁、创新院院长李祖希,探讨 DeepSeek 的优势、开源情况、使用建议、数据隐私等方面的问题,以及职场人应如何更好地理解和应用它。

李祖希简介

清博智能副总裁、创新院院长 李祖希

清博智能副总裁、创新院院长,清华大学硕士,专注于元宇宙和人工智能技术研发及商业化应用,拥有多年虚拟现实 / 增强现实创业经验;从事人工智能前沿领域研发与研究超八年,操盘多个大数据和人工智能大型研发项目,曾为多个世界 500强企业提供服务。

深度思考:DeepSeek 核心优势

《中外企业文化》杂志(以下简称 “中外”):目前,越来越多的职场人尝试使用 DeepSeek 辅助工作。您作为人工智能应用研究人员使用感受如何?您认为 DeepSeek 最显著的优势体现在哪些方面?

李祖希:我感受最深刻的是它的深度思考能力。此前,国内模型大多缺乏深度思考能力,只有 ChatGPT 有类似的思考和推理能力,但它不会呈现思考过程,且思考响应时间较短,通常在5秒以内,深度思考效果相对有限。

近期技术发展呈现新态势,包括 DeepSeek - R1、GPT - 4o 以及 Claude - 3 等头部大模型相继推出 “深度研究模式”。这项改进主要体现在:一是引入显性推理路径可视化机制;二是将运算时长扩展至 120 秒量级;三是采用蒙特卡洛树搜索等强化学习框架。值得注意的是,在DeepSeek 架构问世前,即便迭代至 GPT - 4 版本,模型逻辑推演能力的提升主要依赖参数规模扩张,而非根本性的算法创新。

相比之下,DeepSeek 思考深度更强,对于一个小问题,往往会有上千字的思考过程,并将其呈现出来,这使得思考结论也更出色。其一,它的框架完整。其二,论据补充丰富,比如会运用数据、第三方观点和信息等。若同步开启联网搜索功能,信息补充会更全面。其三,它更擅长专业术语、专业概念以及中文表达,而 ChatGPT 虽然整体能力较强,但中文部分表现欠佳 。

中外:确实,我们看到很多人让它写命题作文,写出的文言文颇具水准,还有写诗、分析五行占卜算命等,表现都不错。

李祖希:是的,DeepSeek在表达深度、专业性以及贴合中国文化方面都表现出色。

此外,其开源模式也至关重要。目前市场上的机构和政府部门都希望进行部署。部署完成后,先进行体验以确保能用,未来还期望在其基座上开发智能体助手,进行微调并建立相关知识库。因此,自主化训练是其真正的独特价值。

中国市场急需一款开源模型,只有开源才能为各行业所用,激发应用创新。随着用户规模扩大,各类云厂商也会投入资金支持,算力资源也会向其倾斜。目前,DeepSeek 依靠英伟达进行训练,尚未完成对国产CPU的适配。若能完成对华为等设备的适配,真正的中国闭环生态将得以形成。开源实际上是一种重要的竞争策略。

开源之思:理解与辨析

中外:关于开源问题,目前有一些行业内人士质疑DeepSeek是否真正开源。我们该如何理解它的开源程度?究竟什么才是真正的开源?

李祖希:可以打个比方,DeepSeek 的开源类似我们玩的乐高玩具,用户能够自主调整部分模块,实现形态变化。然而,其核心部分就如同发动机,背后细节优化并未真正开源,我们无法看到其中奥秘。

中外:这有点类似 “黑盒子” 的概念?

李祖希:对,这是有意为之的 “黑盒”。DeepSeek 的优势在于算法优化,能够以相对较低的算力,高性价比地完成出色的训练成果。而这种优化模型和模式并未对外公开,这是其开源中的一种权衡。

中外:有人评论它开源不彻底,比如训练数据和框架尚未公开,这能否说明它开源不彻底?

李祖希:确实如此,它并非百分之百开源。以往很多开源项目较为彻底,但公司通常会保留最强的模型,这是常见现象。对于用户而言,现有开源程度基本够用,但专业人士可能期望更多。

高效应用:技巧与要点

中外:现在许多职场人开始尝试使用 DeepSeek,但并非每个人都能熟练、恰当地运用。在向 AI 表达需求、描述提示语方面,您有哪些注意事项或学习建议?

李祖希:首先,有一些通用的提示词技巧。其一,赋予 AI 特定身份,比如让它扮演股票分析师或广告创意人员等,这样它的表现会更聚焦;其二,给它设定可实现的清晰目标,目标描述得越准确,它完成得越好;其三,可以提供一些参考资料,这些资料能成为它思考的起点;其四,对于较复杂的任务,不要期望它一步到位,可以让它逐步优化细节,分段展开,最后合并。而且要及时指出上一次的问题并给予引导,形成一个小闭环,这个闭环使用得越频繁,输出质量就越高。这些技巧适用于其他模型。

针对 DeepSeek 的 R1 版本,它有自身特点。作为深度模型,如果指导过于细致,它可能表现不佳。对于一些需要发散思维、创意性较强的开放式命题,它的效果明显优于其他模型。比如写个请假条,其他 AI 可能表现更好;但对于需要创意和深度思考的任务,R1 更具优势。不同任务对模型存在一定的适配度。

数据安全:隐私保护与风险认知

中外:近期微信宣布接入了 R1,有用户担心它会侵入个人数据。在实际使用 DeepSeek 时,普通用户应该注意哪些数据隐私问题?

李祖希:理论上来说,使用 AI 都存在数据安全风险。在一对一与 AI 聊天时,它理论上能知晓用户意图。在微信中使用 DeepSeek,与在微信搜索类似,微信后台会储存相关数据。与普通搜索引擎不同的是,对大模型输入信息属于深度记忆,且隐私数据难以删除。这与其他应用类似,只是信息外露程度有差异。

人机共生:应对变革新路径

中外:继 Sora 之后,DeepSeek 再次给我们带来巨大震撼。职场人不免担心自己所处的职业甚至行业未来会被 AI 替代,比如媒体从业者就感到了巨大压力。您觉得哪些类型的岗位被 AI 替代的可能性比较高?我们又能从哪些方面更好地利用 DeepSeek 这样的 AI 工具来助力工作?

李祖希:一方面,AI 的核心在于算法,我们也要注重磨练自己的算法能力,这里的算法指解决问题的思维和创造力等高级脑力劳动。另一方面,AI 追求多模态,人类也应如此。多模态意味着复合能力,涵盖思维、技能以及社交等综合能力。与 AI 的竞争力越强,被替代的可能性就越低。所以,追求多模态能力是我们努力的方向。

更重要的是要实现与 AI 的 “人机共生”。与 AI 对抗意义不大,若能与它协作,让工作成果超越 AI 单独完成的水平,也比其他人仅靠自身完成得更好,那么在职场中就更具竞争力。

目前,AI 对体力劳动和一些专业性工作的替代更为明显。比如,去年出现的专业研究蛋白质的模型,它并非文字推理模型,而是用于三维结构预测。人类研究 100 年才发现 20 万个蛋白质,而该模型上线四个星期就发现了6亿个,彻底颠覆了原来的科研模式。

很多这类垂直大模型,学习专业领域知识,基于人类经验,能快速推动未来元素发现、材料研发以及药物研究等工作,带来非线性的科学突破。通用大模型更多作为效率提升工具,尚未实现模式性突破,但像上述垂直模型已实现底层突破。

在实际工作中,无论研究素材和观点如何,人类应更多发挥引导和最终把关作用。可以先让 AI 拓展思维,比如将一个观点拓展为 1000 个,人类再与之讨论筛选出 100 个,最终确定 10 个,直至剩下一个最优观点。这是一个先由 AI 拓展多学科思路,最终由人类完成收敛的过程。

文/本刊记者 杜娟

编辑/莘然

本文刊载于《中外企业文化》2025年3期

来源:中外企业文化

相关推荐