AI大模型DeepSeek:技术突破与应用变革(PPT)

B站影视 韩国电影 2025-03-29 07:30 1

摘要:在当今数字化浪潮中,人工智能已成为推动各行业发展的核心引擎。大模型作为人工智能领域的前沿技术,正以其强大的性能和广泛的应用场景,重塑着科技与产业的格局。今天,让我们一同深入探索DeepSeek大模型,领略其技术魅力与变革力量。一、DeepSeek公司:新锐之秀

在当今数字化浪潮中,人工智能已成为推动各行业发展的核心引擎。大模型作为人工智能领域的前沿技术,正以其强大的性能和广泛的应用场景,重塑着科技与产业的格局。今天,让我们一同深入探索DeepSeek大模型,领略其技术魅力与变革力量。

一、DeepSeek公司:新锐之秀,崛起于量化巨头幻方量化旗下

DeepSeek是幻方量化于2023年5月推出的子公司,专注于大模型研发。幻方量化作为中国头部量化对冲基金,曾管理资金规模超160亿美元,年管理费收入超3亿美元,为DeepSeek提供了雄厚的资金与技术支撑。

二、技术突破:性能卓越,训练高效(一)DeepSeek-V3:对标GPT-4o,性能强劲

DeepSeek-V3于2024年12月26日推出,基于Transformer架构,采用混合专家(MoE)模型,拥有671B个参数,生成每个token时激活37B参数。其训练成本比Llama 405B低一个量级,且通过MLA多头潜在注意力机制、MTP多token预测、FP8混合精度训练、Dual Pipe流水线、MoE负载均衡等技术,显著提升了训练效率与模型性能,在多项评测中成绩斐然,与世界顶尖闭源模型GPT-4o及Claude-3.5-Sonnet平分秋色。

(二)DeepSeek-R1:推理能力卓越,开源领先

2025年1月20日推出的DeepSeek-R1,对标GPT-o1,迅速在海外市场崭露头角,美国下载排名从1月22日的201名飙升至1月27日登顶第一名,截止1月30日,在168个国家位居下载榜第一名。其R1-Zero版本通过大规模强化学习训练,无监督微调,展现出强大推理能力,但存在可读性差和语言混合挑战。R1版本则在强化学习前结合多阶段训练和少量冷启动数据,推理性能与OpenAI-o1-1217相当,成为综合效果最佳的开源模型。

(三)能力边界拓展:深度推理,场景多元

DeepSeek-V3和R1相较于700亿以下开源模型,在多项能力上显著提升,扩充了能力边界。R1引入深度推理能力,在代码、数学、复杂规划等方面表现突出,为新场景支持提供了可能。不同版本对比显示,R1在普通任务及深度推理场景下均表现优异,蒸馏版与满血版性能差距随参数量变化,140亿以上参数的R1蒸馏版深度推理效果显著强于V3满血版。

三、应用场景:多领域赋能,变革传统模式(一)政务热线:智能服务,高效便民

联通数智公司联合辽宁产互等打造政务热线大模型,已落地辽宁、北京等多省市12345项目,提升政务热线服务效率与质量。

(二)经济决策:数据驱动,精准施策

经济运行大模型落地北京发改委、广东政数局等多省市项目,助力经济领域数据查询及分析、报告撰写、经济领域知识问答等业务场景,打造“学文件、读数据、出观点、快呈现”的高效AI工具,赋能经济运行调度工作,人工智能辅助经济决策。

(三)公安智能化:视觉分析,提升办案效率

联通数智公司联合北京联通等打造元景公安大模型,在北京西城、安徽省厅等多省市视侦智能化升级项目试点应用,提供以特征搜特征的大模型视觉分析能力,解决小模型无法识别的复杂场景,利用以图搜图、以文搜图提升检索效率,服务平安城市、雪亮工程、平安乡村等场景。

(四)医疗智能:智慧应用,助力医疗升级

联通数智公司支撑广东产互/医疗军团打造多款智慧医疗应用,助力中山三院智能化升级,如大模型医疗应用服务平台、中山三院私域GPT应用。

(五)船舶设计:智能辅助,提高设计效率

联通数智公司、上海联通与中船海舟联合挂牌成立联合实验室,探索大模型落地中船海舟船舶设计等应用场景,针对2D船舶设计图纸中不同标尺参数,运用元景多模态大模型进行识别,精准输出设计参数信息,为设计师精准建模提供参考;面向不同船厂的设计规范、图纸中不同类型的线材,运用元景视觉大模型进行分割检测,提取船舶轮廓、不同船舱的设计要素,输出3D建模所需的信息要素,提高设计师看图建模的工作效率。

(六)装备运维:智能问答,优化运维管理

联通数智公司支撑装备军团和上海产互打造大模型应用,赋能大飞机装备运维,针对多模态装备文档做精准查询和智能问答,重点解决长文本、复杂表格、数字序列、OCR解析、网页资源解析、统计类问答等挑战并快速迭代,问答效果优于头部竞品,业界首创RAG中的富文本知识问答、来源出处定位、数据飞轮等独有能力。

(七)文博文创:创新应用,传播文化魅力

联通数智公司联合在线公司等团队打造元景文博文创大模型,助力国博、外文局等文物创新应用,基于大模型创作生成汉服、游戏、卡牌等数字文创产品,并实现自定义换脸,支持商业化互动内容与应用;通过文物元素属性创作,生成民族服饰,传播与创作中华文化;在生动呈现文化内容,创新文博场馆观展体验方面,凭借在大模型、数字人、虚拟空间建设等方面的核心优势,对中国国家博物馆古代中国展部分精品文物活化展示,以联通元景大模型实现国博数字人线上讲解和互动问答,生动呈现中华文明优秀成果。

四、行业影响:格局重塑,加速AI普及(一)技术门槛降低,千行百业加速融AI

DeepSeek作为现象级应用,对全社会开展了一次人工智能科普再教育,C端应用人人装、人人感受人工智能,政府、企业管理者认识到人工智能战略意义,由探索尝试升级为战略布局,市场进入爆发期。上线20日,日活超4000万,达到ChatGPT 74%,成为C端现象级应用,微信、钉钉等头部应用纷纷接入。截至2月15日,全国10省省委书记将人工智能作为新春第一会重点部署,B端大模型应用进一步加速。

(二)格局被打乱,AI竞争进入第二阶段

DeepSeek开源策略全面冲击基础模型商业模式,将大厂在C端、B端过去一年构建的技术优势拉回同一起跑线,市场竞争从比拼模型能力进入比拼应用、数据、工程化交付能力的第二阶段。C端AI应用市场格局重构,新入局者迎来机遇;B端客户全面评估DeepSeek影响,重新论证基础模型选型;国内登顶、全球仅次于GPT,月均活跃用户数跃居第一,全球全端DAU近1.2亿;纳米AI搜索(原360)将其核心模型换为DeepSeek,1月web端访问量登顶、APP端增速位列第2。

五、中美对比:差距缩小,竞争加剧(一)人才与技术:仍有差距

我国高端人才数量和密度与美国有明显差距,AI领域重大原创性成果数量也落后于美国。

(二)企业与市场:差距显著,潜力巨大

中美头部高科技企业市值差距显著,我国AI独角兽数量和估值落后于美国,但市场潜力巨大。

(三)GPU芯片:美国占据优势,国产芯片进步明显

美国企业在GPU芯片领域占据绝对优势,国产芯片近几年进步很快,但在性能、产能、软件适配和生态方面还有显著差距。

(四)头部大模型:中国缩小差距,平分秋色

在模型效果上,中国大大缩小了与美国的差距,呈现与美国平分秋色的格局。DeepSeek超越meta,成为效果最好的开源模型,阿里巴巴千问系列模型下载量超过meta的Llama系列。

六、挑战与局限:理性看待,优化前行(一)幻觉问题:一本正经地胡说八道

生成式语言模型在生成文本或回答问题时,可能产生与事实不符或逻辑错误的内容。目前的大模型结构和训练机制基于概率的生成模型,本质上没有理解自己所学习的内容;缺乏对真实世界的有效建模方式和全息感知能力;训练数据的局限性导致幻觉产生。用户应建立“大模型结果不一定可信”的认知,根据需要对模型输出进行验证,并通过大量使用加深对模型能力边界的理解。

(二)算力消耗大:训练与推理的挑战

大模型庞大的参数量、海量的训练数据以及训练时间的漫长,导致训练和推理阶段算力消耗巨大,实时性差,支持的并发低。用户需学会接受大模型的输出速度,效果越好的模型,速度可能越慢。

(三)知识实时更新能力差:难以跟上时代步伐

大模型参数量大,知识更新速度慢,无法实时将最新事件、社会动态、研究成果加入模型,轻量级的知识更新方法不能保证效果。联网搜索+检索增强生成(RAG)是缓解手段,但不属于模型更新范畴。对于时效性较强的问题,确保AI助手的联网搜索功能开启。

(四)偏见、隐私与安全:潜在风险不容忽视

大模型输出结果可能包含性别、种族、年龄、价值观、文化等偏见,核心原因是训练数据中包含了偏见信息。同时,大模型难以避免生成有害内容,安全评估与防范难度大,易受到有毒数据的攻击。用户在提问时应避免涉及政治敏感、黄赌毒、暴力、歧视等内容,以及国家机密或机构商业秘密,以防法律风险和信息泄露。

七、未来展望:技术迭代,应用拓展(一)技术持续创新,性能不断提升

随着人工智能技术的不断发展,大模型的性能将不断优化,训练成本进一步降低,为更广泛的应用提供可能。

(二)应用场景拓展,赋能更多行业

大模型将在更多领域发挥其价值,如教育、金融、交通等,助力各行业实现智能化升级,提升效率与质量。

(三)开源与合作,推动行业发展

DeepSeek等开源模型的成功,将激励更多企业投身开源大模型研发,促进技术交流与合作,推动人工智能行业整体发展。

(四)应对挑战,完善监管与规范

针对大模型的局限性与风险,行业将加强研究,完善监管与规范,确保大模型的健康、可持续发展。

总之,DeepSeek大模型以其卓越的技术性能和广泛的应用场景,为人工智能领域注入了新的活力与变革力量。在未来的征程中,DeepSeek将继续引领技术前沿,拓展应用边界,为各行业的发展提供强大动力,共同开创人工智能的美好未来。

以下为报告部分截图:

来源:大力财经

相关推荐