摘要:以GPT-4、Claude等为代表的生成式AI模型,凭借千亿级参数规模、多模态融合及复杂逻辑推理能力,推动全球科技竞争进入“智能密度”比拼的新阶段。在这一浪潮中,中国AI企业如DeepSeek等,正通过技术迭代与应用场景创新的双向突破,加速重构人机协作范式与产
以GPT-4、Claude等为代表的生成式AI模型,凭借千亿级参数规模、多模态融合及复杂逻辑推理能力,推动全球科技竞争进入“智能密度”比拼的新阶段。在这一浪潮中,中国AI企业如DeepSeek等,正通过技术迭代与应用场景创新的双向突破,加速重构人机协作范式与产业价值链条,其发展路径或将深刻定义未来十年人工智能驱动的社会图景。
当前,大模型技术已从实验室走向规模化落地,逐步渗透至医疗、金融、教育、制造等核心领域。以DeepSeek为例,其通过构建行业专属模型与低门槛工具生态,正在降低AI技术应用成本,推动“智能普惠化”从愿景走向实践——从自动化代码生成到精准药物设计,从实时多语言翻译到自动驾驶决策优化,大模型正成为新一轮生产力革命的“技术母体”。与此同时,算力瓶颈、数据隐私、伦理对齐等挑战亦同步凸显,倒逼企业探索更高效、可信、可持续的AI发展路径。
AI大模型行业研究背景
(一)人工智能的发展已到战略拐点
经过近七十年的发展,人工智能自出现至今其核心能力一直在提升,到如今已经覆盖感知、认知、决策、学习、执行、社会协作能力,未来还会向符合人类情感、伦理与道德观念的智能机器迈进。
发展到现在,人工智能的技术能力已经到了一个拐点,即从技术能力驱动向需求应用驱动转型的关键时期。随着技术能力的提升,技术进化引发经济进化,从旧范式抵达新范式。如今人工智能的发展已经处于从第三阶段向第四阶段过渡的时期。人工智能的能力成长历程已经足够长,到了寻找需求的战略拐点。
(二)AI大模型行业速览
AI大模型是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、数据集大小和训练用的计算量之间存在幂律关系;AI大模型基于注意力机制,通过在大规模、多元化的无标注数据集进行训练,具有较强泛化能力,应用在广泛的场景和任务。按输入数据类型,AI大模型分为语言大模型,视觉大模型、多模态大模型等;从应用领域角度分类,AI大模型分为通用大模型、行业大模型、垂直大模型。
(三)中国AI大模型产业发展加速进入商用阶段
1956—2006年,深度学习和神经网络技术的提出和发展,为AI大模型的出现奠定了技术基础,大模型技术萌芽开始出现;2006年后自然语言处理技术、Transformer架构的发展,为大模型预训练算法技术和架构奠定了基础;2018年OpenAI和Google分别发布GPT-1与BERT,预训练大模型成为自然语言处理领域的主流;2022年底,OpenAI推出ChatGPT引发全球大模型发展热潮,2023年中国国内大模型训练开始井喷,出现“百模大战”现象;2024年中国政策加大行业落地推动力度,商业发展加速。
2024年1-7月,中国央国企采购大模型项目数量已超过950个。截至2024年11月,中国获得备案的大模型数量达到309个,中国大模型开始在垂类行业众多场景落地。截至2024年底,中国大模型产品使用价格进一步下降,为大模型广泛商用落地提供了基础。
AI大模型产业发展现状
(一)大模型发展与应用结构
我国AI大模型需要依照《生成式人工智能管理暂行办法》进行备案,截止2024年11月,已有3批次共计309个大模型通过国家互联网信息办公室备案。从应用类型看,通用大模型占比28%,垂类大模型占比72%;从应用领域看,互联网行业、金融行业、医疗行业、教育行业、工业行业大模型占比均超过10%。
1、国产大模型降价为商业化应用奠定基础
当前AI大模型产品进化路线有两条,一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品;二是通过优化模型架构适应性和计算效率,获得更具性价比的产品,如70B参数的模型,通过优化架构和训练策略,可获得接近或超越更大规模模型的性能。随着大模型能力和性价比的提升,国产大模型厂商开始大幅降价,截止2024年底,我国典型AI大模型的价格下降至0.5元/百万Tokens以内,为大模型应用的广泛落地打下了基础。
2、国产大模型产业图谱
3、AI大模型商业化落地模式
AI大模型商业化落地:55%为定制化模式、40%~45%为API及订阅模式。当前我国AI大模型市场应用的商业化模式逐渐清晰:
定制化模式面向大型政企:大型企业AI大模型应用时,更倾向于定制化,并采用本地化部署模式;例如浦发银行最新招标的2024年大模型应用体系建设项目,采购定制化算力设备和大模型软件,且要求算力设备和大模型软件满足信创要求。当前,大模型技术和产品迭代迅速,定制化模式下,客户会要求大模型服务商定期迭代更新服务。
API及订阅模式适用于中小企业及机构:采用API及订阅模式采购大模型服务,具有节省资源、快速集成、实时更新和可扩展性强等优势,适用于中小型企业;如豆包大模型等采用API对外提供问答等服务。此外,企业用户调用API需要注意数据安全和隐私保护。
嵌入智能终端和APP中收取广告费的模式逐渐落地:随着大模型应用的普及,将大模型嵌入智能终端和APP中,向广告主收取广告费的模式,将成为大模型产品变现的重要方式,未来大模型应用将成为互联网广告提升和优化流量的重要抓手。2024年11月,苹果与百度达成合作,国行版iPhone接入百度最新的AI大模型Ernie4.0,iPhone将能够提供更精准、更智能的语音助手、图像识别和数据处理等功能,将拉开大模型规模化嵌入智能终端、收取广告费的序幕。
4、AI大模型应用落地路径
大模型应用需求落地一般分为四个阶段:(1)场景需求评估:评估企业当前的大模型技术、应用场景和能力,做好大模型应用落地的准备,包括技术能力评估、应用场景梳理、能力分析等。(2)部署能力建设:设计和构建符合战略规划和业务需求的大模型能力体系,包括大模型建设方案设计、系统研发和功能测试、数据与算法准备等。(3)大模型应用部署:将大模型部署到具体的业务场景中,提供定制化的智能解决方案,实现大模型的商业化应用,包括定制化优化与应用开发、效能评估与闭环管理、全生命周期管理等。(4)大模型运营管理:建立大模型运营管理体系,保障大模型的长效运行,并通过实时监测和反馈机制提升运营效率,包括实时监测与动态追踪、持续优化与管理体系完善等。
(二)AI大模型应用市场规模
根据第一新声智库研究,2022—2027年中国AI大模型应用市场规模复合增长率将达到148%,至2027年,AI大模型市场规模将达到1130亿,AI大模型行业达到盈利临界点。
(三)DeepSeek使AI大模型算法创新再次突破
DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+多轮强化学习的办法,在提高了模型准确性的同时,也显著降低了内存占用和计算开销。
DeepSeek-R1提供了一种低成本训练的方法,而不是说只能通过低成本来进行训练。
反而通过优化,DeepSeek-R1可能实现了算力与性能的近似线性关系。每增加一张GPU,模型推理能力可稳定提升,无需依赖复杂的外部监督机制。这一特性直接验证了“算力即性能”的Scaling Law,为AI芯片市场及AI Infra市场提供了明确的增量需求逻辑。
大模型算法核心三要素的创新循环:算力、数据、算法的三角创新体系,在动态循环之中再次进入算法创新阶段。2022年:算法创新为主,ChatGPT发布,引发Transformer架构的风潮迭起。2023年:数据创新为主,数据合成、数据标注等成为高质量数据集建设的热点方向。2024年:算力创新为主,算力迈向超万卡时代,算力运营商等产业新物种诞生。2025年:再次进入算法创新阶段。
大模型通用+行业场景不断解锁
(一)大模型未来发展驱动
当前大模型市场还处于产品供给驱动为主的阶段,预计未来3年,随着大模型应用被行业用户广泛接受并积极推动应用场景落地,中国大模型市场发展将进入以最终用户需求驱动为主的阶段。
(二)大模型应用场景及案例
AI大模型在ToB领域已广泛应用于互联网、金融、政务、工业、教育、消费等多个领域,行业用户通过引入AI大模型解决方案,优化业务流程、提升决策效率、创新服务模式,积极探索如何利用最新大模型技术推动企业数字化和智能化转型。
1、金融行业痛点及解决方案
(1)营销获客难:金融机构存在用户需求分散、获客成本高等痛点;
(2)风险管理体系效率低:金融机构在信用风险控制、贷中监控、反欺诈、贷后管理等领域面临很多难点,如在与黑灰产不断升级演变的攻击对抗中,提升机构全流程业务安全、基础安全、技术安全等;
(3)产品设计精准定位难:随着外资机构、新的金融公司、股份制银行的快速发展,金融机构对优质客户的竞争也愈发激烈,如何打造直击用户需求的金融产品,成为各家金融机构竞争的关键之一;
(4)全流程数字化转型成本高、周期长、难以快速形成收益:金融机构数字化转型,需要布局全流程数字化,局部数字化会造成无法和前后流程对接,而全流程数字化也面临成本高、建设周期长的痛点,难以快速形成收益。
2、医疗健康行业痛点及解决方案
(1)就医高峰期患者候诊时间长:疾病高发期,患者骤增,候诊时间长,患者就医感受差;
(2)检查和治疗效率低:医生为规避医疗风险,会选择通过检查甚至是多次检查来确认诊断结果,导致效率低下;患者在等待检查结果时间长,患者在拿到检查结果后,难以理解报告内容,依赖医生的解释等导致检测和治疗效率低;
(3)用药处方开具涉及信息众多:用药处方开具需综合评估关系到疾病表现出来的症状、患者年龄、患者生活的环境等超200个维度,医生很难从200多个维度来周密思考用药;
(4)中医领域医疗资源不足:中医领域面临名医少、传承断代、医疗资源不足,中医医生依赖经验及阅历,同时由于中医数据资料庞大、典籍丰富,中医培养难度高等挑战。
3、教育行业痛点及解决方案
(1)线上多渠道咨询接待效率不高:咨询来源官网、APP、小程序、热线电话等多个渠道,咨询科目众多,正式接待之前无法精准分流,服务效率低;
(2)服务数据分散难以集中管理和分析:部门间信息流通不畅,数据孤岛严重,数据统计分析困难,无法集中管理和分析;
(3)获客成本高:线上获客成本越来越高,售前获客线索留资率提升难;
(4)高峰期人工客服接待压力大:在特定的时间段内客户咨询和投诉的数量会显著增加,人工客服负荷加大等。
4、政务领域市场监督场景痛点及解决方案
(1)数据分散、统计困难:如大量案件材料难以统一管理和分析,传统的数据统计方法效率低,且难以进行直观、全面的分析等;
(2)知识库更新不及时:市场监管领域知识库需根据法律法规、政策变化和业务指南不断更新,当前缺乏统一的更新标准和规则,容易导致信息冗余、混乱或不一致;
(3)执法文书写作耗时长、易出错:首先人工编写文书耗时费力,且案件业务复杂、法规政策条款众多,信息易缺漏、错误,其次文书格式要求严格,业务人员撰写时易出现不规范的情况;
(4)咨询回复慢、投诉处理效率低:一方面法规政策多,人工回复慢,市民理解难;另一方面信息检索困难、查询结果不准确、回复效率低等问题,容易引发市民投诉。
5、零售消费行业痛点及解决方案
(1)客户洞察不足:数据收集受到限制,缺乏有效的工具来收集和分析客户数据;
(2)市场预测困难:传统方法难以准确预测市场趋势和消费者行为;
(3)客户体验不佳:服务个性化缺失,无法满足客户的多样化需求,购物流程烦琐,环节多,体验差;
(4)营销效率低下:营销策略缺乏创新,难以吸引和留住客户,且营销活动缺乏针对性;
(5)竞争压力大:市场变化快速,市场竞争日益激烈,许多零售商没有意识到数字化转型价值。
6、制造行业痛点及解决方案
(1)研发知识难以查找:研发资料存放零散,知识共享存在壁垒,难以查找,没有体系;
(2)业务骨干依赖度高:产品研发过度依赖几位核心技术人员,缺乏隐性经验挖掘,忽视了团队能力的提升,知识流失风险大;
(3)生产良品率难以提高:过往经验和案例总结不到位,质量问题得不到及时地解决,导致问题重复发生;
(4)营销与研发生产脱节:产品相关资料不全,营销人员赋能不够体系,导致营销业务开展受阻;
(5)知识缺少场景化应用:不能根据应用场景进行精准知识推送和嵌入、知识和业务两张皮;
(6)知识运营难以持续:缺乏科学的知识运营方法、缺乏相应数据支撑及智能工具,知识管理推进三分钟热度,难以持续。
AI大模型发展趋势及挑战
当前AI大模型技术发展呈现四大趋势:(1)Scaling Law面临挑战,大模型研究重点从预训练转向后训练;(2)算力平台和模型创新紧密耦合,提升大模型创新效率; (3)MoE架构开始广泛应用于推动模型性能和效率提升;(4)大模型工具链不断完善加速大模型应用研发与落地。
(一)市场应用趋势
融合应用软件、智能助手和AI Agent是AI大模型市场应用的三个主要方向,大模型商业化落地需要找到合适的产品方向。
1、融合应用软件
应用软件厂商将更专注于AI大模型应用场景的探索以及与现有应用的融合,未来大模型厂商将会承担绝大部分的底层算法开发优化工作,应用软件厂商则会更专注在应用场景,以及与现有AI大模型更深度的融合应用;例如美洽将大模型融入全渠道客服解决方案,并发布大模型客服机器人,大幅提升了产品性能,提高了终端用户的接受程度;
工具软件与AI的融合能够优化用户体验与生产效率,提升产品竞争力,带给用户“新奇感”,提升用户生产效率,由于短期接入大模型的试错成本较低,市场接受程度高,工具软件厂商对于AI大模型接入抱开放态度,AI大模型融合应用的功能或将成为工具软件的增量付费点。
2、智能助手
大语言模型提升了智能助手的自然语言理解、生成能力和多模态能力,通过执行各种任务,提升用户的生活和工作效率;秘塔、蓝凌软件、动悦信息等开发了基于大模型的知识助手,泛微、致远互联、蜜度等开发了基于大模型的办公助手等产品;
当前基于大模型的智能助手已经具备较丰富应用场景,例如天工AI,可用于包括写作、娱乐、PPT、图片生成、英文学习等应用场景;通义的应用场景包括写作、语音识别、升学、金融等;豆包在情感陪伴、职场办公、教育学习等场景中表现突出。
3、Agent
AI Agent作为一种满足企业智能化需求、打通业务场景的AI大模型产品化落地形态,可承接日益复杂的提质增效需求,帮助强化内外部协同效能;
多模态大模型能利用大量异构的数据资源提升应用的效率和能力上限,利好AI Agent发展。多模态大模型能提高智能体的工作效率,赋能单个智能体能完成更多复杂的任务,有效减少智能体数量和任务中的交互次数。智能体有望解决跨行业、跨领域的复杂问题和各类长尾场景;
目前,Agent研究开发已经包括多模态信息识别与理解技术以及群体智能技术,这将有望加速人工智能从感知向认知的转变。
(二)缺乏高质量数据集是大模型商业落地面临的关键挑战
AI大模型应用面临公开可用的高质量中文数据资源相对较少的挑战。当前,高质量数据集缺乏的主要原因包括:
(1)国内专业数据服务产业处于起步阶段,整体资源投入较少:当前数据存在规范性不足、质量不高、安全性存在隐患等问题;高质量数据集的产生要求投入大量资源对数据进行收集、清洗、标注、验证等工作;
(2)数据交易体系还未形成规范和标准:数据交易体系流通存在数据权属配置不清晰、交易体系薄弱、缺乏通用的数据定价规则、未形成统一的流通规则、数据安全治理和监管体系薄弱等问题;
(3)私域数据流通难:训练垂类大模型所需行业和场景数据需要更为专业的行业知识,涉及企业私域数据,出于隐私保护等原因,此部分数据获取较为困难。
万创投行简介
万创投行是中国科创领域实战派融资专家,成立9年来累计服务超650+家科技企业,助推30+企业登陆资本市场,完成股权融资1000+亿元,深度链接红杉、高瓴等430+家头部投资机构及45个地方政府产业基金。
首创“技术研判+资本运作+产业资源”融合模式,通过多维技术评估模型量化企业价值,累计提升客户估值200多亿元,Pre-IPO项目过会率达91%。自主研发的产投系统整合市场融资数据及产业资源,为企业提供战略支持,用数据和结果助推硬科技企业从实验室到资本市场的价值跨越。
来源:万创投行