摘要:百川智能聚焦医疗 ToB 业务,基础模型停训,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。知情人士透露,虽然还没走完离职流程,但陈炜鹏已经在筹备创业,项目为 AI Coding 方向。第一个讲出不再追求 AGI、经历大调整后的零
作者 | 唐小引
出品 | CSDN(ID:CSDNnews)
当我们还为 Scaling Law 是否终结摇摆不定时,大模型已经上演分化进行时。
北京时间 3 月 17 日,大模型六小虎其二同时传来消息:
百川智能聚焦医疗 ToB 业务,基础模型停训,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。知情人士透露,虽然还没走完离职流程,但陈炜鹏已经在筹备创业,项目为 AI Coding 方向。
第一个讲出不再追求 AGI、经历大调整后的零一万物,今天上新:正式发布了万智企业大模型一站式平台,并宣布可提供企业级 DeepSeek 部署定制解决方案。
零一万物 CEO 李开复这样说道:“后 DeepSeek 时代,产业大模型在加速落地,AI 需要市场,市场也需要 AI,从美国的 ChatGPT Moment 到中国的 DeepSeek Moment,零一万物决定做全面拥抱 DeepSeek 模型的第一个六小虎,用上我们大模型的经验和技术能力,打造万智这样一个平台,让 DeepSeek 在企业里面更可用,更有用,更好用。”
在 CSDN 对话栏目《万有引力》中,曾提到:“未来可能会出现两种发展路线:(1)少数顶级企业继续堆砌算力,追求极致的模型。(2)大多数企业则选择小模型路线,可能通过知识蒸馏将大模型的能力压缩到小模型中,使其变得越来越强大。最终,AI 的发展可能会沿着这两条路径分化。”
现在看来,很显然模型分化已见端倪。
当老板们都说要上 DeepSeek 时,零一万物的解法
DeepSeek R1 爆火之后,满血版、部署之声不绝于耳,许多公司迅速将原有模型替换,甚至将“上 DeepSeek”作为业务指标,成为领导层汇报的重要内容之一。
于是市面上出现了各种各样的私有化部署解决方案,除了基于原有 Infra 部署、云端 API 调用、云端部署这几个解决方案,均价数百万的生意——软硬一体机就应运而生,打包硬件与优化后的软件一起销售,以降低部署和运维的复杂度。
由此能够很明确地看出来,DeepSeek 在千行百业里的落地还是很成问题。李开复将这归纳为了 3 个难点:
1. 部署难
企业没有硬件资源,软硬件都要部署,一体机成为刚需;
企业有硬件资源,仍然需要手动部署软件;
企业信息保护,担心数据安全。
2. 应用难
不支持 FunctionCall、JSON Output 等,指令遵循有问题、执行垂类具体任务有障碍;
对接行业数据库、实时联网数据都有技术门槛,不容易实施;
搭建行业应用不易上手。
3. 定制难
通用开源基座模型不懂行业场景,“隔行如隔山”;
用继续预训练 CPT、监督学习 SFT 等进一步定制模型,但没有成熟方案;
缺乏垂直领域的蒸馏数据,多数企业欠缺高质量的数据工程能力。
所以零一万物的万智大模型一站式平台的核心,就是要解决企业部署 DeepSeek 难的问题,为企业规划了 DeepSeek 落地的“三步走”:
第一步:可用,快速实现私有化、安全部署,几小时就能搞定。
第二步:有用,针对行业场景把 DeepSeek 用起来。无论是联网搜索、Deep Research,或是与企业的数据库和各种企业级软件的对接,都能够提供快速的功能,还提供非常快速做出企业级应用的能力。
第三步:好用,行业定制怎么把模型调得更好,更适用于企业生产力场景,更了解行业,穿透企业的核心业务流程。
具体到产品能力上,就归结为三个方向:
安全部署:以一体机方案构建开箱即用的企业 AI 底座。
主要包括,(1)软硬集成,预装高性能 GPU(华为昇腾等),内置 DeepSeek 全系列模型;(2)本地部署,私有化数据隔离,安全不上云,支持本地化推理,能避免因公共云端波动而影响业务连续性;(3)解决方案控制台,以可视化界面支持模型定制、应用创建。
应用实践:一键生成企业专家 Agent
完成模型部署后,如何安全、稳定地将先进模型能力转化为企业生产力,成为企业必须面对的核心命题。而具备工具调用能力、自主执行任务的专家级 Agent,正是推动模型能力落地的关键。相较于近期如火如荼的 C 端通用 Agent,企业级 Agent 更专业、更稳定、更安全,更能满足企业垂直场景的需求。因此,零一万物着力于:
DeepSeek + 联网搜索:实时数据,赋能决策和业务流。
DeepSeek + 知识库 RAG:构建企业专属知识大脑。通过引入 Rewrite 和 Rerank 模型,大幅降低了 DeepSeek 等大模型的幻觉效应,使召回率提升 60%,准确率提升 30%。
DeepSeek + 智能体 Agent:智能体驱动业务自动化。让企业客户能够基于自身业务场景,通过简单的点击、拖拽等操作就能够一键生成企业级 Agent;而针对各自工作流中的核心环节,零一万物则是采用深度定制的方式为企业提供专属 Agent。
DeepSeek + Deep Research:经过多步推理,生产深度专业级报告。
最后是行业定制,给出基于 DeepSeek-R1 的成熟微调方案,企业能够在万智上基于自身企业数据库对 DeepSeek-R1 进行模型微调。
直面大模型 ToB 难题,零一万物明确放弃做超大模型
市面上 DeepSeek 部署的解决方案千千万,为什么零一万物要做这个?有什么优势可言?
对于万智这个平台,李开复与零一万物团队总结了「性能 X 性价比」的关键词,并且特别强调了“它所做的与坊间的系统集成商或一体机分销商能做的浅层服务有着本质区别”。他的回答可以归纳总结为:
首先是零一万物自身的能力:零一万物自己做大模型,所以对微调、对应数据库、做机器训练等都能够帮助厂商,这些大模型的知识很难由系统集成商和一体机提供商来提供。
相对大厂的优势:大厂主要业务还是云,而且定价比较昂贵。所以零一万物提供的跟大厂一样好的产品,但会深度的帮企业做私有化部署,而不是卖一个云的解决方案,定价也比大厂低。
开源精选:精选开源社区里最好的解决方案,帮助企业节省时间和金钱,而且可以立刻落地。
在去年零一万物爆出大调整之时,李开复讲到了“2025 是 AI-First 应用爆发年,也是大模型商业化的大考年”,今天他补充道:“未来的大模型的行业竞争将不再单指模型性能的比拼,更关乎从中台到应用的能力,即模型能否快速响应场景需求、基于中台构建行业应用。”
在此次万智发布之时,李开复也分享了他对于大模型 ToB 困境的思考:
“过去整个大模型行业 ToB 碰到挑战的原因,一方面是因为中国还没有经历所谓的 ChatGPT 时刻,模型赋能后企业能得到的价值也不见得足够大。另一方面,过去是模型厂商大幅砍价去争招标,最后厂商都赚不到很多钱。
今天的差别是,企业客户都觉醒了,有了 DeepSeek Moment 之后,很多企业对大模型赋能自身业务抱着很大的希望,也愿意在自己的公司去尝试接入,并且用在更核心的业务场景,所以我认为,未来会有更多的企业下决心拥抱大模型。
零一万物的管理层有些来自于创新工场,有些是成熟的创业者,也有大厂商业化团队的高管。我们能够看到,在不同行业,大模型将带来不同的价值,我们会最认可下面几种业务:
一、能快速利用大模型带来收入,帮你降本增效、创造价值。
二、愿意下决心用大模型改造自身核心业务的 CEO,是我们特别乐见的。透过我在行业的人脉,零一万物也接到了很多由上至下的模型部署订单,这样就不会重复招标,也能够最大程度上为企业客户提效。
今天我们花费时间精力所打造的产业模型,能够在很多领域快速落地,特别是在金融、制造、知识产权、游戏等垂直领域,并且在不同的领域,产业模型可以创造出独特的价值。在这个过程中,今天发布的万智企业大模型一站式平台能更进一步为企业降本增效,对于我们的打法也是如虎添翼。”
还有一个 One More Thing,在线上发布会的最后,零一万物 COO 黄蕙雯很明确地表示零一万物放弃做超大模型:“我们明确不会再做万亿以上超大参数的巨模型,因为我们做不起。所以今年对我们来说非常重要的,就是仰望星空,脚踏实地,AGI 终有一天会来到,我们也会伴随着行业一起去迎接 AGI 的来到,但我们现阶段最关注的是真正能把 AI 推到市场上,让市场不只歌颂 AI,而是真正能用上 AI,这是我们现阶段的战略选择。至于创业公司做基座模型还会不会有机会?需要有足够的技术能力,还必须要有充足的燃料,不能说没有机会,DeepSeek 也是一个创业公司,所以我们认为这还是各个公司自己的功课和抉择。”
来源:CSDN