摘要:年初,私募机构幻方量化旗下公司深度求索发布最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国OpenAI公司开发的GPT-o1的性能,引发全球人工智能圈的震荡。
川观新闻记者 文露敏 高杲
最近,人工智能火出了圈——四川一家人工智能企业公关负责人透露,有时一下午要接待3个参观团队。省内的各种交流研讨活动,举行了一轮又一轮。
这样的“热风暴”,是西湖边上的一只“蝴蝶”扇动翅膀带来的。
年初,私募机构幻方量化旗下公司深度求索发布最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国OpenAI公司开发的GPT-o1的性能,引发全球人工智能圈的震荡。
“蝴蝶”不止一只。连日来,从互联网空间到创业者餐桌边,围绕“杭州六小龙”展开的讨论不绝于耳,让人联想到十多年前那场关于互联网巨头“诞生地”的讨论——这次,声浪的中心仍是杭州。
为什么是杭州?未来的机会又在哪儿?“热风暴”中,需要跟进发展硬科技的“冷思考”。
具身科技研发的“天行者1号”人形机器人。具身科技供图
启示一:
通用大模型迎突破,垂直深耕还是出路吗?
“落地为王”,垂类细分赛道仍有机会
“大模型行业不再只有‘大力才能出奇迹’。”谈到DeepSeek带来的震动,成都明途科技有限公司首席技术官严帅告诉记者。
只要预训练阶段扩大训练参数规模,模型能力就能得到提升——这是很多大模型企业不断扩大算力规模的底层逻辑。
一定程度上,DeepSeek打破了这一“公式”:数据显示,DeepSeek-V3模型训练成本为557.6万美元,仅用2048块英伟达H800AI芯片,耗时不到两个月。与国际知名大模型相比,其成本大约低了一个数量级。
从在国家网信办完成备案的多个生成式人工智能服务看,四川企业多聚焦垂直大模型发展。以成都为例,对比北上深杭,成都缺乏类似华为、百度、科大讯飞等这样的龙头企业,受限于算力和训练数据,似乎不具备研发通用大模型的基础。
在多位业内人士看来,DeepSeek验证了通过框架和算法调整提高训练效率,实现“四两拨千斤”的可行性,也为四川的人工智能企业撕开了一道“口子”。
“DeepSeek是开源模型,基于这一性能优异的底座模型,将为企业创造更多创新机会,让更多开发者参与到应用和开发中来。”成都它思科技有限公司CEO赵贤宇很有信心。就在采访当天,他们自主研发的TasiChat大模型完成生成式人工智能服务备案,将正式对外提供服务,未来还计划结合DeepSeek在深度推理方面的优势,持续提升模型能力。
此外,中科曙光的AI解决方案完成了对DeepSeek模型的全版本覆盖、全尺寸适配和全功能优化,实现了“国产模型+国产算力+国产云服务”全产业链闭环;春节期间,天府绛溪实验室先进计算前沿研究中心完成了DeepSeek-V3/R1版本的落地部署和测试验证,并发布“DeepSeek协同创新计划”,将帮助四川企业实现DeepSeek的私有化部署。
“对于垂直大模型而言,过去的一大痛点,就是缺乏足够丰富和高质量的行业数据。”严帅认为,DeepSeek让小样本训练成为可能,能够帮助企业拓展过去由于数据限制没能突破的业务领域。
四川产业种类齐全,在文旅、农业等领域积累了大量数据,为垂直大模型的训练提供了充足的资源。采访中,多位受访对象认为,DeepSeek的出现将对行业竞争格局产生深远影响,垂类细分赛道仍是四川的机会所在,要以应用场景作为技术升级、产业发展和招引企业的重要要素进行系统设计。
“门槛的降低,将使行业发展更加注重数据和场景。”天府绛溪实验室先进计算前沿研究中心副主任陈惠分析,可以借鉴互联网电商的发展路径,从应用入手,利用高价值数据带动应用发展,同时应用场景创新反过来也能推动新技术迭代升级。
智慧途灵科技(成都)有限公司创始人徐梦曦也同意这个观点。此前他们自主开发了小规模语言模型(SLM),通过深度推理引擎优化等模型优化压缩技术,赋予其应对复杂任务处理及强大推理能力,能够针对特定领域进行精准微调。“通过场景驱动、数据喂养,SLM在移动设备、物联网设备等端侧AI具有广泛应用潜力,很有可能出现杀手级应用产品。”
但这并不意味着对算力的需求会减弱——正如工业革命时期,蒸汽机的发明降低了煤耗,但煤炭用量却上升了。
为此,杭州已提出要加快构建新型算力体系,进一步推动存量算力设施改造升级,集约化布局建设5个万卡智算集群,出台智能券专项政策,对人工智能企业使用算力、语料、模型成本提供一定比例补贴等。
陈惠表示,省内企业过往主要通过调用大厂API接口或向算力供应商购买的方式获取算力,但前者因缺乏自主微调蒸馏导致模型效果差,后者则成本高,不利于企业“轻装上阵”。四川在布局推进智算中心建设、探索建设省级算力统筹调度平台等方面,还要加紧加快。
启示二:
“破圈”成果频出,杭州的创新生态究竟是什么?
“播种”又“浇灌”,打造没有围墙的“热带雨林”
DeepSeek全球“破圈”,宇树科技四足机器人在全球市场份额占比近70%……“杭州六小龙”之外,杭州的创新密度,还可以由一个数据佐证:2024年,总面积约312平方千米的杭州市西湖区,就有8项科技成果获国家科学技术奖。
走出“六小龙”云深处科技的石虎山机器人创新基地也在西湖区,紧挨着浙江大学玉泉校区,是“环浙大人工智能产业带”的首个项目。集聚在这里的初创企业,大多数是“浙大系”。
从更高处俯瞰,更大范围的杭州城西科创大走廊,拥有国家实验室、2个大科学装置、5家浙江省实验室等高能级创新平台以及众多科技孵化器、科创园、特色小镇。
这便是杭州创新生态的注脚:在一个区域内,创新资源高浓度集聚、高频次交流,打造出没有围墙的“热带雨林”。
在成都信息工程大学副校长吴锡看来,成都并非没有这样的创新土壤——科教资源富集恰恰是四川科技的底气所在。“然而,以人工智能为例,在最关键的‘种子’上,我们的人才密度和高度都存在差距。”
脉脉人才智库发布的《2022人工智能顶尖人才数据图鉴》显示,杭州的人工智能人才数排名全国第二,超过了上海和深圳的总和,而成都则位列第七。
它思科技所在的成都高新西区IC设计产业园,与电子科技大学一路之隔。“招人确实是一个难题,很多学生毕业的首选并不是初创企业。”赵贤宇提到,他们很希望能够成为高校的实习就业基地,培养能留下的“自己人”。
除了培养,引进也很重要。在众多关于“为什么是杭州”的讨论中,“一码走杭城”的“人才码”出镜率很高,背后体现的是城市对人才的重视——这种重视,一定程度使得杭州人才吸引力排名稳居全国前列。
吴锡还提到另一个例子:深圳的南方科技大学。这所诞生于深圳本土的创新型高校,用10年左右的时间快速集聚了一批国际化高水平人才,弥补城市的人才短板。“在大力攻关前沿科技的今天,更要借鉴‘不拘一格降人才’的方式方法。”吴锡说。
有了种子,有了好的成果,还要浇灌成大树。其中绕不过的课题是“成果产业化”。严帅提到,目前和高校之间更多是项目课题上的合作。“没有具体落地场景,产业化路径不清晰,项目容易停摆。”
“以人工智能为例,先研发后转化的创新模式,难以适应产业发展技术快速迭代,应用场景复杂多变的需要。”四川省科学技术发展战略研究院科技与经济研究所副所长、副研究员杨光炜表示,要建立以企业主导的多元主体参与的研发模式,加强场景创新实现研发与转化的快速对接。
以之江实验室为例,其以重大科研任务为牵引,成立了4个总体部,集成化配置创新资源,推动产学研协同创新。其中,“良渚星座”总体部的重要成员,就包含国星宇航、地卫二等商业卫星公司,与之江实验室的科研团队开展紧密协同攻关。
启示三:
培育硬科技企业,川籍“六小龙”在哪儿?
寻找“长坡”,耐心有力地“滚雪球”
2023年,杭州全社会R&D经费(研究与试验发展经费)投入强度达3.92%,成都为3.73%。而在企业R&D经费占全市比重上,杭州为76.6%,成都为53.4%。从中可以看出,培育硬科技企业,空间不小。
严帅回忆,明途科技2014年在天府创新中心孵化时,一同创业的企业很多,但坚持到现在的同行者已寥寥无几。
正如此,新兴产业赛道就像一条长长的坡道,作为创新主体的企业就像“湿雪”;而“滚出大雪球”的,往往是长期主义者。
“杭州六小龙”中,游戏科学和群核科技两家企业的成立时间就超过10年。“政府需要创造各种条件,进行持续、耐心的投入、引导。”吴锡认为。
“浙江的政策出台很有前瞻性。”杨光炜注意到,2017年,浙江印发《浙江省“机器人+”行动计划》,从推进机器人应用、发展机器人产业等方面作出部署,成为全国首个发布“机器人+”政策的省份。
彼时,宇树科技刚成立近一年。8年过去,企业已在机器人赛道崭露头角,而其所在的滨江区已形成芯片和关键零部件、机器人整机制造、系统集成的产业链条,成为机器人发展的新地标。
另一种耐心,则指向金融这一“源头活水”。
徐梦曦回忆,2年前他们推出模型产品时,难以找到投资人,只能把资源倾斜到市场开拓和完成业务订单上,这种窘迫也导致他们错失了一些创新和发展机遇。
数据显示,截至2022年底,杭州拥有私募基金管理人1447家,资产管理规模8133亿元。而2023年成都提出的发展目标是:到2027年,私募基金管理机构超600家、管理规模超3000亿元。
吴锡提到,针对科技型初创企业融资难题,杭州还专门成立了1000亿元科创基金。瞄准短板,成都等城市也要思考如何为科创企业提供特色化、灵活的金融支持,营造“投早、投小、投长期、投硬科技”的浓厚氛围。
2月10日,杭州又对外发布新一年推动经济高质量发展“大礼包”,宣布专门统筹现有产业政策资金的15.72%,集中投向新质生产力,加大对通用人工智能、人形机器人等未来产业支持,希望培育更多类似于DeepSeek、宇树科技这样的创新企业。
除了政策和资金,多位受访者表示,杭州各级部门的“张弛有度”“有所为有所不为”,也是值得各地反思和学习的。
由前OpenAI研究员撰写的《为什么伟大不能被计划》一书中写道:“科学探索中的踏脚石是不可预测的。”比如,当真空管被发明出来时,几乎没有人能预见它在计算机发明中的关键作用。
或许,对“杭州六小龙”的讨论声量终会被新一轮热点盖过。但建立在讨论之上的反思和行动,将让越来越多的“踏脚石”出现,创新也就有了更多空间。
到那一天,人们会欣喜地发现,城市拥有的,远不止“六小龙”。
来源:四川日报