商汤科技“冲刺”:生成式AI扛起技术革新和业务结构跃迁的双重责任

B站影视 电影资讯 2025-04-02 18:16 1

摘要:“这不过是将来之事的前奏,也是将来之事的缩影”,这句话源自商汤科技董事会执行主席兼CEO徐立,谈及人工智能的重大里程碑,他引用这句话认为,这是这个时代的最佳注释。

“这不过是将来之事的前奏,也是将来之事的缩影”,这句话源自商汤科技董事会执行主席兼CEO徐立,谈及人工智能的重大里程碑,他引用这句话认为,这是这个时代的最佳注释。在人工智能新浪潮来临之际,商汤及时调整航行方向,在那封内部信中徐立首次提及“大装置-大模型-应用”的三位一体战略,他指出,在生成式大模型AI领域,商汤的核心战略是实现算力大装置、大模型和应用的无缝集成,以应用驱动模型,以模型带动算力的优化。这一战略转型在近日的财报中初见成效。3月26日,商汤发布的2024年度业绩公告显示,2024年商汤实现营收37.7亿元,同比增长10.8%。财报提及这一增长主要受生成式AI持续扩展推动:2024年商汤的生成式AI收入突破24亿元,同比增长103.1%,这是生成式AI连续两年保持三位数增速,并成为商汤最大的业务。生成式AI带来的迅猛增长或许也只是“前奏”。展望2025年,徐立表示,今年生产式AI应用场景将有规模化爆发,传统计算机视觉也会受益,形成新的发展机遇。多模态大模型蕴藏巨大的商业化潜力,将成为商汤商业化突破的关键。生成式AI两年增长超过20亿在2024年的技术浪潮中,以生成式AI和大模型为代表的AI 2.0演进轨迹更加清晰。“随着大模型成本的快速下降,生成式AI迎来了百花齐放、加速落地的阶段,各类应用方兴未艾, 且反过来继续推动着生成式AI的持续创新。”在财报中,商汤写道。两年时间里生成式AI业务的规模增量就超过20亿元,商汤表示这也是历史上最快突破20亿营收的板块。算力是大模型时代最稀缺的“能源”,大装置也是商汤发展基石。在此前的内部信中,徐立表示商汤大装置致力于成为“最懂大模型的算力服务商”。商汤早已意识到基建的重要性,过去三年持续投入建设上海临港AIDC智算中心,这是全国5A级智算中心。据IDC《中国智算服务市场(2024上半年)跟踪》报告,商汤科技以13.3%的市场份额位列GenAI IaaS(基础设施即服务)市场Top3。IDC预测,未来五年中国智算服务市场较高增速持续增长,预计年均复合增长率预计达到 57.3%,2028年整体市场规模近2000 亿人民币。而 GenAI IaaS 市场更将以79.8%的复合增长率高速增长。华泰研究发布研报认为,布局算力中心的AI 企业较少,商汤AIDC 建设进度较为领先。作为AI原生企业,商汤较早进入互联网、金融、企业服务等领域为用户提供大模型以及算力服务,积累了丰富的行业认知。华泰研报表示看好商汤以“自有+运营”方式拥抱中国智算浪潮。正是沿着这一思路,商汤确立“大装置-大模型-应用”的三位一体战略,也得以通过联合优化,提升算力资源的使用效率。根据财报,在AI云服务技术能力方面,商汤通过工程优化技术实现了快速创建和扩缩容虚拟AI集群,速度是传统云厂商的6倍以上,节省虚拟集群管理成本90%以上。在国产芯片方面,商汤实现了国产芯片集群的规模化商用,支持多种异构芯片5000卡集群上单一大模型的调度与运行,训练效率达同构训练的95%。根据财报,在AI基础设施系统与模型算法的联合优化下,日日新大模型的推理效率和训练效率均达到了业内领先水平。此外,商汤大装置还开放接入了包括DeepSeek V3和R1等在内的行业领先开源模型,训练效率超过DeepSeek的公开报告。“以DeepSeek R1为例,我们的推理吞吐性能(可理解为Token生成时间)比业界头部厂商高15%以上,高于行业均值25%。通过模型蒸馏技术、键值缓存、PD分离、多模态信息压缩等技术,我们在基本保持模型性能的前提下将推理成本压低了一个数量级。”商汤提到,对于DeepSeek V3等第三方模型,商汤每秒处理Token数(TGS)已达1600+,在未做专项优化下,优于DeepSeek官方成绩,他们预期未来对于单一模型做特定优化将会带来更大的性能提升。商汤认为,DeepSeek对于行业发展和认知是好事,但用商汤大装置更省钱。“如果商汤的推理效率领先于行业15%,那么在做同样服务时就有15%的利润,领先25%就有25%的利润。所以推理效率或者训练效率也不是普适的,这也是商汤联合优化的价值。”对于未来,商汤会继续重点推进三位一体战略的深度协同,目标是推动大模型训练与推理成本以每年至少一个数量级的速度下降,为大模型的应用爆发做好充分的技术准备,同时也继续满足现有大模型训练和推理的客户需求。“一基两翼”驱动落地2025农历新年,DeepSeek的出圈激活了各行各业的大模型应用,带来全新生机,可以预见,2025年技术突破方向将沿着更低成本、更好的模型不断发展,生成式AI的落地将更大程度爆发。除了用基础设施覆盖GenAI IaaS市场,过去一年,商汤在应用市场同样交出了亮眼的成绩单。3月,IDC最新发布的《中国大模型应用市场份额,2024:格局巨变》报告显示,2024年中国大模型应用市场规模达47.9亿元人民币,行业竞争格局经历重大变革。其中,商汤以13.8%的市场份额位列中国大模型应用市场前三,处于第一梯队。在落地方面,商汤的布局是“一基两翼”,即以日日新多模态大模型为基石、以生产力工具与交互工具为两个垂直应用方向,进行商业化落地。这一思路符合业界的判断——大家普遍认为,只有模型的能力足够好,同时兼顾成本的平衡,才能让市场接受、更大程度推动应用落地。在基座模型方面,商汤认为多模态深度融合是下一个关键技术点,因为真实世界的信息是多模态的,单一的语言模型无法完整地理解和表达世界的丰富性。因此,在2024年4月发布的日日新5.0版本中,商汤就整合了多模态功能,对标GPT-4 Turbo。同年7月,模型迭代至日日新5.5,并推出了支持音视频流式交互的大模型,在通用能力上、多模态能力上都达到了行业领先的水平。在SuperCLUE发布的《中文大模型基准测评2024年度报告》中,商汤日日新 5.5大模型与DeepSeek V3一起并列国内榜首;在 OpenCompass的多模态评测中,商汤以同一款模型取得了榜单第一。商汤财报显示,将于今年4月10日在上海举行“商汤技术交流日”,届时将发布日日新大模型6.0系列模型——在多模态理解、推理、交互能力大幅升级,对标国际一流水平,这将会为多模态大模型应用于智能终端交互等场景带来质的突破。基于模型能力,财报也用众多丰富的案例阐述了2024年商汤落地成果。在生产力工具上,商汤产品包括企业助手、金融数据先兵、政务助手等,财报披露的客户包括中国移动、上海电信、金山办公、招商银行、海通证券、联想等各行业的头部企业。商汤提到,这些产品目前触达上千万用户,大幅提高了客户生产效率,订单金额同比2023年增长6倍。在企业助手中,办公助手产品与代码助手产品在智能办公领域正加速渗透,用户数突破150万,每日处理Token数超过35亿,触达1000万开发者,成为国内增速最快的AI 办公工具之一。在交互工具上,商汤的应用落地场景涵盖智能陪伴、智能硬件交互、智能营销等,月均用户使用量较2023年增长8倍。在智能硬件交互方面,商汤加速多模态大模型在机器人、智能眼镜、智能车舱等智能硬件的应用布局,开放测试数月以来已接入超70家企业。在智能营销领域,商汤多模态大模型结合数字人技术助力电商营销,在2024年带来的GMV同比增长94%。在今年春节期间,即使直播间无人值守,商汤数字人也为品牌直播间带来稳定收入,提升了零售转化率。纵观财报,沿着AI基础设施大装置、大模型和应用三个方向,商汤业务生态形成了良性循环。首先,基础设施支撑了日日新多模态大模型的能力跃迁,同时联合优化带来模型成本的大幅下降,进一步催生和支持应用的爆发式增长。反过来,应用场景的实际需求继续指引模型发展,并推动AI基础设施的优化升级。“大模型算法与基础设施软件系统的联合优化已成为生成式AI飞速发展的核心驱动力。”徐立在业绩会上表示,商汤正处在AI发展的关键窗口期,生成式AI不再只是技术革新,更是驱动公司业务结构跃迁的引擎。这标志着商汤科技向生成式AI全面转型、AI普惠未来目标以“冲刺”姿势全速发展中。在当下生成式AI需求爆发式增长的情况下,申万宏源研究认为,商汤通过大装置+大模型+应用三位一体模式协同发展,能够更大发挥软硬件性能。商汤聚焦原生多模态技术突破,在数据语料层和模型架构层重新设计实现真正的多模融合,该技术是未来包括端侧、自动驾驶和机器人等方向的重要技术,未来AI应用爆发后有望为商汤带来更大空间。

来源:第一财经资讯

相关推荐