摘要:春节期间,国产大模型DeepSeek一跃成为全球瞩目的焦点。它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,硅谷科技巨头纷纷回应,全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。半个月来,DeepSeek相关话题热
春节期间,国产大模型DeepSeek一跃成为全球瞩目的焦点。它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,硅谷科技巨头纷纷回应,全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。半个月来,DeepSeek相关话题热度居高不下,热搜频频。
在全球人工智能技术竞争日趋白热化的当下,中国科技企业正凭借独特的创新路径,深度参与这场意义深远的变革当中。近日,《麻省理工科技评论》(MIT Technology Review)刊发了一篇题为《关注DeepSeek之外的四家中国人工智能初创公司》的报道,指出阶跃星辰(Stepfun)、面壁智能(ModelBest)、智谱AI(Zhipu)、无问芯穹(Infinigence AI)四家企业同样展现出不逊于DeepSeek的技术实力与全球竞争力。
《麻省理工科技评论》刊发题为《关注DeepSeek之外的四家中国人工智能初创公司》的报道
阶跃星辰成立于2023年4月,由前微软高级副总裁姜大昕创立。报道认为,虽然阶跃星辰起步相对较晚,但其凭借着一系列基础模型的成功,迅速崭露头角。去年,阶跃星辰发布了11款基础AI模型,涵盖了语言、视觉、视频、音频以及多模态系统等多个领域,其大型语言模型Step-2参数超1万亿,在第三方基准测试网站LiveBench上,仅次于ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智能由清华大学知名研究团队于2022年共同创立。报道指出,面壁智能专注于效率提升,顺应端侧模型发展趋势,推出了MiniCPM系列模型,被形象地称为“小钢炮”。该系列模型专为智能手机、个人电脑、汽车系统、智能家居设备乃至机器人等终端设备的实时处理设计,其最新的MiniCPM 3.0仅有40亿参数,但在多个基准测试中,性能与GPT-3.5不相上下;另一款模型MiniCPM-o 2.6,在平板电脑上实现了GPT-4o级别的效果。
同样源于清华大学的智谱 AI,已发展成为一家与政府、学术界联系紧密的企业。智谱AI既专注于基础模型研发,也基于模型开发了对话模型ChatGLM和视频生成工具清影(Ying)等一系列AI产品。其最先进的大语言模型 GLM-4-Plus 通过高质量合成数据训练,降低成本的同时,还实现了与GPT-4相媲美的性能表现;视觉模型 GLM-4V-Plus则在赋予AI更多“智能体”能力上迈出了重要一步。
同样是清华系的初创企业无问芯穹,虽然仅仅成立不满两年,但却已经吸引了近10亿元(1.4亿美元)的融资,并被誉为“中国CoreWeave”。报道指出,该公司专注于AI基础设施领域而非模型开发,其核心竞争力在于通过“多元异构、软硬协同”的核心技术,打造连接“M种模型”和“N种芯片”的“MxN”AI基础设施新范式,实现多种大模型算法在多元芯片上的高效协同部署,相当于将来自不同品牌的芯片整合在一起形成“异构计算集群”来执行各类AI任务。无问芯穹推出的Infini-AI异构云平台基于多元芯片算力底座,向大模型开发者提供极致性价比的高性能算力和原生工具链,为大模型从开发到部署的全生命流程降本增效,同时其大规模模型的异构分布式混合训练系统HETHUB,可将AI模型训练时长压缩30%,进而打造具有中国特色的高效解决方案。
从DeepSeek到四大新锐,中国AI企业正以独特的发展路径重塑全球AI的竞争格局。凭借在原创技术和工程层面实现突破,进而以更高的创新效率,快速追赶国际巨头、构建全新商业模式,乃至树立全球人工智能发展新标准,正是这些中国创新企业的共同特质。越来越多中国AI企业在全球舞台上崭露头角,不仅将成为推动中国 AI 产业稳健前行的关键力量,也将为全球AI发展贡献更多中国智慧,引领人工智能产业迈向新的发展阶段。
来源:文汇报