摘要:我国大模型发展始终紧扣 “技术自主 + 产业赋能” 核心,从早期语言基础研究到如今 “开源 + 行业” 双轮驱动,形成了政策引领、企业主导、产学研协同的独特路径,成为全球 AI 版图的重要一极。
我国大模型发展始终紧扣 “技术自主 + 产业赋能” 核心,从早期语言基础研究到如今 “开源 + 行业” 双轮驱动,形成了政策引领、企业主导、产学研协同的独特路径,成为全球 AI 版图的重要一极。
一、基础铺垫期:语言技术的本土突破(1980s–2017)
这一阶段聚焦中文场景的技术积累,为大模型筑牢根基。1980 年代,中科院自动化所依托 “863 计划” 研发汉语分词系统,准确率达 92.3%,破解中文歧义难题。2009 年百度中文词向量项目将分词准确率提升至 96.8%,成为中文 NLP 的基础工具。2015–2016 年,哈工大 FastText-Chinese 实现 “一词多向量”,腾讯 TWE 词向量覆盖百万词汇,形成中文语义理解的技术储备。
二、预训练崛起期:本土模型的对标突破(2018–2020)
紧跟全球技术浪潮,我国实现从 “跟跑” 到 “并跑” 的跨越。2018 年百度 ERNIE 1.0 首创 “知识掩码” 策略,在中文命名实体识别任务上准确率超越 ELMo 2.3%,成为首个中文预训练标杆。阿里达摩院针对中文优化 Transformer 架构,引入 “字节级位置编码”,将注意力计算偏差降低 30%。2020 年华为、字节跳动等企业加速布局,为规模化发展奠定基础。
三、规模化爆发期:开源与行业的深度融合(2021–至今)
政策与市场双轮驱动下,我国大模型形成特色发展模式。政策层面,“十四五” 规划明确开源战略,2025 年《“人工智能 +” 行动意见》进一步推动生态建设,山东等省市打造 “人工智能中台”。企业层面,三大运营商领跑开源:中国电信开源星辰大模型及安全护栏 “见微”,中国移动发布九天 3.0 并开源核心技术,中国联通推出 “元景万悟” 开发平台。
落地场景上,已在 16 个行业打造 800 多个场景:星辰纺织智能体将生产效率提升 20%,九天医疗系统辅助协和医院生成会诊报告,元景经济智能体支撑政府决策。预计未来五年,我国生成式 AI 市场规模将增长 5.5 倍达千亿元,“开源生态 + 行业深耕” 正让我国大模型从技术突破走向价值创造,成为智能经济的核心引擎。
来源:自由坦荡的湖泊AI一点号