思特奇申请基于动态自适应蒸馏的模型压缩方法专利,降低训练所需计算资源和时间成本

B站影视 2025-01-24 17:32 2

摘要:国家知识产权局信息显示,北京思特奇信息技术股份有限公司申请一项名为“一种基于动态自适应蒸馏的模型压缩方法、系统及设备”的专利,公开号CN 119337946 A,申请日期为2024年9月。

金融界2025年1月24日消息,国家知识产权局信息显示,北京思特奇信息技术股份有限公司申请一项名为“一种基于动态自适应蒸馏的模型压缩方法、系统及设备”的专利,公开号CN 119337946 A,申请日期为2024年9月。

专利摘要显示,本发明公开了一种基于动态自适应蒸馏的模型压缩方法、系统及设备,方法包括:获取通用公共数据,并筛选得到训练数据集;依据开源框架将训练数据集输入现有大模型进行微调训练,得到教师模型;确定学生模型,并采用部分权重冻结策略确定学生模型的训练状态;将训练数据分别输入学生模型和教师模型进行前向传播,以SKL和SRKL结合的动态自适应蒸馏损失函数,计算动态自适应蒸馏损失并更新优化权重,完成对学生模型的蒸馏训练,实现由教师模型向学生模型的压缩。通过本发明的技术方案,大幅度降低了训练所需要的计算资源和时间成本,提高了训练效率,模型压缩效果更好,有更强的通用泛化能力,有效解决了无效或错误信息过多的问题。

天眼查资料显示,北京思特奇信息技术股份有限公司,成立于1995年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本33117.1437万人民币,实缴资本4371.51万人民币。通过天眼查大数据分析,北京思特奇信息技术股份有限公司共对外投资了35家企业,参与招投标项目1838次,知识产权方面有商标信息129条,专利信息1560条,此外企业还拥有行政许可12个。

来源:金融界

相关推荐