小红书申请模型训练优化方法、装置及计算设备专利,降低强化学习方法使用的门槛

B站影视 电影资讯 2025-06-02 13:10 1

摘要:国家知识产权局信息显示,小红书科技有限公司申请一项名为“模型训练优化方法、装置及计算设备”的专利,公开号CN120068988A,申请日期为2025年02月。

金融界2025年6月2日消息,国家知识产权局信息显示,小红书科技有限公司申请一项名为“模型训练优化方法、装置及计算设备”的专利,公开号CN120068988A,申请日期为2025年02月。

专利摘要显示,本说明书实施例提供模型训练优化方法、装置及计算设备,其中模型训练优化方法包括:获取强化学习模型,强化学习模型的强化学习过程包括推理阶段、前向传播阶段和模型训练阶段,推理阶段、前向传播阶段和模型训练阶段串行进行;在推理阶段结束后,卸载推理阶段使用的机器资源,在前向传播阶段和模型训练阶段,复用推理阶段使用的机器资源,基于推理阶段获得的样本数据对强化学习模型进行前向传播和模型训练。推理阶段结束后卸载所使用的机器资源,在前向传播阶段和模型训练阶段分时复用该推理阶段使用的机器资源,降低强化学习过程中所需的机器资源的数量,降低强化学习方法使用的门槛。

来源:金融界

相关推荐