智能体动作

136张截图，vivo开源DeepSeek R1式强化学习，提升GUI智能体动作预测

136张截图，vivo开源DeepSeek R1式强化学习，提升GUI智能体动作预测

基于规则的强化学习（RL/RFT）已成为替代 SFT 的高效方案，仅需少量样本即可提升模型在特定任务中的表现。

智能体 vivo gui gui智能体智能体动作 2025-04-08 18:39 3