136张截图,vivo开源DeepSeek R1式强化学习,提升GUI智能体动作预测 基于规则的强化学习(RL/RFT)已成为替代 SFT 的高效方案,仅需少量样本即可提升模型在特定任务中的表现。 智能体 vivo gui gui智能体 智能体动作 2025-04-08 18:39 3