reward

理解和掌握Agent的五重境界

从LLM取得突破以来,技术社区对agent的探索从未停步,过去两三年我们不断见证各类agent showcase的出现,每次都引发热烈讨论,大家满怀激情地认为agent奇点已来,但后来又会失望,觉得离实际落地还远,两种声音始终都会并存,这也符合技术发展的规律。

模型 llm agent workflow reward 2025-04-06 11:38  2

强化学习怎么玩?

探险家(Agent)这是机器自己,负责行动。比如玩游戏的AI,开车的无人车。森林(Environment)探险的舞台,可能是游戏屏幕,也可能是真实道路。探险家在这儿试招。行动(Action)探险家能干啥?左转、右跳、加速……每一步都是个选择。奖励(Reward

学习 超级马里奥 agent 乌龟 reward 2025-03-31 17:10  4

帮助身心健康的4件小事,第2个建议姑娘们一定要试试

▲图片来源:参考文献[4]爱美之心,人皆有之。如果有朋友emo了,那么带她去拍拍美照并真诚地夸赞她也许不失为一个好方法,但大家也看到了,美颜虽好,不可过量,一定坚信真实的自己才是最美的。好啦,今天的研究分享就到这里。如果觉得科普内容还不错或者对你有帮助,欢迎转

et emo reward 2025-02-07 09:49  6