dmax

在零售技术做AI的95后:我们这样搞定技术难题

拿到这道题时,我在思考:是否可以用多个奖励小模型的组合来替代单一奖励大模型呢?让每个小模型专注评判图片的某一类问题,如商品形状、摆放位置、色彩搭配等,降低单一模型的学习难度,同时提升评判的精细度;另一方面多奖励模型意味着更灵活的业务规则嵌入和更丰富的模型组合方

零售 技术 query epsilon dmax 2025-05-26 15:45  3