摘要:USO 是由字节跳动 UXO 团队于 2025 年 8 月推出的内容与风格解耦与重组统一框架。能将任何主题与任何风格在任何场景中自由组合,生成具有高度主体一致性、强烈风格保真度且自然、非塑料感的图像。USO 通过构建大规模三元组数据集,采用解耦学习方案同时对齐
USO 是由字节跳动 UXO 团队于 2025 年 8 月推出的内容与风格解耦与重组统一框架。能将任何主题与任何风格在任何场景中自由组合,生成具有高度主体一致性、强烈风格保真度且自然、非塑料感的图像。USO 通过构建大规模三元组数据集,采用解耦学习方案同时对齐风格特征并分离内容与风格,引入风格奖励学习(SRL)来进一步提升模型性能。USO 发布了 USO-Bench 基准测试,用于综合评估风格相似性和主体保真度。实验表明,USO 在主体一致性和风格相似性两个维度上均达到了开源模型的顶尖水平。
教程链接:https://go.openbayes.com/Sulyd
http://openbayes.com/console/signup?r=sony_0m6v
页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
在当前页面中看到的算力资源均可以在平台一键选择使用。平台会默认选配好原教程所使用的算力资源、镜像版本,不需要再进行手动选择。点击「继续执行」,等待分配资源。
待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
主题/身份驱动生成
如果您想将主题放入新场景中,请使用自然语言,例如:狗/男人/女人正在做......。如果您只想转移样式但保留布局,请使用指导性提示,例如:将样式转换为......风格。对于保留人像的生成,USO 擅长生成高皮肤细节图像。实用指南:半身提示使用半身特写镜头,当姿势或取景发生显著变化时使用全身图像。
上传一张图片,在「Prompt」中输入提示词,点击「Generate」生成。
*Prompt:The girl is riding a bike in a street.
风格驱动的生成
只需上传一两张风格的图片,USO 将按照您的提示生成图像并匹配您上传的风格。
风格主题驱动的生成
USO 可以使用一个或两个样式引用来样式化单个内容引用。对于保留布局的生成,只需将提示设置为空即可。
布局保留生成
布局偏移生成
来源:爱科技一族