腾讯混元团队近日公布了一项重要技术突破——SRPO(SemanticRelativePreferenceOptimization,语义相对偏好优化),该方法为文生图模型提供了一种高效的强化学习优化方案,成功解决了开源模型Flux在生成人像时常见的皮肤“过油”问题,使人像真实感提升达3倍以上。针对Flux.dev.1模型输出图像中人物肌肤质感过于油腻的现象,SRPO通过在线调整奖励机制、优化生成过程早期轨迹等手段,有效改善了视觉质量。相比传统方法依赖固定奖励模型的方式,SRPO展现出更强的灵活性和...
腾讯混元团队近日公布了一项重要技术突破 —— SRPO(Semantic Relative Preference Optimization,语义相对偏好优化),该方法

为文生图模型提供了一种高效的强化学习优化方案,成功解决了开源模型Flux在生|成人|像时常见的皮肤“过油”问题,使人像真实感提升达3倍以上。
针对Flux.dev.1模型输出图像中人物肌肤质感过于油腻的现象,SRPO通过在线调整奖励机制、优化生成过程早期轨迹等手段,有效改善了视觉质量。相比传统方法依赖固定奖励模型的方式,SRPO展现出更强的灵活性和适应性。
在文生图领域,传统的在线强化学习方法如ReFL和DRaFT虽具备较高的训练效率,但严重依赖预先训练的奖励模型。这类模型不仅需要大量标注数据进行训练,成本高昂,且泛化能力有限,难以满足复杂多变的高质量后训练需求。
为此,腾讯混元团队联合香港中文大学(深圳)与清华大学共同提出SRPO,引入语义偏好的动态调节机制,实现对奖励模型的实时优化。
具体而言,SRPO通过向奖励模型注入特定控制提示词(例如“真实感”、“自然肤色”等),引导其关注图像生成中的关键质量维度。实验表明,这些语义信号能显著增强模型在真实度方面的判断能力,从而更精准地指导生成过程。
然而研究人员发现,仅依靠正向语义引导容易引发“奖励破解”现象,即模型可能通过捷径欺骗奖励函数,导致生成结果失真。为此,团队创新性地提出了“语义相对偏好优化”策略:同时使用正向与负向语义提示作为对比信号,利用负向梯度抑制奖励模型的固有偏差,保留真正有意义的语义差异偏好。
此外,团队还设计了Direct-Align策略,通过对输入图像施加可控噪声,并以该噪声作为“参考锚点”,在单步推理中完成图像重建。这一机制大幅降低了重建误差,提升了奖励信号传递的准确性,使得对生成轨迹前半段的优化成为可能,有效缓解了过拟合问题。
SRPO在训练效率方面表现极为突出,仅需10分钟训练即可超越DanceGRPO的性能表现。
在定量评估中,SRPO达到当前最优(SOTA)水平,人类评审结果显示其在图像真实感与美学质量上的优秀率提升超过3倍,训练耗时相较DanceGRPO减少75倍。
- 论文链接:Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference
相关推荐:
SEO任何-如何通过SEO优化让网站流量暴增!
AI写作自动生成:助您开启高效创作新时代
SEO优化网站价格如何选择最具性价比的优化方案?
ChatGPT+维护页面:您的智能助手之旅,安全、高效、无忧,ai识图取名
AI批量文章工具,让写作变得高效与轻松,ai草地颜色
SEO小白必看!从零起步SEO的秘诀,轻松提升网站排名,南京网站运营优化平台
如何利用AI生成高质量文章,提升写作效率与创意?
AI写作免费一键生成,让创作如此简单!
ChatGPT中国镜像畅享智能对话的新时代,在线寻找ai
2025百度收录优化:提升网站排名,助力企业数字化转型,ai家居的计价方式
AI写文章机器人:开启智能写作新时代
SEO可以改变你的商业未来:如何通过优化提升网站流量和转化率,五粮液营销推广
SEO优化啥意思?深入剖析SEO优化的核心与技巧
在线AI文章生成器开启智能创作新时代
开发完app之后,app运营推广应该这么做!
文字写作AI生成工具:让创作更简单、更高效
SEO岗位学什么专业?这些专业技能,助你快速入行!,ai聊天软件小众
SEO与SEM:数字营销的核心利器,ai形状工具编辑节点
SEO优化教学:提升网站排名的核心策略与技巧
SEO优化怎样?让你的网站脱颖而出!
SEO优化怎么推广:提升网站流量与排名的必备技巧
跟ChatGPT差不多的国内版叫什么?揭秘国内AI对话平台的崛起,生动ai
AI一键生成文章,写作新境界
ChatTTS整合包下载中文版破解版让语音生成更高效,体验更卓越!,本科ai论文写作
用AI写的文章算原创吗?真相揭示,带你深度思考!
SEO优化分析:如何通过精准策略提升网站排名
小红书推广引流没效果?注意这几个小红书引流推广的关键思路!
2025年整站SEO排名优化策略:让你的网站脱颖而出,ai国宴
SEO优化外部链接时错误的做法是你不得不避免的几个雷区
正版ChatGPT官网中文版电脑版,智能聊天新体验,ai大猩猩跟ai香蕉打架