PLADIS:三星研究院用稀疏注意力机制让AI画图更懂你说的

B站影视 内地电影 2025-08-04 21:36 1

摘要:这项由三星研究院的金权永(Kwanyoung Kim)和任秉洙(Byeongsu Sim)领导的研究发表于2025年7月,论文题为《PLADIS: Pushing the Limits of Attention in Diffusion Models at I

这项由三星研究院的金权永(Kwanyoung Kim)和任秉洙(Byeongsu Sim)领导的研究发表于2025年7月,论文题为《PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity》,有兴趣深入了解的读者可以通过arXiv:2503.07677v3访问完整论文。

最近几年,AI绘画工具变得越来越厉害,你只要输入"一只戴帽子的猫坐在椅子上",AI就能给你画出栩栩如生的图片。但是有个问题让研究人员很头疼:AI有时候画得挺好看,但经常"答非所问"——你要一只猫,它可能给你画了只狗;你要红色的,它给你蓝色的。这就像你去餐厅点菜,服务员总是会错意,虽然端上来的菜品质不错,但就是不是你要的那道。

要解决这个问题,现有的方法就像给服务员额外培训一样,要么重新训练整个AI模型(这相当于让服务员回炉重造),要么在每次生成图片时都要多做几遍计算(这相当于服务员每次都要反复确认菜单)。这些方法虽然有效,但成本高昂,而且很多时候还不兼容那些已经被优化过的"快餐版"AI模型。

现在,三星研究院的团队提出了一个巧妙的解决方案,叫做PLADIS。他们的思路就像是调整服务员的"注意力分配机制"——不需要重新培训,也不需要额外的确认步骤,只需要让AI在理解你的文字描述时变得更加"专注"和"挑剔"。

这个方法的核心在于一个叫做"稀疏注意力"的技术。通常情况下,AI在处理你的文字描述时,就像一个什么都想听的人,对每个词汇都分配同样的关注度。而稀疏注意力就像一个经验丰富的侦探,会有选择性地把注意力集中在最关键的线索上,忽略那些无关紧要的干扰信息。

研究团队发现了一个有趣的现象:当AI使用稀疏注意力时,它不仅能更准确地理解用户的意图,生成的图像质量也会显著提升。这就像是当一个人学会了专注和深度思考后,不仅做事更准确,效率也更高了。

PLADIS的最大优势在于它的通用性和简便性。它可以和现有的各种AI绘画技术完美结合,就像一个万能的"注意力增强器",可以插到任何现有系统上立即生效。无论是传统的AI模型,还是那些被优化到只需要一步就能生成图片的"快餐版"模型,都能从中受益。

更令人惊喜的是,这个方法在推理阶段工作,也就是说它不需要重新训练AI模型,只需要在AI"思考"的时候稍作调整就能发挥作用。这就像是给一个已经很能干的员工戴上了一副高质量的眼镜,让他看得更清楚,工作得更精准,而不需要重新培训或者改变工作流程。

一、从传统注意力到稀疏注意力:AI如何学会"专注"

要理解PLADIS的工作原理,我们首先需要了解AI是如何"理解"文字描述的。当你告诉AI"画一只红色的猫"时,AI需要建立文字和图像之间的联系,这个过程就像翻译工作一样复杂。

在传统的AI绘画系统中,有一个叫做"注意力机制"的核心组件,它负责决定AI在生成图像的每个部分时应该关注文字描述的哪些内容。这就像一个画家在作画时,需要不断地在画布和参考资料之间来回看,决定下一笔应该画什么。

传统的注意力机制使用一种叫做Softmax的数学函数,这种函数的特点是会给每个输入分配一个权重,而且所有权重加起来等于1。用通俗的话说,这就像是一个非常"公平"的注意力分配方式——无论输入有多少内容,每一部分都会得到一定的关注,即使是那些不太重要的部分。

这种"雨露均沾"的注意力分配方式在很多情况下是有问题的。想象你在一个嘈杂的餐厅里想听清楚朋友说话,如果你对餐厅里的每一个声音都同等对待,你就很难专注于朋友的声音。同样,AI在处理"红色的猫"这个描述时,如果对"红色"、"的"、"猫"三个词都给予相同程度的关注,就可能被"的"这个无关紧要的助词干扰。

PLADIS引入的稀疏注意力机制就像是给AI戴上了一副特殊的"专注眼镜"。这种机制使用α-Entmax函数替代传统的Softmax函数。α-Entmax的神奇之处在于,它可以将那些不重要的输入的权重直接设为零,让AI完全忽略它们,把所有注意力都集中在真正重要的内容上。

这种变化带来的效果是立竿见影的。研究团队发现,使用稀疏注意力的AI在理解"红色的猫"时,会把绝大部分注意力集中在"红色"和"猫"这两个关键词上,而完全忽略"的"这个助词。结果就是生成的图像不仅更准确地反映了用户的要求,视觉质量也更好。

有趣的是,这种改进并不需要重新训练AI模型。就像给一个已经很优秀的翻译员戴上高质量耳机一样,稀疏注意力机制只是改变了AI"倾听"的方式,而不需要改变它已经学会的知识。这意味着现有的AI绘画系统可以立即享受到这种改进带来的好处。

研究团队通过大量实验证实了稀疏注意力的优势。他们发现,当α参数设置为1.5或2时,AI的表现最好。α=1时相当于传统的注意力机制,而α值越大,注意力就越稀疏,越能聚焦于关键信息。这就像调节收音机的频率一样,找到合适的"频道"就能听到最清晰的声音。

这种稀疏注意力机制的理论基础来自于现代Hopfield网络的研究。Hopfield网络是一种模拟人脑记忆机制的数学模型,而稀疏Hopfield网络在处理噪声和干扰方面表现更好。在AI绘画的语境下,文字描述中的无关词汇就相当于"噪声",而稀疏注意力机制能够有效地过滤这些噪声,提取出真正有用的信息。

二、PLADIS的核心创新:不需要额外训练的智能增强器

PLADIS的核心创新在于它采用了一种"外推"的策略。这个概念听起来很复杂,但用简单的比喻来解释就清楚了。想象你有两台收音机,一台调到了你想听的电台,但信号有些模糊;另一台虽然信号清晰,但频率稍有偏差。PLADIS就像是一个智能调节器,它能够巧妙地结合这两台收音机的优势,让你听到既清晰又准确的节目。

具体来说,PLADIS在AI生成图像的过程中,会同时计算传统的稠密注意力和稀疏注意力,然后通过一个叫λ(lambda)的参数来控制两者的组合比例。这个公式看起来像这样:最终注意力 = 传统注意力 + λ × (稀疏注意力 - 传统注意力)。

当λ=0时,系统完全使用传统注意力;当λ=1时,系统完全使用稀疏注意力;而当λ>1时,系统会强化稀疏注意力的效果。研究团队发现,将λ设置为2.0时效果最好,这相当于让AI的"专注程度"提升到一个理想的水平。

这种设计的巧妙之处在于它的渐进性和可控性。就像调节音响的音量旋钮一样,用户可以根据需要调整λ值来获得最佳效果。而且由于计算是在推理阶段进行的,整个过程不需要修改AI的核心模型,也不需要额外的训练时间。

研究团队还发现了PLADIS的一个重要特性:它对所有类型的注意力模块都有效,无论是自注意力还是交叉注意力。但经过大量实验,他们发现PLADIS在交叉注意力模块上的效果最为显著。交叉注意力负责建立文字描述和图像内容之间的对应关系,这正是文图匹配准确性的关键所在。

更令人印象深刻的是,PLADIS的计算开销非常小。与那些需要额外神经网络计算的方法不同,PLADIS只需要在现有的注意力计算基础上增加一个简单的α-Entmax运算。研究团队的测试显示,这只会增加约0.56秒的计算时间和0.01GB的内存使用,这对于大多数应用来说几乎可以忽略不计。

从架构设计的角度来看,PLADIS的另一个优势是它的"即插即用"特性。无论是经典的Stable Diffusion模型,还是最新的快速生成模型如SDXL-Lightning、DMD2等,都可以直接应用PLADIS而无需任何修改。这就像一个通用的"智能插头",可以让任何电器都变得更智能,而不需要重新设计电器本身。

研究团队特别强调了PLADIS与指导蒸馏模型的兼容性。指导蒸馏模型是最近几年AI绘画领域的一个重要发展方向,这类模型通过特殊的训练技术,可以在极少的步骤(甚至一步)内生成高质量图像。然而,大多数现有的改进方法都与这类模型不兼容,因为它们需要进行额外的条件计算或无条件计算,而这些计算在蒸馏模型中是不存在的。PLADIS完美地解决了这个问题,因为它只修改注意力计算本身,而不依赖于任何外部条件。

三、理论基础:稀疏Hopfield网络的噪声鲁棒性

PLADIS的理论基础建立在稀疏Hopfield网络的研究之上,这为我们理解为什么稀疏注意力在AI绘画中如此有效提供了深刻的洞察。Hopfield网络是一种模拟人脑联想记忆的数学模型,就像我们的大脑能够从不完整或模糊的信息中回忆起完整记忆一样。

在传统的Hopfield网络中,网络试图从噪声输入中恢复原始模式,就像从一张模糊的照片中识别出是谁的脸一样。现代Hopfield网络将这个概念与transformer的注意力机制联系起来,发现注意力计算实际上等价于Hopfield网络的记忆检索过程。

稀疏Hopfield网络的关键优势在于其噪声鲁棒性。研究表明,当输入包含噪声时,稀疏检索机制比稠密检索机制更能准确地恢复原始信息。在AI绘画的语境下,用户的文字描述往往包含各种"噪声"——比如语法词、重复词汇、或者不够精确的表达。稀疏注意力机制能够自动过滤这些噪声,专注于真正描述图像内容的关键词汇。

研究团队提出了一个重要的理论结果:对于1

这个理论发现解释了为什么PLADIS在各种不同的文字描述上都能表现良好。无论用户的描述是简洁明了的"红色猫",还是复杂冗长的"一只毛茸茸的橙红色小猫咪正安静地坐在古老的木质椅子上",稀疏注意力都能从中提取出最关键的视觉元素,忽略那些对图像生成不重要的修饰词和连接词。

从数学角度来看,PLADIS使用的α-Entmax函数是Softmax函数的推广。当α=1时,α-Entmax就是我们熟悉的Softmax;当α=2时,α-Entmax变成了Sparsemax,这是一个能产生真正稀疏输出的函数。PLADIS选择α=1.5作为默认值,这是在稀疏性和计算效率之间的一个平衡点。

有趣的是,α=1.5的情况有一个封闭形式的解,这意味着可以直接计算而不需要迭代算法。这不仅保证了计算效率,也使得PLADIS在实际应用中更加稳定可靠。相比之下,其他α值可能需要复杂的迭代计算,这会增加计算成本和数值不稳定的风险。

研究团队还探讨了PLADIS中λ参数的理论意义。λ参数控制着系统从稠密注意力向稀疏注意力的"外推"程度。当λ>1时,系统不仅使用稀疏注意力,还会放大稀疏性的效果。这种外推策略让AI能够比单纯使用稀疏注意力更好地捕捉文字描述中的关键信息。

这种理论基础为PLADIS的实用性提供了坚实的支撑。它不是一个简单的工程技巧,而是基于深刻的数学原理的系统性改进。这也解释了为什么PLADIS能够在如此广泛的场景和模型中都表现出色。

四、全面的实验验证:从定量分析到用户体验

研究团队进行了极其全面的实验来验证PLADIS的效果,这些实验涵盖了从技术指标到用户体验的各个层面。他们的实验设计就像一个多维度的"体检",全方位地检测PLADIS的性能表现。

在基础性能测试中,研究团队使用了MS-COCO数据集,这是计算机视觉领域的标准测试集。他们生成了3万张图片来测试PLADIS的效果,使用了多个评价指标。FID(Fréchet Inception Distance)衡量生成图像的整体质量,就像给图像的"逼真程度"打分;CLIPScore评估文字和图像的匹配度,就像检查"答题的准确性";ImageReward和PickScore则反映人类的喜好程度,就像"用户满意度调查"。

实验结果令人印象深刻。在与经典的分类器自由指导(CFG)结合时,PLADIS将FID从23.39提升到19.01,这相当于图像质量提升了近20%。CLIPScore从25.91提升到26.61,ImageReward从0.425提升到0.622,这些数字背后代表的是AI对用户意图理解的显著改善。

更有趣的是,PLADIS不仅能够独立工作,还能与现有的各种指导技术完美结合。当与PAG(Perturbed Attention Guidance)结合时,系统性能得到了进一步提升。这就像一个好的调料不仅自己味道好,还能让其他食材的味道更加突出。

研究团队特别关注了PLADIS与快速生成模型的兼容性测试。他们测试了包括SDXL-Turbo、SDXL-Lightning、DMD2和Hyper-SDXL在内的多个蒸馏模型。这些模型的特点是能够在极少的步骤内生成图像,有些甚至只需要一步。实验结果显示,PLADIS在所有这些模型上都能带来一致的改进,这证明了其广泛的适用性。

在跨数据集的测试中,研究团队使用了Drawbench、HPD和Pick-a-pic等多个数据集。这些数据集包含了不同风格和难度的文字描述,从简单的对象描述到复杂的场景描述都有涵盖。PLADIS在所有这些数据集上都表现出了一致的改进,说明它不是针对特定类型描述的优化,而是一个通用的改进方法。

用户体验研究是实验中特别重要的一部分。研究团队组织了大规模的人工评估,让真实用户对比使用PLADIS前后生成的图像。评估分为两个维度:图像质量和文字匹配度。结果显示,在图像质量方面,超过70%的用户更喜欢使用PLADIS的结果;在文字匹配度方面,这个比例甚至超过了80%。

特别值得注意的是PLADIS在处理复杂描述时的表现。当面对"一只穿着蓝色毛衣的橘猫正在厨房里喝牛奶"这样的复杂描述时,传统方法经常会遗漏某些细节或者混淆不同的元素。而使用PLADIS的系统能够更准确地理解和呈现所有的关键元素,包括动物种类、颜色、服饰、动作和环境等。

研究团队还进行了消融实验来验证PLADIS各个组件的贡献。他们发现,稀疏注意力机制是最关键的因素,而λ参数的外推策略则进一步放大了这种改进。有趣的是,当他们测试只使用稀疏注意力而不使用外推策略时,改进效果明显减弱,这证明了PLADIS设计的科学性。

在不同骨干网络的测试中,PLADIS展现出了出色的泛化能力。无论是基于U-Net的Stable Diffusion系列,还是基于Transformer的FLUX系列,PLADIS都能带来明显的改进。这种跨架构的一致性表现说明PLADIS触及了AI绘画系统的一个基本问题,而不是针对特定架构的优化。

计算效率测试显示,PLADIS的额外计算开销极小。在标准测试环境下,每张图片只增加约0.56秒的计算时间,这对于通常需要几秒到几分钟的图像生成过程来说几乎可以忽略不计。内存使用也只增加了0.01GB,这意味着现有的硬件配置可以轻松支持PLADIS的使用。

五、广泛的适用性:从研究工具到实用系统

PLADIS的一个突出特点是其出色的适用性,它就像一个通用的"智能增强模块",可以无缝集成到各种现有的AI绘画系统中。这种广泛的兼容性使得PLADIS不仅仅是一个学术研究成果,更是一个具有实际应用价值的工具。

在与现有指导方法的结合测试中,PLADIS展现出了出色的协同效应。当与分类器自由指导(CFG)结合时,系统不仅保持了CFG的优势,还进一步提升了文字理解的准确性。这就像给一位经验丰富的翻译员配备了更好的耳机,让他既保持了原有的专业水平,又能更清晰地听到需要翻译的内容。

与PAG(扰动注意力指导)的结合更是展现了PLADIS的互补特性。PAG通过扰动自注意力来改善图像质量,而PLADIS则通过优化交叉注意力来提升文字理解,两者在不同的维度上发挥作用,组合使用时效果显著优于单独使用任一方法。

在支持不同骨干网络方面,PLADIS的表现同样令人印象深刻。除了在主流的Stable Diffusion XL上的测试,研究团队还验证了PLADIS在其他架构上的效果。在Stable Diffusion 1.5上,PLADIS带来了1.48的FID改进和0.98的CLIPScore提升。在最新的SANA模型上,虽然改进幅度相对较小,但仍然是一致的正向提升。

特别值得一提的是PLADIS与FLUX模型的结合。FLUX是基于流匹配的新一代扩散模型,采用了与传统扩散模型不同的架构。即使在这样的新架构上,PLADIS仍然能够带来显著的改进,这证明了其方法的普适性。

研究团队还测试了PLADIS与其他推理时增强方法的兼容性。FreeU是另一个流行的推理时改进方法,主要通过调整U-Net中的特征来提升图像质量。当PLADIS与FreeU结合使用时,两者的效果可以叠加,进一步提升整体性能。这种叠加效应说明PLADIS和FreeU在不同的层面上发挥作用,彼此互不冲突。

在条件控制方面,PLADIS与ControlNet的结合也展现了良好的效果。ControlNet允许用户通过提供额外的结构信息(如边缘图、深度图等)来精确控制生成结果。当结合PLADIS使用时,系统不仅能够准确遵循结构约束,还能更好地理解文字描述中的语义信息,生成更符合用户期望的结果。

从实际应用的角度来看,PLADIS的"即插即用"特性使其具有很强的实用价值。现有的AI绘画应用只需要进行最小的代码修改就能集成PLADIS,而用户体验可以得到显著提升。这种低门槛的集成方式大大降低了技术采用的成本。

研究团队还考虑了不同使用场景下的表现。在艺术创作场景中,PLADIS能够帮助AI更准确地理解艺术家的创意描述,生成更符合创作意图的作品。在商业应用中,PLADIS可以提高AI对产品描述的理解准确性,生成更符合营销需求的产品图像。在教育应用中,PLADIS能够帮助AI更好地理解教学内容描述,生成更准确的教学辅助图像。

温度调节实验显示了PLADIS的另一个有趣特性。通过调整注意力计算中的温度参数,可以进一步优化PLADIS的效果。较低的温度会使注意力分布更加尖锐,这与稀疏注意力的目标一致。实验结果表明,适当降低温度可以增强PLADIS的效果,但这种增强有一个最佳点,超过这个点后效果会趋于平稳。

跨语言测试虽然不是研究的重点,但初步结果显示PLADIS对不同语言的文字描述都有改进效果。这说明PLADIS改进的是注意力机制本身,而不依赖于特定语言的特性,这为其在全球范围内的应用奠定了基础。

六、深入的消融实验:每个设计选择都有科学依据

研究团队进行了详尽的消融实验来验证PLADIS设计中每个组件的必要性和最优配置。这些实验就像精密的"解剖"过程,帮助我们理解PLADIS为什么如此有效,以及如何进一步优化其性能。

关于α参数的选择,研究团队测试了从1.0到2.0的多个数值。α=1.0对应传统的Softmax注意力,随着α值增加,注意力变得越来越稀疏。实验结果显示,α=1.5时在各项指标上都达到了很好的平衡。虽然α=2.0在FID和CLIPScore上表现最佳,但在ImageReward上略逊于α=1.5,而且计算复杂度也更高。因此,α=1.5成为了默认的推荐设置。

λ参数的消融实验更是揭示了PLADIS外推策略的重要性。当λ=0时,系统完全使用传统注意力;当λ=1时,系统使用纯稀疏注意力;当λ>1时,系统进行外推增强。实验结果清楚地显示,λ=2.0时效果最佳,这个设置不仅在数值指标上表现优异,在视觉质量上也最令人满意。

有趣的是,研究团队发现λ值过高会导致类似于CFG中指导尺度过高时的问题——图像会变得过于平滑,失去细节。这个发现帮助确定了λ的合理取值范围,也为用户在不同应用场景中调整参数提供了指导。

层级选择的消融实验回答了一个重要问题:PLADIS应该应用在网络的哪些层上?U-Net架构通常分为下采样、中间层和上采样三个部分,每个部分都包含多个注意力层。实验结果显示,将PLADIS应用到所有交叉注意力层时效果最佳,这避免了需要手动选择目标层的麻烦,也确保了改进效果的最大化。

注意力类型的对比实验证实了交叉注意力是PLADIS发挥作用的关键位置。当PLADIS应用于自注意力时,效果有限甚至可能产生负面影响,因为自注意力主要负责图像内部的空间关系建模,过度稀疏化可能会破坏这种建模。而交叉注意力负责文字和图像之间的对应关系,稀疏化可以帮助AI更好地聚焦于关键的语义信息。

计算效率的详细分析显示,PLADIS的额外开销主要来自α-Entmax的计算。对于α=1.5,存在高效的封闭形式解,计算开销相对较小。对于α=2.0,虽然需要更复杂的计算,但由于其等价于Sparsemax,仍然可以通过优化的算法高效实现。相比之下,其他α值可能需要迭代求解,计算成本显著增加。

外推策略的对比实验揭示了PLADIS设计的巧妙之处。研究团队比较了几种不同的外推方式,包括在模型内部进行外推和在输出层面进行外推。结果显示,在注意力层内部进行外推(即PLADIS采用的方式)效果最佳,而在输出层面进行外推虽然也有改进,但效果有限且计算开销更大。

稀疏性程度的可视化分析提供了直观的理解。研究团队绘制了注意力权重的分布图,清楚地展示了稀疏注意力是如何工作的。在传统注意力中,权重分布相对均匀,每个token都获得一定的关注。而在稀疏注意力中,权重高度集中在少数几个关键token上,其他token的权重接近或等于零。

温度参数的进一步实验显示了PLADIS与传统注意力优化技术的互补性。降低温度可以使注意力分布更加尖锐,这与稀疏化的目标一致。当PLADIS与适当的温度调节结合时,可以获得更好的效果。不过,研究团队发现,PLADIS本身已经能够提供足够的改进,额外的温度调节带来的收益相对有限。

跨数据集的消融实验证实了PLADIS的泛化能力。无论是在艺术风格的描述上,还是在照片级真实感的描述上,PLADIS的各个组件都表现出一致的效果。这种一致性说明PLADIS改进的是注意力机制的基本特性,而不是针对特定类型内容的优化。

批处理大小和序列长度的测试显示,PLADIS的效果不受这些因素的显著影响。无论是短小精悍的描述还是详细冗长的描述,PLADIS都能带来一致的改进。这种稳定性对于实际应用来说非常重要,因为用户的描述长度和风格往往变化很大。

最后,研究团队还测试了PLADIS在不同硬件配置下的表现。无论是高端的GPU还是相对普通的计算设备,PLADIS都能稳定工作并带来预期的改进。这种硬件兼容性确保了PLADIS可以在各种实际应用环境中部署。

说到底,PLADIS为AI绘画领域带来了一个既简单又强大的改进方案。它不需要重新训练昂贵的模型,不需要额外的计算步骤,也不需要复杂的超参数调节,只需要在现有系统中替换一个数学函数,就能显著提升AI对文字描述的理解能力和图像生成质量。

这项研究的意义远不止于技术改进本身。它展示了如何通过深入理解现有技术的数学原理,找到巧妙而有效的改进方案。稀疏注意力的应用不仅解决了AI绘画中的文字理解问题,还为其他需要处理多模态信息的AI系统提供了有价值的启发。

对于普通用户来说,PLADIS意味着AI绘画工具将变得更加"贴心"和"聪明"。你不再需要反复修改文字描述来获得满意的结果,AI能够更准确地理解你的意图,生成更符合期望的图像。对于开发者来说,PLADIS提供了一个低成本、高效果的系统升级方案,可以立即改善现有产品的用户体验。

随着AI技术的不断发展,像PLADIS这样的创新将继续推动人机交互向更自然、更智能的方向发展。未来,我们可能会看到更多基于这种"专注机制"的改进,让AI不仅能更好地理解我们说什么,还能更好地理解我们为什么这样说,从而提供更贴近人类思维方式的智能服务。研究团队已经将相关代码开源,感兴趣的读者可以在GitHub上找到完整的实现,亲自体验这项技术带来的改进效果。

Q&A

Q1:PLADIS是什么?它解决了什么问题? A:PLADIS是三星研究院开发的AI绘画改进技术,主要解决AI画图时"答非所问"的问题。比如你要红色的猫,AI可能给你蓝色的狗。PLADIS通过改进AI的"注意力机制",让AI更专注于文字描述中的关键信息,从而生成更准确匹配用户需求的图像。

Q2:使用PLADIS会不会增加很多计算成本? A:不会。PLADIS的设计非常高效,每张图片只增加约0.56秒计算时间和0.01GB内存使用,对于通常需要几秒到几分钟的图像生成过程来说几乎可以忽略不计。而且它不需要重新训练AI模型,是真正的"即插即用"方案。

Q3:普通用户如何使用PLADIS技术? A:目前PLADIS主要面向AI绘画系统的开发者,研究团队已在GitHub开源相关代码。普通用户需要等待各大AI绘画平台集成这项技术。由于PLADIS兼容性很好,预计很快就会在主流AI绘画工具中看到它的应用。

来源:至顶网

相关推荐