我们的论文旨在学习一种视觉艺术风格的表示形式,该表示形式从语义内容中更强的解离出来,我们使用神经风格转换(NST)来测量和驱动学习信号,并在明确解离度量上实现了最先进的表示学习。我们表明,强调风格和内容的解离会在风格特定度量方面取得大量收益,编码较少的语义信息并在下游多模态应用中实现最先进的准确性。
Apr, 2023
ArtFusion提出一种新方法,使用Dual-cLDM,通过单图像在模型训练期间同时保留内容和风格,提高多样性。
Jun, 2023
通过提出一种新的内容和风格(C-S)分离框架来实现风格迁移,利用CLIP图像空间中的显式内容信息提取和隐式学习得到互补风格信息,以实现可解释和可控的C-S分离和风格迁移,通过扩展扩散模型的风格去除和生成能力,实现了卓越的结果和灵活的C-S分离与权衡控制,为风格迁移中的C-S分离提供了新的见解并展示了扩散模型在学习良好分离的C-S特征方面的潜力。
Aug, 2023
通过理论分析和实验,本研究展示了扩散模型在零样式转换的有效性和优越性,并引入了交叉注意力重排策略,使样式信息能够直接提取并无缝集成到内容图像中。
Nov, 2023
基于预训练大规模扩散模型的一种新的艺术风格转换方法,通过操作自注意力层的特征作为交叉注意力机制的方式,实现样式的传递和内容的保留,并解决原始内容的破坏和样式颜色不协调的问题,证明在传统和基于扩散的风格转换基准测试中超越了现有方法。
Dec, 2023
神经风格迁移的评估方法和指标存在着不一致性和局限性,为了促进方法之间更有意义、更公平的比较,以及对研究结果的理解和解释的提升,我们提供了对现有评估技术的深入分析,并提出了标准化评估实践的建议。
Jan, 2024
DiffStyler是一种新方法,通过利用基于LoRA的文本到图像扩散模型来实现高效且精确的任意图像风格转移,该方法结合了跨LoRA特征和注意注入的策略,旨在在内容保持和风格整合之间取得更和谐的平衡。
Mar, 2024
提出了一种名为LSAST的新型基于预训练扩散的艺术风格转换方法,能够生成高度逼真的艺术化风格图像,并在保留输入图像的内容结构方面表现出较好的效果,而不引入明显的伪影和不协调的风格图案。
Apr, 2024
通过使用2D图像扩散模型来改良3D场景,我们提出了一种简单但有效的流程;通过细化源NeRF模型以及使用风格化图像生成的样式对齐的图像扩散模型,实现3D风格转移。
Jun, 2024
本研究解决了现有风格迁移方法在内容和风格之间平衡不足的问题。我们提出了一种新颖的无训练方法,通过将文本嵌入与空间特征相结合,并分开注入内容和风格,从而改善风格迁移效果。实验表明,该方法在实现平衡和可控的风格迁移结果方面表现出色,并具有扩展到其他任务的潜力。
Oct, 2024