DreamStyler 是一种新的框架,用于艺术图像合成,具备文本到图像合成和风格转换的能力,通过多阶段的文本嵌入和上下文感知的文本提示来优化图像质量,并具备适应一系列风格参考的灵活性,实验证明其在多种场景下的卓越性能,显示出在艺术产品创作方面的潜在优势。
Sep, 2023
我们提出了一种图像风格转化的训练方法,通过使用损失函数来约束不同区域的风格强度,并引入了一种特征融合方法,通过线性转换内容特征来保持其语义关系,该方法在大量实验证明了其有效性。
Oct, 2023
引入了一个新的任务,即以语言为驱动的艺术风格转移(LDAST),通过文本引导操纵内容图像的风格,所提出的对比语言视觉艺术家(CLVA)可以从风格指令中提取视觉语义并通过分块风格鉴别器实现 LDAST。
Jun, 2021
本研究通过文本描述实现了基于文本条件的风格转换,评估了文本条件图像编辑和风格转换技术对精确 “局部” 风格转换的细粒度理解,发现当前方法在有效完成局部风格转换方面存在问题。因此,我们设计了一个端到端的流程,根据用户的意图,确保局部风格转换的有效性,并通过定量和定性分析证明了我们方法的有效性。
May, 2024
通过简单的文本描述,我们提出了 “Soulstyler” 框架,让用户可以引导对特定物体进行图像风格化处理。我们介绍了一个大型语言模型来解析文本,识别风格化的目标和具体风格,并结合基于 CLIP 的语义视觉嵌入编码器,使模型能够理解并匹配文本和图像内容。同时,我们还引入了一种新颖的局部文本 - 图像块匹配损失函数,确保风格转换仅针对指定的目标对象,而非目标区域保持原始风格。实验结果表明,我们的模型能够根据文本描述准确进行目标对象的风格转换,而不影响背景区域的风格。
Nov, 2023
提出了一种名为 LSAST 的新型基于预训练扩散的艺术风格转换方法,能够生成高度逼真的艺术化风格图像,并在保留输入图像的内容结构方面表现出较好的效果,而不引入明显的伪影和不协调的风格图案。
Apr, 2024
本文提出了一种基于单张画作的有学习能力的文字描述的艺术风格逆推算法(InST),能够高效地捕捉并转移绘画作品的艺术风格,且经过在多个艺术家和艺术风格的多幅画作上测试验证了其质量和效率。
Nov, 2022
本文提出了一种基于扩散的非监督图像转换方法,使用分离的风格和内容表征,并使用 ViT 模型中的中间键提取多头自注意层作为内容保存损失,并匹配文本驱动风格转移的 [CLS] 分类令牌,同时使用额外的 CLIP 损失,实验结果表明,该方法在文本引导和图像引导的转换任务中优于现有的基准模型。
Sep, 2022
基于预训练大规模扩散模型的一种新的艺术风格转换方法,通过操作自注意力层的特征作为交叉注意力机制的方式,实现样式的传递和内容的保留,并解决原始内容的破坏和样式颜色不协调的问题,证明在传统和基于扩散的风格转换基准测试中超越了现有方法。
Dec, 2023
本文介绍了一种创新的基于预训练大型扩散模型的风格转换方法 FreeStyle,无需进一步优化,通过对所需风格的文本描述,实现风格转换,并且实验结果表明了其在不同内容图像和风格文本提示下的高质量综合和保真度。
Jan, 2024