- 基于离散单元的风格转换的语音到语音翻译
直接语音到语音翻译(S2ST)结合了离散的自监督表示,取得了显著的准确性,但无法在翻译过程中保留源语音的说话人音色。我们提出了一个基于自监督模型的离散单元和神经编解码器的 S2ST 框架,用于样式转换。声学语言模型利用自监督的上下文学习,获 - DreamStyler:使用文本到图像扩散模型进行风格反演的绘画
DreamStyler 是一种新的框架,用于艺术图像合成,具备文本到图像合成和风格转换的能力,通过多阶段的文本嵌入和上下文感知的文本提示来优化图像质量,并具备适应一系列风格参考的灵活性,实验证明其在多种场景下的卓越性能,显示出在艺术产品创作 - MM基于笔画的神经绘画和风格化技术与动态预测的绘画区域
通过动态预测下一次绘画区域、预测画笔参数以及将笔触渲染到当前画布的绘画过程,提出了基于组合神经绘画家的 stroke-based rendering 框架,还借助可微分距离变换损失将该方法扩展到基于 stroke 的风格迁移,实验证明在 s - 语义风格化辐射场
我们提出了一种从任意图像向 3D 场景中的物体转移风格的方法,旨在通过最近邻损失的运用实现更加可定制和风格化的场景图像创作,并确保多视角一致性。
- WSAM: 从样式增强中产生的视觉解释作为对抗性攻击器及其在图像分类中的影响
本文提出了一种使用基于随机采样和噪音添加的样式增强算法,以改善一般线性变换的样式转移中的随机性,通过我们的增强策略,所有模型不仅在图像风格化方面表现出极高的鲁棒性,而且在 STL-10 数据集上超越了所有先前方法并超过了最先进的性能。同时, - ACL作者身份表达学习能捕捉到文体特征吗?
自动从作者的写作风格中脱离其内容是计算语言学中一个长期存在且可能难以逾越的问题。然而,最近可用的带有作者标签的大型文本语料库使得可以通过完全基于数据驱动的方式来学习作者表征,用于作者归属的任务,这个任务似乎更多地依赖于编码写作风格而不是编码 - MM提高恶意示例的可转移性:任意风格转移
通过使用不同域中的数据增强,我们提出了一种名为 Style Transfer Method(STM)的新的攻击方法,利用提出的任意风格转换网络将图像转换为不同的域,从而显著提高了对抗性可转移性。
- 基于对比损失的离线手写签名验证模型的白盒误报对抗攻击方法
本文提出了一种新颖的攻击方法,将攻击视为相关但不同书写风格之间的风格转换,通过引入两个新的损失函数来指导欺骗性图像的生成,从而提高成功攻击率并确保最小扰动;我们的方法在白盒攻击的离线手写签名验证模型中表现出卓越的性能。
- ICCVStyleDiffusion: 通过扩散模型实现可控的解耦风格转移
通过提出一种新的内容和风格 (C-S) 分离框架来实现风格迁移,利用 CLIP 图像空间中的显式内容信息提取和隐式学习得到互补风格信息,以实现可解释和可控的 C-S 分离和风格迁移,通过扩展扩散模型的风格去除和生成能力,实现了卓越的结果和灵 - TranSTYLer: 多模态行为风格转换用于面部和身体姿势生成
使用 TranSTYLer 模型,该模型基于多模态转换器,可以在保留行为形状的同时,将一个虚拟代理人的行为表现风格转移到另一个代理人身上,同时确保传达源行为的含义为主。
- FAST:面向字体无关的场景文本编辑
本文提出了一种名为 FAST 的新颖无字体场景文本编辑框架,用于在保留自然和逼真外观的同时,同时在任意样式和位置生成文本,通过结合遮罩生成和样式转移。通过滤波机制去除背景干扰,使网络仅集中于需要编辑的文本区域,同时设计了文本样式转移模块以减 - ICCV视频人体姿态转换的双向可变形运动调节
本文提出了一种新的可变形运动调制(DMM)技术,它使用具有自适应权重调制的几何核偏移来同时执行特征对齐和风格迁移,并通过双向传播来提高运动预测能力,以实现基于视频的人体姿态转移。
- DIFF-NST:用于可塑性神经风格迁移的扩散交错
神经风格迁移(NST)是将神经技术应用于修改内容图像的艺术外观以匹配参考样式图像的研究领域。我们提出使用基于扩散模型的新类模型来执行风格迁移并实现可变形式的风格迁移,展示了如何在推理时利用这些模型的先验知识,探索了该领域新方向的研究成果。
- 基于特征隐写的无泄漏风格转移技术 - StyleStegan
本研究提出了一个新的基于特征隐写的无泄露样式转换方法,使用神经流模型实现无损失的样式转换,将内容特征信息隐藏在样式化图像中并控制其后续使用权利,实验证明 StyleStegan 有效地缓解了连续可逆风格转移任务中的内容泄露问题,并且性能指标 - ICDaeLST: 轻量级快速风格转移的强度可调细节增强
我们引入了一种轻量级快速的风格迁移模型 ICDaeLST,该模型采用简单、浅层和小型结构,结合风格鉴别器、全局语义不变性损失和浅层细节注意力增强模块,实现更好的风格迁移效果和更快的处理速度。
- PP-GAN:使用带有 GAN 的地标提取器从韩国肖像到身份证照片的样式转移
该研究提出了一种基于深度学习网络和生成对抗网络的风格迁移方法,并采用面部标志遮罩保护面部特征以保留面部身份,同时使用格拉姆矩阵来考虑风格相关性,相比之前的研究表现出更好的迁移和保留性能。
- SAM 的鲁棒性:在干扰和更多领域中拆分任何事物
本研究对 Segment anything model (SAM) 模型在各种噪声、图像修饰以及逆向攻击等情境中的鲁棒性进行了全面评估,并揭示了其在形状和样式方面的偏向性。
- 通过短的生成诗歌片段让熟练读者辨识风格
本研究基于三种基于字符的 LSTM 模型,针对俄罗斯著名诗人的诗歌文本进行了风格复制任务的评估,结果表明,无论如何,专业的评估者比普通读者更能够准确地评估风格,虽然 LSTM 模型在有限的训练语料库上可以很好地复制俄罗斯诗人的风格。
- 基于模拟辅助的深度学习激光超声可视化测试
本研究提出了一种基于仿真和风格转移的数据增强方法,该方法改善了缺乏大量样本的情况下,对激光超声成像测试中存在缺陷的检测的效果。
- 基于 RGBD 图象的图像风格化实现
研究应用深度信息与 RGB 图像的热力图在风格迁移中,提出了一种新的方法,通过与传统神经网络的比较,发现其实现更为真实的图像。该方法可应用于各种计算机视觉应用中,以产生更逼真的图像。