利用变形场进行视觉数据重定向
提出一种基于 seam carving 的新型视频重定向算法,通过动态时空缓冲区的能量图和标准差运算符,去除具有较低能量变化的区域,同时采用一种改进的能量函数来考虑运动信息,对现有的视频重定向方法进行比较。实现了 93% 的处理时间降低和更高的帧一致性。
Mar, 2019
近期在三维模型方面的深度学习研究取得突破,主要集中在生成、检测和场景理解。为了应对大型训练数据集的挑战,我们引入了一种基于拼接裁剪的新颖三维模型增强方法,称为高效三维拼接裁剪(E3SC),它在保证整体语义不受影响的同时,逐步变形输入模型的部分区域。实验证明,我们的方法能够在各种类型和风格的输入模型上生成多样且高质量的增强三维形状,并相对于之前的方法取得了显著的改进。定量评估表明,我们的方法有效提升了其他后续三维生成算法所生成形状的新颖性和质量。
May, 2024
本论文提出了一种基于内容感知裁剪的图像重塑方法,该方法通过生成源图像的重要性映射并使用语义分割和显著性检测模型计算初步扭曲网格,然后结合扭曲度量以确保最小变形,并使用内容感知裁剪算法生成新的目标图像,通过 RetargetMe 基准测试的用户研究分析表明我们的方法在执行时间的一小部分内胜过了其他现有的方法。
Mar, 2022
无需对齐的图像集合,基于拓扑意识的隐式形变场的学习、随后进行形状重构,该方法名为 TARS,在多个数据集中均取得了最先进的重构精度 (ShapeNet, Pascal3D+, CUB, and Pix3D chairs)。
May, 2022
该研究论文介绍了使用服装缝合图案和面向点的注意力模型 NeuralTailor,来解决在 SocialVR、表演捕捉和虚拟试衣等领域中,虚拟世界中真实服装重建的挑战。
Jan, 2022
本文提出了一种名为 Local Editing NeRF(LENeRF)的方法,可以通过文本输入进行精细和本地化的 3D 内容操作,其中利用了三种 add-on 模块:潜在残差映射器、注意场网络和变形网络,通过估算 3D 注意场来实现 3D 特征的局部操作。
Jun, 2023
本文提出了第一个基于深度学习的图像矩形化解决方案,使用预设的刚性目标网格和全卷积网络进行初始网格的预测,并提出了一个全面的目标函数以同时提高边界矩形化、网格形状保持和内容自然性,实验结果表明本方案在数量和质量上均优于传统方法。
Mar, 2022
本文利用平滑变形场学习如何进行语义图像编辑,并应用生成对抗网络的最新进展使模型能够使用不成对的数据进行训练,实现了高分辨率(4K 图像)的人脸编辑。同时,还展示了在 Cub200 鸟类数据集上进行的高质量图像编辑结果,并且采用的方法更好地保留了原始图片中主体的信息。
Nov, 2018
通过基于部件的隐式形状模型,我们设计了一种可以控制 3D 头像的方法,可以推断局部语义 Rig,包括面部特征,通过局部控制丰富了隐式形变字段,使其具有更强的局部控制性能。
Apr, 2023
本文提出了一种新颖的语义驱动的 NeRF 编辑方法,用户只需使用一张图像,就能够对神经辐射场进行编辑,并以高保真度和多视角一致性准确地传达编辑后的新视图,该算法在实际和合成数据上的实验和编辑例子证明了其能以只有一张编辑过的图像产生逼真的 3D 编辑。
Mar, 2023