DeepSVG:用于矢量图形动画的分层生成网络
在本文中,我们提出了一种新的神经网络,可以生成具有不同拓扑结构的复杂矢量图形,并仅需要来自现有光栅图像的间接监督,为此我们使用了可微栅格化流水线来渲染生成的矢量图形并将它们组合到光栅画布上。
Feb, 2021
该研究使用扩散模型和分数蒸馏采样,通过对像素图像的文本条件训练生成可导出为SVG的矢量图形,并在优化可微分的矢量图形栅格化器方面实现了语义知识的提取,实验结果表明其较之于过去的工作具有更高的生成质量和更丰富的样式,包括像素艺术和手绘图。
Nov, 2022
IconShop是一种使用自回归变换器的文本引导矢量图标合成方法,通过将SVG路径(和文本描述)串行化和分词为一个唯一可解码的命令序列,实现各种图标合成和操作任务,它优于现有的基于图像和基于语言的方法,在图标合成性能(使用FID和CLIP分数)和质量方面都更好,并具有更好的生成多样性和灵活性,同时还可以进行文本引导的图标填充和混合合成。
Apr, 2023
研究进行了关于机器学习兼容的矢量化方法的研究,发现尽管现有的方法能够直接指定形状数量和类型,但其工作时间很长且无法准确重现原始图像,因此我们认为没有快速的通用自动方法,需要对每种方法进行人工控制。
Jun, 2023
本文提出了SAMVG,一种多阶段模型,用于将光栅图像转换为可缩放矢量图形(SVG)。经过一系列广泛的实验,我们证明SAMVG可以在任何领域内生成高质量的SVG,同时所需的计算时间和复杂性较之前的最新方法更少。
Nov, 2023
通过引入我们的方法(Simple-SVG-Generation,简称S extsuperscript{2}VG extsuperscript{2}),我们专注于生成准确且简单的SVG图像,与人类的可读性和理解力相一致,通过与先进的语言模型一起进行推理任务的简单图像评估,结果显示与先前的SVG生成方法相比有明显的改进。我们还对生成的SVG可读性进行了人类评估的调查,结果也对我们的方法持利好态度。
Nov, 2023
Scalable Vector Graphics (SVGs) have become integral in modern image rendering applications. This paper introduces StarVector, a multimodal SVG generation model that effectively integrates Code Generation Large Language Models (CodeLLMs) and vision models.
Dec, 2023
SVGCraft是一个新颖的整体场景生成框架,通过使用预训练的语言模型进行布局生成、精确物体定位和融合机制,以及使用漫扩散U-Net进行合成,优化生成的SVG图像,并探索在受限环境中利用原始形状进行画布补全的潜力。通过定性和定量评估,SVGCraft在抽象性、可识别性和细节方面超越了之前的工作。
Mar, 2024
提出了一种基于超像素的矢量化模型SuperSVG,它通过将输入图像分解成超像素,采用两阶段自训练框架和动态路径扭曲损失来实现图像的快速高精度矢量化。与现有方法相比,该方法在重建精度和推理时间方面表现出更优的性能。
Jun, 2024
通过使用VGBench数据集和评估管道,我们发现大型语言模型(LLMs)在处理矢量图方面表现出很强的能力,尤其在视觉理解和生成方面,但在低级格式(SVG)上表现不佳。
Jul, 2024