Sketch-R2CNN: 基于注意力机制的矢量草图识别网络
本研究提出了一种基于递归神经网络的手绘图形识别架构,通过利用深度草图特征和加权每个时步损失来实现在大量对象类别上的最新结果,尤其适用于在线识别对象。
Aug, 2016
该研究介绍了 Sketch-RNN,它是一种基于循环神经网络(RNN)的模型,能够构建常见对象的基于笔画的绘图,并描述了生成矢量格式的连贯笔画绘图的鲁棒性训练方法。
Apr, 2017
本论文提出了SketchParse,一个深度神经网络架构,用于完全自动地解析手绘对象素描,并应用于物体识别和图像检索。SketchParse的设计采用了双层卷积网络,其中第一层包含所有对象类别的共享层,第二层包含许多专家子网络。除此之外,还介绍如何利用辅助任务物体姿态预测来提高SketchParse的性能。
Sep, 2017
提出了一种改进型的模型,即sketch-pix2seq模型,用于学习和生成多类别素描,其中替换了RNN编码器为CNN,从目标函数中删除了KL散度,实验表明其性能优于其他模型
Sep, 2017
本研究提出了一个深度哈希框架,用于人类涂鸦数据集的多重万级别检索,探索了前期文献中未被研究的涂鸦专有特征,并通过一个两支CNN-RNN的设计进行了独特人类涂鸦的特征嵌入,并开发出一个新的哈希丢失功能来适应涂鸦数据的时态和抽象特征,实现了相比静态图像的现有哈希模型更优异的表现。
Apr, 2018
本文提出了一种新的手绘草图表示方式,将其作为多个稀疏连接的图形,利用设计的多图变压器(MGT)进行学习,从多个图形中同时捕获全局和局部几何笔画结构以及时间信息;实验证明,该方法可用于在Google QuickDraw上进行草图识别,相对CNN性能上限的精度达到了72.80%,且显著优于所有基于RNN的模型。
Dec, 2019
本研究解决了手绘图像自监督表征学习的问题,提出了一种针对手绘图像的特定预处理任务和文本卷积网络的双分支架构,通过在百万级手绘图像数据集上进行的两个应用方法来证明该方法明显优于现有的无监督表征学习方法,并显著缩小了与监督表征学习之间的性能差距。
Feb, 2020
SketchGNN是一种卷积图神经网络, 用于自由绘制矢量草图的语义分割和标记。SketchGNN将输入的基于笔画的草图作为图形处理, 并使用静态-动态分支网络架构和图卷积来提取三个级别的特征:点级别、笔画级别和草图级别, 显著提高了图像语义分割的准确性。
Mar, 2020
该研究提出了一种基于Transformer的sketch领域学习模型Sketch-BERT,包括新设计的sketch嵌入网络和自监督学习的sketch gestalt,其在pre-training和downstream tasks中提高了sketch识别、检索、以及gestalt任务的表现。
May, 2020
通过将可变长度的矢量草图压缩为固定维度的潜在空间并将其作为时间和笔画的函数进行隐式编码,我们提出了SketchINR,可以改进矢量草图的表示。尽管其简单性,SketchINR在多个任务上优于现有的表示方法。
Mar, 2024