关键词state of the art results
搜索结果 - 10
- 无人机采集的可见光和红外图像对的深度图像对齐
本论文提出了一种基于深度学习的多模态图像对齐解决方案,通过使用卷积神经网络的特征嵌入模块,实现了无需使用基于 Lucas-Kanade (LK) 方法即可取得与最先进方法相媲美的结果。我们的方法在四个航拍数据集上进行了测试,与现有的最新深度 - 合成数据识别足球运动员球衣号码
本文提出了一种新的方法来解决在 Seattle Seahawks 体育练习视频中,基于球衣号码的自动识别仍然具有挑战性的问题,我们的结果表明,使用合成数据可以显著地提高球衣号码检测任务的性能(总体精度可提高~9%,低频数字可提高~18%), - ECCV在线元学习的多源和半监督领域适应
该论文提出一种基于元学习的框架来进一步增强现有领域适应算法的性能,通过在线的最短路径元学习框架改进了无监督和半监督多源领域适应技术 (DANN,MCD 和 MME),实验表明达到了多项 DA 基准的最佳效果。
- 具有属性感知上下文流的程序性阅读理解
该研究介绍了一种用于程序化阅读理解的算法,将文本转换成一般的形式,将过程表示为实体属性的转换序列,利用预训练的语言模型,同时预测实体属性和它们的转换,实现了对 ProPara 和 npn-cooking 两个数据集的最新成果。
- ACL视觉感知下的翻译精炼
我们提出了一个翻译和完善的方法,通过使用视觉信息来提高目标语言文本上下文的使用以及恢复源语言中错误或缺失的单词,从而实现多模态机器翻译的最新成果。
- AAAI基于门控全连接网络的语义分割方法 GFF
本文提出一种名为 Gated Fully Fusion(GFF)的新架构,使用门控方式全连接地选择性地融合来自多个层级的特征,以改善深度卷积神经网络高层特征对小 / 细对象精细信息的损失,并在多个数据集上取得了业界最优的结果。
- 卷积神经网络实现准确、高效、无限制的文字识别
文章提出了一种数据高效,端到端的神经网络模型用于通用的非受限文本识别,并通过在七个公共数据集上达到最优结果,表明了这种模型的通用性和优越性。
- 使用多尺度连续 CRFs 作为顺序深度网络进行单目深度估计
本文提出了一种基于多尺度卷积神经网络、条件随机场及其连续形式的深度学习模型,用于单张静态图片的单目深度估计,该模型使用连续性的 CRF 完成深度估计,同时提出两个不同的变体,其中一个建立了多个 CRF 级联模型,另一个提出了一种结合模型;最 - ACL硬性单调注意力下的形态变化生成
提出了一种神经模型,可用于形态学词形变化生成,该模型采用硬注意机制,基于单词中的字符与其变形中字符之间通常发现的近单调对齐。在三个以前研究过的形态学词形变化生成数据集上评估了该模型,并展示了它相对于以前的神经和非神经方法在各种设置下提供的最 - 使用带有一般散度函数的近端梯度方法加速随机变分推断
提出了一种基于随机梯度方法的变分推断新方法,不仅利用变分参数空间的几何性质,而且即使对于非共轭模型也可以产生简单的闭合式更新,该方法也具有收敛速率分析,即使用于非凸目标的随机镜像下降。在多种问题上,实验证明新算法在该框架中导出可以导致最先进