BriefGPT.xyz
Ask
alpha
关键词
cv
搜索结果 - 6
AAAI
HRDoc: 文档结构的分层重构的数据集和基准方法
本文提出了一种新的任务:层次化重建多页文档的语义结构,并介绍了基于编码 - 解码结构的层次性文档结构分析系统 (DSPS) 来解决该问题。通过采用多模式双向编码器和结构感知 GRU 解码器,以及软屏蔽操作,DSPS 模型的表现优于基线方法。
→
PDF
a year ago
强化学习中 Transformer 的调研
本文系统回顾了使用 Transformer 在强化学习领域的动机和进展,提供了现有工作的分类,讨论了每个子领域,并总结了未来的发展前景。
PDF
a year ago
使用树来近似计算 1-Wasserstein 距离
本篇论文介绍了一种基于树状嵌入的 Wasserstein 距离的计算方式,通过 L1 正则化方法来学习树的边缘权重,并通过 Lasso-based 回归问题实现最短路径距离的表示,从而近似计算 1-Wasserstein 距离。通过实验结果
→
PDF
2 years ago
多模态知识库下的多模态实体标记
本文提出了一个新的任务叫做多模态实体标记 (MET) 以及一个多模态知识库,并开发了一个数据集以解决该问题。使用信息检索范式解决此任务并使用 NLP 和 CV 中最先进的方法实现了几个基线。结果表明,该任务具有挑战性,但当前技术可以实现相对
→
PDF
3 years ago
知识增强的预训练模型调查
本次研究综述了在 NLP 和 CV 领域中,通过注入知识的预训练模型(KEPTMs)在解决预训练模型领域中鲁棒性和可解释性差的问题上取得了重要进展,同时对现有 KEPTMs 进行了系统分类,并提出了未来研究的潜在方向。
PDF
3 years ago
CAT: 视觉 Transformer 中的交叉注意力
探索使用 Cross Attention 机制替代传统的 self-attention 机制在计算机视觉任务中实现 Transformer 的实用性,实验表明该机制在 ImageNet-1K、COCO 和 ADE20K 等任务上可以达到先进
→
PDF
3 years ago
Prev
Next