关键词shared attention mechanism
搜索结果 - 2
- CVPRMulT: 一种端到端的多任务学习变压器
我们开发了一种称为 MulT 的端到端多任务学习 Transformer 框架,用于同时学习多个高级视觉任务,包括深度估计、语义分割、重着色、表面法线估计、2D 关键点检测和边缘检测。我们的框架基于 Swin transformer 模型, - ACL神经自动后编辑系统解释的共享注意机制
本文提出了一种神经自动后编辑系统,该系统使用两个独立编码器对源句子和机器翻译句子进行编码,并利用共享注意力机制更好地理解两个输入对于后编辑句子生成的贡献,其已在 WMT16 和 WMT17 APE IT domain 英德共享任务的官方数据