BriefGPT.xyz
Ask
alpha
关键词
change localization
搜索结果 - 2
EMNLP
R$^3$Net: 基于关系嵌入的表示重建网络用于变化描述
本文提出了一个基于关系嵌入的表示重建网络(R3Net)来明确区分真实变化和大量混乱和无关变化,并引入了外部语法骨架预测器(SSP)来增强变化定位和字幕生成之间的语义交互,实验结果表明,所提出的方法在两个公共数据集上达到了最先进的水平。
PDF
3 years ago
ICCV
基于 Transformer 的多个变化的描述和定位
本研究提出基于模拟的多变化字幕数据集并将现有单个变化字幕学习方法应用于多变化字幕任务上,此外,我们还提出 MCCFormers 方法以识别图像对中的变化区域并动态确定与句子中的单词相关的变化区域,该方法在多变化字幕评估指标方面表现出最高得分
→
PDF
3 years ago
Prev
Next