BriefGPT.xyz
Ask
alpha
关键词
multi-modal problem
搜索结果 - 4
关于非自回归翻译中的信息冗余
在这项研究中,我们重新审视了最近提出的全非自回归翻译模型中的多模态问题,并揭示了这些先进模型引入了其他类型的信息冗余错误,无法由传统指标 - 连续重复比率来衡量。通过手动注释非自回归翻译模型的输出,我们确定了与词汇和重新排序的多模式问题相符
→
PDF
2 months ago
从目标、路径点和路径到长期人类轨迹预测
该研究提出了一种将样本不确定性分解为先验不确定性和随机不确定性的模型,其中使用了新颖的长期轨迹预测设置,提出了一种名为 Y-net 的场景符合轨迹预测网络。Y-net 在多个数据集上的表现明显优于之前的工作,并对长期预测表现出多样性轨迹预测
→
PDF
4 years ago
询问神经元:视觉问答的深度学习方法
本文介绍了如何通过结合图像表示和自然语言处理的最新进展来解决实际图像的问答任务,并提供了两个新的度量标准来分析人类共识以及如何在 DAQUAR 数据集上调整我们的方法以获得更好的性能。
PDF
8 years ago
ICCV
问你神经元:基于神经网络的图像问答系统
利用图像表示和自然语言处理的最新进展,我们提出了一种端到端形式的 Neural-Image-QA 解决方案来回答真实世界图像上的问题,我们面临一个多模态问题,其中语言输出(答案)是基于视觉和自然语言输入(图像和问题)的,我们的方法可以使已有
→
PDF
9 years ago
Prev
Next