BriefGPT.xyz
Ask
alpha
关键词
attention-based encoder-decoder models
搜索结果 - 3
通过声学和语义合作解码重新思考多模态视角下的语音识别
该论文提出了一种声学和语义协同解码器 ASRD,可以同时利用声学和语义特征来提高自动语音识别的性能。通过引入因果多模态屏蔽,可以防止在训练期间的信息泄漏,并且还提出了一种改良版的半监督 ASCD 来平衡准确性和计算成本。实验结果表明,ASR
→
PDF
a year ago
IJCAI
探索和提取跨模态信息以用于图像字幕生成
本研究提出基于 Transformer 的全局与局部信息探索与提炼方法,在跨模态视角下探究图像字幕生成,并在 COCO 测试集上取得了 129.3 的 CIDEr 分数。
PDF
4 years ago
神经机器翻译编解码模型的校准
本文研究了几种基于注意力编码器 - 解码器模型的最新神经机器翻译 (NMT) 系统的校准。我们表明,大多数现代 NMT 模型即使在给定真正的先前标记的情况下,其校准水平也惊人地失准。 探讨了失误的两个原因:EOS 和注意力不确定性的严重失校
→
PDF
5 years ago
Prev
Next