- SIGIR生成式检索作为多向量密集检索
生成检索是使用序列到序列架构,以端到端的方式为给定查询生成相关文档标识符的方法。本文通过研究生成检索的注意力层和预测头,揭示了生成检索与多向量稠密检索在测量文档对查询的相关性时采用相同的框架,并通过实验证明了这些方法在对齐矩阵中的术语匹配上 - 利用记忆感知的多说话人嵌入和序列到序列结构的神经说话人分离
通过使用记忆感知的多说话人嵌入与序列到序列架构(NSD-MS2S),我们提出了一种新颖的神经说话人分离系统,其整合了记忆感知的多说话人嵌入(MA-MSE)和序列到序列架构(Seq2Seq)的优势,从而在效率和性能方面都得到了提高。
- 住院信息对抽象性出院小结生成有用吗?
该论文研究了使用电子病历中的元数据来提高患者出院摘要自动生成的效率,并发现使用元数据可以提高模型精确度。
- 多模态体验启发的人工智能创作
基于多模态信息的序列到序列架构和课程负采样策略被设计,以解决基于人类经验生成文本的新问题,并在新的多模态体验数据集上进行了广泛的实验,取得了较大的改进。
- ACL用于组合泛化的解开序列生成的学习模型
本文提出了一种基于源输入逐步自适应重编码的 sequence-to-sequence 模型扩展,以此来鼓励解开编码时存在的混淆状态。最终实验结果表明,这个扩展能够提供更好的解释性和推广性。
- MM占位符翻译中目标端屈折变形建模
本文提出了一种能够通过序列到序列的架构,将用户指定的术语以正确的形式融入到最终的翻译结果中,从而解决了现有 Placeholder 翻译系统无法灵活处理语法和语境的问题。
- ACL利用元词生成神经响应
本文提出了使用元词汇的开放域回复生成方法,通过增强序列到序列结构的目标跟踪记忆网络,以元词汇表达为目标来控制生成过程,从而在回复的关联性、多样性、一对多建模准确性、元词汇表达准确性和人类评估方面显著优于其他现有方法。
- 基于人体关键点估计的神经手语翻译
提出了一种基于人类关键点估计的手语翻译系统,使用高分辨率的韩国电子技术研究所 (KETI) 手势语言数据集在序列 - 序列架构下训练,证明了我们的方法具有鲁棒性,可以将手势视频翻译成自然语言句子并达到 93.28% 的翻译准确率。
- 从不流畅的言语走向流利的翻译
本文提出了一种在端到端语音翻译模型中加入中间步骤的方法,以去除交谈式语音中的不流利现象,并引入了清理后的 Fisher 西班牙语 - 英语数据集,为清理含绕口令语音的翻译提供了一个基准。
- 语言无关端到端自动语音识别的迁移学习与语言模型融合
本文探讨了一种更好的适应低资源语言的方法,采用外部语言模型(LM)在转移学习框架下。通过在共享词汇表的统一序列到序列(S2S)架构中构建语言无关的 ASR 系统,并在整个适应阶段将外部 LM 集成到基于注意力的 S2S 模型的解码器网络中的 - EMNLP基于字符的神经机器翻译:容量和压缩的再思考
本论文通过设计深度模型对字符级信息进行序列到序列建模,并且验证了该模型优于传统的基于单词片段的模型,从而为字符级神经机器翻译提供了参考。同时,通过评估多种字符级 NMT 技术,发现它们不能与深层字符基线模型的表现相匹配。最后,我们还在该框架