对话中的噪音来源及其处理方法
通过在 500,000 个有噪声的句子的合成语料库中训练,并在多个语料库中进行评估,研究和减轻来自自动语音识别系统的噪声对几个问题回答任务的影响,并利用模型的置信度集成和对未知单词进行强制解码,从而提高了下游神经网络 QA 系统的准确性。
Aug, 2019
本文研究 Question-Answering 系统在实际部署中的问题,发现在回答引擎之前的管道部件可能会引入多样化且可观的错误,而且即使是针对强大的预训练 QA 模型,性能也会因为这些上游噪声源而显著降低。作者认为在 QA 系统能够真正有效部署之前,还有很大的改进空间。因此,他们强调 QA 评估需要扩展到考虑实际使用情况,并希望他们的研究结果能引起更广泛的关注。
Feb, 2021
本文探讨了并行训练数据中各种类型的噪声对神经机器翻译系统性能的影响,通过创造并分析五种人造噪声的方式来研究神经机器翻译和统计机器翻译的性能下降,发现神经模型通常比统计模型更容易受到噪声的影响。
May, 2018
本文介绍了我们在第十届对话系统技术挑战赛第二轨知识引导的任务导向对话建模中的提交内容。在适应 ASR 转录的噪声方面探索不同的方法来使得模型更加健壮,并采用噪声通道模型来适应口语交流的风格。我们的最佳系统在挑战的自动和人工评估中分别排名第一和第三。
Dec, 2021
本研究分析了不同类型的标签噪声对深度学习的影响,提出了一种基于特征相关性的标签噪声生成方法,并提供了常用基准数据集的标签噪声以便其他研究人员测试其算法。
Mar, 2020
本篇调查研究基于深度学习的对话系统,综述了当前对话系统的研究成果,并分析了模型类型和系统类型两个角度。此篇研究是目前最全面和最新的,深入涵盖了流行的技术,为对话系统领域的新手和想要快速了解最新技术的专业人员提供了很好的启示。
May, 2021
通过研究七种噪声类型对话系统中意图分类和槽位标记模型在真实环境中出现的问题,我们设计了一种增加数据的方法来提高模型性能,使得我们能够训练出一个在各种噪声现象下都具有鲁棒性的 IC/SL 模型。
Apr, 2021
本文探讨了信息抽取模型中两种不同类型的噪声:来自远程监督和来自管道输入特征的噪声,并针对实体类型和关系提取等任务提出了使用神经网络模型的多实例多标签学习算法,以及改进噪声实体类型预测和关系提取间的整合方法,通过实验证明概率预测比离散预测更加鲁棒,并联合训练两个任务的效果最好。
Dec, 2016
本研究提出了 DenoiSpeech 系统,它可以处理具有高噪声变异的实际世界噪声,使用细粒度的帧级噪声建模噪声条件模块与 TTS 模型共同训练,实验结果表明,DenoiSpeech 在真实环境数据上的性能要优于之前提出的两种方法 0.31 和 0.66 MOS。
Dec, 2020
本文针对任务导向的对话系统中的意图识别和参数标记存在的过度敏感问题,介绍了构建对抗性测试集和采用对抗性训练方法和数据增强来提高模型健壮性的解决方案。实验结果表明,这些技术的组合能显著提高系统的健壮性。
Nov, 2019