对话中的噪音来源及其处理方法

Dec, 2022

Sources of Noise in Dialogue and How to Deal with Them

Derek Chen, Zhou Yu

TL;DR本文提出了一种针对会话设置的数据清洗算法，通过构建一些噪音分类法，并在多个实验中展示不同模型在遇到不同噪音时的表现，我们的研究发现，尽管现有的去噪声算法能够很好地解决标签错误问题，但是对话式噪音对模型的表现有着负面影响。

Abstract

Training dialogue systems often entails dealing with noisy training examples and unexpected user inputs. Despite their prevalence, there currently lacks an accurate survey of dialogue noise, nor is there a clear sense of the impact of each noise type on →

dialogue systems noise taxonomy data cleaning algorithm task performance denoising algorithms

发现论文，激发创造

缓解问题回答中的噪声输入

通过在 500,000 个有噪声的句子的合成语料库中训练，并在多个语料库中进行评估，研究和减轻来自自动语音识别系统的噪声对几个问题回答任务的影响，并利用模型的置信度集成和对未知单词进行强制解码，从而提高了下游神经网络 QA 系统的准确性。

Aug, 2019

NoiseQA: 以用户为中心的问答挑战数据集评估

本文研究 Question-Answering 系统在实际部署中的问题，发现在回答引擎之前的管道部件可能会引入多样化且可观的错误，而且即使是针对强大的预训练 QA 模型，性能也会因为这些上游噪声源而显著降低。作者认为在 QA 系统能够真正有效部署之前，还有很大的改进空间。因此，他们强调 QA 评估需要扩展到考虑实际使用情况，并希望他们的研究结果能引起更广泛的关注。

Feb, 2021

不同类型噪音对神经机器翻译的影响

本文探讨了并行训练数据中各种类型的噪声对神经机器翻译系统性能的影响，通过创造并分析五种人造噪声的方式来研究神经机器翻译和统计机器翻译的性能下降，发现神经模型通常比统计模型更容易受到噪声的影响。

May, 2018

使用数据增强和噪声通道模型将基于文档的对话系统适应为口语对话

本文介绍了我们在第十届对话系统技术挑战赛第二轨知识引导的任务导向对话建模中的提交内容。在适应 ASR 转录的噪声方面探索不同的方法来使得模型更加健壮，并采用噪声通道模型来适应口语交流的风格。我们的最佳系统在挑战的自动和人工评估中分别排名第一和第三。

Dec, 2021

标签噪声类型及其对深度学习的影响

本研究分析了不同类型的标签噪声对深度学习的影响，提出了一种基于特征相关性的标签噪声生成方法，并提供了常用基准数据集的标签噪声以便其他研究人员测试其算法。

Mar, 2020

基于深度学习的对话系统的最新进展：系统调查

本篇调查研究基于深度学习的对话系统，综述了当前对话系统的研究成果，并分析了模型类型和系统类型两个角度。此篇研究是目前最全面和最新的，深入涵盖了流行的技术，为对话系统领域的新手和想要快速了解最新技术的专业人员提供了很好的启示。

May, 2021

面向目标对话系统中意图分类和槽位标记对现实世界噪声的鲁棒性研究

通过研究七种噪声类型对话系统中意图分类和槽位标记模型在真实环境中出现的问题，我们设计了一种增加数据的方法来提高模型性能，使得我们能够训练出一个在各种噪声现象下都具有鲁棒性的 IC/SL 模型。

Apr, 2021

神经实体类型和关系抽取的噪声缓解

本文探讨了信息抽取模型中两种不同类型的噪声：来自远程监督和来自管道输入特征的噪声，并针对实体类型和关系提取等任务提出了使用神经网络模型的多实例多标签学习算法，以及改进噪声实体类型预测和关系提取间的整合方法，通过实验证明概率预测比离散预测更加鲁棒，并联合训练两个任务的效果最好。

Dec, 2016

DenoiSpeech：基于帧级噪声建模的去噪语音合成

本研究提出了 DenoiSpeech 系统，它可以处理具有高噪声变异的实际世界噪声，使用细粒度的帧级噪声建模噪声条件模块与 TTS 模型共同训练，实验结果表明，DenoiSpeech 在真实环境数据上的性能要优于之前提出的两种方法 0.31 和 0.66 MOS。

Dec, 2020

提高任务导向对话系统的鲁棒性

本文针对任务导向的对话系统中的意图识别和参数标记存在的过度敏感问题，介绍了构建对抗性测试集和采用对抗性训练方法和数据增强来提高模型健壮性的解决方案。实验结果表明，这些技术的组合能显著提高系统的健壮性。

Nov, 2019