- 利用大型语言模型作为发错流产生器提升发错流检测
利用大型语言模型(LLM)生成多样和更真实的句子作为数据增强,结合不确定性感知的数据过滤方法,提高失语检测性能,进一步增强成本效益。
- 将 NICT-JLE 语料库用于流畅度检测模型的适应
通过对 NICT-JLE 语料库进行适应性改编,本文为口语能力测试提供了一个标准化的训练、留存和测试集,以用于将来关于学习者语音中的流畅度检测的研究。
- 人工语言不流畅检测,哦不,语言不流畅产生技术为大众服务
本文提出了一种名为 LARD 的方法,该方法可以从流畅的文本中自动生成人工语言障碍,并将上下文嵌入到混淆生成中以产生逼真的上下文感知人工语言障碍,从而绕过标注数据的要求。我们的实验证明 LARD 可以在没有或只有少量数据时有效地使用,并增加 - 流式联合语音识别和语调异常检测
本研究通过基于 Transformer 框架的编码器 - 解码器模型提出了一种联合解决语音识别和流式识别中断相关的自然语言分析难题的方法,将其与传统的流水线工艺相比较,表现出更优异的准确性和实时性。
- 从流畅性检测到意图检测和槽填充
第一篇针对意图检测和槽位填充下游任务影响的流利性检测的实证研究,通过越南语进行实证,结果显示:(1)口吃会对下游的意图检测和槽位填充任务产生负面影响;(2)在口吃的情况下,预训练的多语言语言模型 XLM-R 比预训练的单语言模型 PhoBE - 基于结构化信息的语音中断检测的跨度分类
本文提出了一种新颖的检测漫游症的体系结构,结合了上下文信息和依存树捕获的长距离结构化信息,在英文 Switchboard 上实现了最先进的结果,明显优于现有技术。
- 大规模人工语焉不详生成
本文提出了用于在对话系统中检测语言不流畅的复杂和真实的人工生成方法 LARD,同时发布了一个包含不流畅性的大规模数据集,可以用于四种不同的任务,实验结果表明该方法生成的数据可有效用于检测和移除不流畅性语言。
- 无标记数据和小型 BERT 模型的瑕疵探测
本文研究了基于 BERT 架构的小型、快速、本地化模型的流畅检测技术,探讨了自我训练、领域自适应和数据增强等方法对性能的影响,发现对这些小型模型来说,这些策略具有更加明显的影响。
- 自训练与自监督学习相结合的非监督式病态语检测
本文提出了一种无监督学习的方法用于发现语言中的断续性,该方法使用廉价的无标注文本语料库,并借鉴了 Noisy Student Training 和上下文化词嵌入的思路,在英语 Switchboard 测试集上达到了与有监督系统竞争的效果。
- 端到端语音识别和修正发语障
探索使用端到端语音识别模型直接将混杂的语音转化为流畅的转录文本的可能性,并且我们提出了两个新的度量标准来评估集成 ASR 和无流畅度模型的性能,该论文的发现可以作为未来关于端到端语音识别和无流畅度处理任务的研究的基准。
- 利用自训练自注意力模型提高失流畅侦测
本研究证明自训练是一种半监督技术,它可以提高基于自我关注的解析器在断续检测方面的性能,并且展示了模型集成进一步提高断续检测性能的结果。
- 可控时延变换器用于实时标点预测和语病检测
本文提出了一种能够实时完成插入标点符号和去除语言障碍的强调时间延迟变压器模型,为后续的机器翻译、对话系统等应用提高了可读性和性能。在 IWSLT2011 基准数据集和中文注释数据集上的实验证实,该方法在 F-score 上的表现优于之前的最 - 多任务自监督学习用于消除语注检测
本文针对训练数据短缺的问题,提出了使用自监督方法结合无标注数据构建伪训练数据进行预训练,并利用有标注的训练数据进行微调的方法,达到了使用少量数据在英语 Switchboard 数据集上与之前使用全数据进行训练的系统表现相当的结果。使用全数据 - EMNLP具有强鲁棒性的跨领域与发顺变检测:模式匹配网络
本研究提出了一种新颖的模式匹配神经网络结构,使用邻居相似度分数作为特征,消除了在口吃检测任务中进行特征工程的需要。我们在四种不同的语音流派中评估了该方法的效果,并展示了当用于特定领域的数据时,该方法与手工设计的模式匹配特征具有相同的效果,在 - 使用噪声通道模型和深度神经语言模型进行语言不流畅性检测
本论文提出了一种自发言语转录中的 “LSTM 噪声信道模型” 来检测非流畅性,其中使用了 NCM 生成 n 最佳分析,并使用 LSTM 语言模型,及其他功能,用于鉴别最合理的分析,证明使用 LSTM 语言模型在噪声通道识别的重排过程中提高了 - 利用自相关神经网络进行语无休止检测
本研究提出了一种名为自相关神经网络 (ACNN) 的自动语音紊乱检测模型,其使用卷积神经网络 (CNN) 结合自相关操作,从而能够更好地捕捉修复性语音的相关依赖关系,实验表明,ACNN 模型在语音紊乱检测任务中的性能要优于传统的 CNN 模 - ACL语音解析:一种神经方法用于集成词汇和声学 - 韵律信息
本文中,我们提出了一个模型,该模型使用卷积神经网络对能量和音高轨迹进行耦合,并使用基于注意力机制的循环神经网络,接受文本和韵律特征,并结合转录文本和声学 - 韵律特征,以自动解析口语话语,并发现不同类型的声学 - 韵律特征都有助于解析,对比 - 使用双向 LSTM 进行犹豫检测
本文提出了一种利用双向 LSTM 神经网络进行自修复检测的方法,并使用模式匹配特征来降低对于词汇量的敏感度,提高了模型的性能。实验结果表明,在 Switchboard 语料库中,模型在标准的自修复检测任务和纠正检测任务中均表现出了出色的性能