强增量修复检测

Aug, 2014

Strongly Incremental Repair Detection

Julian Hough, Matthew Purver

TL;DR本文介绍了 STIR（STrongly Incremental Repair detection），一种能够利用n-gram模型进行增量检测语音修复的系统，它在Switchboard disfluency打上标签的语料库上发挥出了与现有最先进的增量修复检测方法同等水平的准确性，并且具有更好的增量准确性、更快的检测时间和更少的计算开销。本文还针对增量修复方法提出了新的评估标准。

Abstract

We present stir (STrongly incremental repair detection), a system that detects speech repairs and edit terms on transcripts incrementally with minimal latency. →

发现论文，激发创造

基于语义分割的未完整话语改写

本研究提出一种将不完整话语改写问题表述成语义分割问题，通过预测单词级别的编辑矩阵来引入编辑操作，能够捕捉到局部和全局信息，取得了多个公共数据集上的最新成果。此外，我们的方法在推理中比标准方法快四倍。

Sep, 2020

教授BERT等待时间：平衡精度和延迟，用于流式错语检测

提出一种基于BERT模型的语音识别模型，其能够在实时检测迟滞状态下动态计算其向前看窗口的大小，从而在相较于传统模型有更佳的准确率以及更短的延迟时间，并在增量式迟滞检测研究中实现了最先进的稳定性得分和延迟性得分。

May, 2022

自动文档修订：语法错误纠正、流畅性编辑及更多

本文介绍了一个基于 TETRA 语料库的文档级修订助手。我们探索了无需参考评估和可解释的方法来评估文档修订的质量。实验结果表明，即使修订的差异微小，经过微调的预训练语言模型也能够区分文档修订后的质量，这为未来探索自动文档修订模型和评估指标奠定了基础。

May, 2022

TAPIR：基于双通道模型的增量自适应自然语言理解修订学习

本文介绍了一种新的AdaPtIve修订方法，即TAPIR，能够利用神经网络和增量式处理、修订来更快地处理自然语言，同时保持全序列的准确性。实验证明，与重启增量转换器相比，我们的模型具有更好的增量性能和更快的推导速度。

May, 2023

优质修订铺就道路：增量序列标注中修订策略的详细评估方法

基于输入产生输出前缀的增量对话模型组件存在因局部模糊或错误假设而导致错误，修正过去的输出的能力是一种可取的特性，可以由策略管理。本文系统化并描述增量序列标注中的编辑和修订，并提出评估修订策略的度量指标。然后，我们将这种方法应用于比较三种基于Transformer的编码器在不同任务中的增量行为，为更好的修订策略铺平道路。

Jul, 2023

实时学习生成并修复语言

在这篇论文中，我们使用先前学习的动态句法语法和CHILDES语料库开发、训练和评估了一个概率模型，该模型用于增量生成，其中模型的输入是纯语义生成目标概念（TTR）。我们证明了该模型的输出与黄金候选项的准确匹配率为78％，ROUGE-l评分为0.86。我们进一步对同一模型在生成目标在发话过程中发生变化时产生自我修复的能力进行了零次评估。自动评估显示模型能够在85％的情况下正确生成自我修复。小规模的人工评估确认了生成的自我修复的自然性和语法性。总体而言，这些结果进一步突显了基于语法的模型的泛化能力，并为更可控和自然交互的对话型人工智能系统奠定了基础。

Aug, 2023

使用大型语言模型进行往返翻译的自动程序修复新方法

通过大型语言模型实现的往返翻译可用于自动程序修复，修正语法错误并还原代码中的常见模式，具有在软件工程研究中的潜力。

Jan, 2024

通过不流畅性检测增强自动语音识别模型

该研究解决了自动语音识别（ASR）模型在识别对话和自发语音中的不流畅性的问题。研究提出了一种仅基于推理的增强调制方法，利用改进的连接时序分类算法来准确预测词级时间戳，并分类对齐间隙，最终实现了81.62%的准确率和80.07%的F1分数，显示出该方法在文本转录中的潜力。

Sep, 2024

增强自动语音识别模型的语音不流畅检测

本研究解决了现有自动语音识别（ASR）模型在识别对话和自发语音中的不流畅现象时面临的挑战。我们提出了一种基于连接时序分类（CTC）算法的改进强制对齐方法，同时开发了分类模型用于检测不流畅语音的时间间隔，最终取得了81.62%的准确率和80.07%的F1分数，显示出该方法在后续任务中的潜在应用价值。

Sep, 2024

块世界中的修复：处理用户更正的新基准与多模态语言模型

本研究针对对话中修复序列处理的不足，提出了BlockWorld-Repairs数据集，以评估多模态语言模型在这方面的表现。该研究发现现有模型在处理第三方修复时表现远低于人类，但通过针对性优化损失函数可以提高模型的性能与通用性，强调了在多模态协作环境中改进AI系统训练的重要性。

Sep, 2024