强增量修复检测
本研究提出一种将不完整话语改写问题表述成语义分割问题,通过预测单词级别的编辑矩阵来引入编辑操作,能够捕捉到局部和全局信息,取得了多个公共数据集上的最新成果。此外,我们的方法在推理中比标准方法快四倍。
Sep, 2020
提出一种基于BERT模型的语音识别模型,其能够在实时检测迟滞状态下动态计算其向前看窗口的大小,从而在相较于传统模型有更佳的准确率以及更短的延迟时间,并在增量式迟滞检测研究中实现了最先进的稳定性得分和延迟性得分。
May, 2022
本文介绍了一个基于 TETRA 语料库的文档级修订助手。我们探索了无需参考评估和可解释的方法来评估文档修订的质量。实验结果表明,即使修订的差异微小,经过微调的预训练语言模型也能够区分文档修订后的质量,这为未来探索自动文档修订模型和评估指标奠定了基础。
May, 2022
本文介绍了一种新的AdaPtIve修订方法,即TAPIR,能够利用神经网络和增量式处理、修订来更快地处理自然语言,同时保持全序列的准确性。实验证明,与重启增量转换器相比,我们的模型具有更好的增量性能和更快的推导速度。
May, 2023
基于输入产生输出前缀的增量对话模型组件存在因局部模糊或错误假设而导致错误,修正过去的输出的能力是一种可取的特性,可以由策略管理。本文系统化并描述增量序列标注中的编辑和修订,并提出评估修订策略的度量指标。然后,我们将这种方法应用于比较三种基于Transformer的编码器在不同任务中的增量行为,为更好的修订策略铺平道路。
Jul, 2023
在这篇论文中,我们使用先前学习的动态句法语法和CHILDES语料库开发、训练和评估了一个概率模型,该模型用于增量生成,其中模型的输入是纯语义生成目标概念(TTR)。我们证明了该模型的输出与黄金候选项的准确匹配率为78%,ROUGE-l评分为0.86。我们进一步对同一模型在生成目标在发话过程中发生变化时产生自我修复的能力进行了零次评估。自动评估显示模型能够在85%的情况下正确生成自我修复。小规模的人工评估确认了生成的自我修复的自然性和语法性。总体而言,这些结果进一步突显了基于语法的模型的泛化能力,并为更可控和自然交互的对话型人工智能系统奠定了基础。
Aug, 2023
该研究解决了自动语音识别(ASR)模型在识别对话和自发语音中的不流畅性的问题。研究提出了一种仅基于推理的增强调制方法,利用改进的连接时序分类算法来准确预测词级时间戳,并分类对齐间隙,最终实现了81.62%的准确率和80.07%的F1分数,显示出该方法在文本转录中的潜力。
Sep, 2024
本研究解决了现有自动语音识别(ASR)模型在识别对话和自发语音中的不流畅现象时面临的挑战。我们提出了一种基于连接时序分类(CTC)算法的改进强制对齐方法,同时开发了分类模型用于检测不流畅语音的时间间隔,最终取得了81.62%的准确率和80.07%的F1分数,显示出该方法在后续任务中的潜在应用价值。
Sep, 2024
本研究针对对话中修复序列处理的不足,提出了BlockWorld-Repairs数据集,以评估多模态语言模型在这方面的表现。该研究发现现有模型在处理第三方修复时表现远低于人类,但通过针对性优化损失函数可以提高模型的性能与通用性,强调了在多模态协作环境中改进AI系统训练的重要性。
Sep, 2024