面向语音的关系抽取
该研究通过一种端到端的神经架构,直接从语音中提取命名实体,并针对语音识别和命名实体识别进行联合优化,相较于传统的流水线方法,实现了更好的命名实体识别结果(测试数据的 F-measure=0.69)
May, 2018
本文介绍了第一个人工注释的基于对话的关系抽取(RE)数据集 DialogRE,用于支持在对话中预测两个参数之间的关系,尤其是涉及多个句子的跨句子 RE 任务,并基于分析指出演讲者相关信息在该任务中发挥了关键作用。在提出一个新的评估指标以评估在会话环境中进行 RE 方法的性能之后,本文研究了几种常用的 RE 方法在 DialogRE 数据集上的表现,并通过实验证明,最佳表现模型的扩展可以在标准和会话环境的评估设置中都取得收益。
Apr, 2020
本文介绍了第一个公开的针对英语语音的命名实体识别 (NER) 数据集,并提出了一种端到端的方法,该方法同时优化 ASR 和 NER 标记器的组件。实验结果表明,所提出的端到端方法优于经典的两步方法,并讨论了如何使用语音的 NER 来处理 ASR 系统中的词汇外单词 (OOV)。
May, 2020
本论文提出了一种在对话系统中探讨关系抽取的有效方式,并在三个领域的数据集上进行了实验验证,该方法有效地扩展了对话系统的能力,并且简化注释方案可以通过使用关系注释的表达能力,减少词槽数量同时仍然捕获用户的意图。
Oct, 2022
本文介绍了关系抽取(RE)的若干重要的监督、半监督和无监督技术,以及开放信息抽取(OIE)和远程监督的范例,最后描述了近期 RE 技术和未来研究方向。这篇综述对于领域的新手、研究人员和实践者都有用。
Dec, 2017
提出了一种基于语音 / 文本内涵的新型端到端 ASR 错误检测方法,该方法通过将音频和对应的文本片段之间的内涵建模为端到端任务,并利用声学编码器和语言编码器来预测内涵,实验结果表明该方法可以有效降低医学术语方面的分类错误率 12% 和 15.4%。
Jul, 2022
通过引入 Sub-Tree Parse 和基于迁移学习的先验知识,我们提出了一种新的基于词级级别远程监督的关系提取方法,可以从自动构建的包含噪声词语的低质量句子数据集中提取关系,实验结果表明我们的方法相对现有最优工作提高了 Precision/Recall (PR) 的面积从 0.35 到 0.39.
Aug, 2018
关系抽取(RE)是自然语言处理的基础任务,本文综述了四个阶段的 RE 方法,包括模式匹配、统计、神经网络和大型语言模型,并着重介绍了现代 RE 方法的远程监控和去噪预训练方法。
Jul, 2022
本文提出了一种基于神经元的端到端模型来联合提取实体和它们的关系,该模型不依赖于外部自然语言处理工具,而是集成了大量的预训练语言模型, 在三个领域的五个数据集上,我们的模型可以与最先进的性能相提并论,有时甚至具有更高的性能。
Dec, 2019
本文提出了一种基于外部模型训练的新型端到端神经模型,用于提取语音信号中的语义信息,并使用 SLU 神经模块替换 ASR 模型的顶层,实现端到端模型的构建。实验结果表明,此方法在 QUAERO 语料库上具有很高的性能。
Apr, 2022