面向语音的关系抽取

EMNLPOct, 2022

Towards Relation Extraction From Speech

Tongtong Wu, Guitao Wang, Jinming Zhao, Zhaoran Liu, Guilin Qi...

TL;DR本文提出了一个新的听取信息提取任务，即语音关系提取，通过文本到语音系统构建训练数据集，并通过众包和本土英语演讲者构建测试数据集，探索语音关系提取的两种方法：通过预训练的 ASR 模块进行基于文本的提取的流水线方法和通过新的提出的编码器解码器模型进行端到端方法，进行了全面的实验以区分语音关系提取中的挑战，并分享了代码和数据。

Abstract

relation extraction typically aims to extract semantic relationships between entities from the unstructured text. One of the most essential data sources for relation extraction is the →

relation extraction spoken language automatic speech recognition text-to-speech systems encoder-decoder model

发现论文，激发创造

基于端到端的语音命名实体提取

该研究通过一种端到端的神经架构，直接从语音中提取命名实体，并针对语音识别和命名实体识别进行联合优化，相较于传统的流水线方法，实现了更好的命名实体识别结果（测试数据的 F-measure=0.69）

May, 2018

基于对话的关系抽取

本文介绍了第一个人工注释的基于对话的关系抽取（RE）数据集 DialogRE，用于支持在对话中预测两个参数之间的关系，尤其是涉及多个句子的跨句子 RE 任务，并基于分析指出演讲者相关信息在该任务中发挥了关键作用。在提出一个新的评估指标以评估在会话环境中进行 RE 方法的性能之后，本文研究了几种常用的 RE 方法在 DialogRE 数据集上的表现，并通过实验证明，最佳表现模型的扩展可以在标准和会话环境的评估设置中都取得收益。

Apr, 2020

英文语音端到端命名实体识别

本文介绍了第一个公开的针对英语语音的命名实体识别 (NER) 数据集，并提出了一种端到端的方法，该方法同时优化 ASR 和 NER 标记器的组件。实验结果表明，所提出的端到端方法优于经典的两步方法，并讨论了如何使用语音的 NER 来处理 ASR 系统中的词汇外单词 (OOV)。

May, 2020

使用关系抽取技术增强面向任务的对话系统

本论文提出了一种在对话系统中探讨关系抽取的有效方式，并在三个领域的数据集上进行了实验验证，该方法有效地扩展了对话系统的能力，并且简化注释方案可以通过使用关系注释的表达能力，减少词槽数量同时仍然捕获用户的意图。

Oct, 2022

关系抽取：综述

本文介绍了关系抽取（RE）的若干重要的监督、半监督和无监督技术，以及开放信息抽取（OIE）和远程监督的范例，最后描述了近期 RE 技术和未来研究方向。这篇综述对于领域的新手、研究人员和实践者都有用。

Dec, 2017

音频 - 文本蕴含的 ASR 错误检测

提出了一种基于语音 / 文本内涵的新型端到端 ASR 错误检测方法，该方法通过将音频和对应的文本片段之间的内涵建模为端到端任务，并利用声学编码器和语言编码器来预测内涵，实验结果表明该方法可以有效降低医学术语方面的分类错误率 12% 和 15.4%。

Jul, 2022

应用内部句子噪声降低和转移学习的神经关系抽取

通过引入 Sub-Tree Parse 和基于迁移学习的先验知识，我们提出了一种新的基于词级级别远程监督的关系提取方法，可以从自动构建的包含噪声词语的低质量句子数据集中提取关系，实验结果表明我们的方法相对现有最优工作提高了 Precision/Recall (PR) 的面积从 0.35 到 0.39.

Aug, 2018

远程监督关系抽取综述：以去噪和预训练方法为重点

关系抽取（RE）是自然语言处理的基础任务，本文综述了四个阶段的 RE 方法，包括模式匹配、统计、神经网络和大型语言模型，并着重介绍了现代 RE 方法的远程监控和去噪预训练方法。

Jul, 2022

使用预训练语言模型的端到端命名实体识别和关系抽取

本文提出了一种基于神经元的端到端模型来联合提取实体和它们的关系，该模型不依赖于外部自然语言处理工具，而是集成了大量的预训练语言模型，在三个领域的五个数据集上，我们的模型可以与最先进的性能相提并论，有时甚至具有更高的性能。

Dec, 2019

无配对训练数据语音命名实体识别端到端模型

本文提出了一种基于外部模型训练的新型端到端神经模型，用于提取语音信号中的语义信息，并使用 SLU 神经模块替换 ASR 模型的顶层，实现端到端模型的构建。实验结果表明，此方法在 QUAERO 语料库上具有很高的性能。

Apr, 2022