本文旨在探讨在医疗临床记事本上提取关系的问题。作者提出使用卷积神经网络自动学习特征,减少对人工特征工程的依赖,并针对 i2b2-2010 临床关系提取挑战数据集进行了实证研究。结果表明,卷积神经网络可以是在临床文本中提取关系的良好模型,而且不需要专家们定义的高质量特征。
Jun, 2016
本研究提出了一种自动收集时间关系远程监督例子的方法,通过掩盖文本中明确的时间提示信号,训练出的模型能够学习到其他信号,实验表明预训练的 Transformer 模型能够通过这些弱标注的例子,在零样本和少样本情况下转移学习到具有人工注释的基准,并且遮罩方案对于改善泛化能力很重要。
Oct, 2020
提出了高效的多监督关系抽取方法,通过融合远程监督和专家监督选择信息丰富的文档子集,并利用多方监督排名损失训练模型,以提高模型性能并具有较高的时间效率。
Jul, 2024
通过预训练的语言模型,我们提出了一种新颖的在上下文中进行少样本关系抽取的框架,该框架可以消除命名实体识别和人工注释文档的需要,并实现了与现有方法相比最先进的性能。
Oct, 2023
研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声,进而将它们分配为负面样本以解决误报问题,实验表明该方法显著提高了远程监督方法的性能。
May, 2018
该研究使用 CrowdTruth 方法将人类注释信号扩展到相似的低维空间中的句子,从而显着提高了句级多类关系分类器的性能。
Sep, 2018
本文介绍了一种使用神经网络和概率建模的新型标签去噪框架,以解决远程监督关系提取中标签嘈杂的问题,并在实践中证明了该方法的有效性。
Sep, 2019
本研究提出了一种方法,以便快速生成高质量数据集用于关系抽取任务,并训练神经模型以对所创建的数据集进行关系抽取来实现很好的结果,并广泛适用于其他数据集。研究中,我们能够在合理的时间内注释 10,022 个句子的 19 种关系,并为每种关系训练一个常用的基线模型。
Apr, 2022
本研究针对生物医学领域中关系抽取的挑战,提出利用知识图谱关系对原始文本进行自动标注,以克服标注数据缺乏的问题,并通过构建更为准确的基准集 “MedDistant19” 来解决现有基准集存在的一系列问题,并验证了其在领域中具有普遍适用性。
本文通过比较深度学习在关系抽取任务中的应用,探讨不同模型的优劣和限制,以指导未来方向。
May, 2017