本文提出了一种用于快速启动训练数据集的过程,利用搜索引擎在句法图上获取正例,我们将此技术应用于 TACRED 和 DocRED 的关系,其结果模型与手动注释数据和远程监督方法所训练的模型相比具有竞争力,并且优于使用 NLG 数据增强技术所训练模型的模型。扩展基于搜索的方法使用 NLG 方法可以进一步提高结果。
Feb, 2021
本研究介绍了一种新的全自动、无监督的从大型文本语料库中提取依赖语法和相关语法到语义关系映射的方法,若成功,该方法将使得直接从大型未注释语料库中挖掘出用于自然语言理解和生成的所有信息成为可能。
Jan, 2014
我们提出了一种名为‘抽取式搜索’的搜索范式,其使用捕捉插槽等方法实现从大语料库中快速提取结构化信息,并通过神经检索和对齐提高召回率以改进结果。本文旨在简要介绍抽取式搜索并展示原型系统的潜力和好处。
Jun, 2021
本文介绍了一种基于图的半监督学习方法,利用单词之间的形态、句法和语义关系,从种子集合自动构建广覆盖的词汇表。该方法不受语言约束,可用于 11 种语言,并可通过提供的自动创建词汇表提高词汇标记和依存解析的性能。
Dec, 2015
本文介绍了语义扩展检索系统中影响最大的语义关联作用,并提出在准确性和噪音引入之间寻找最佳平衡的方案,最后通过构建自然语言处理系统并利用系统的多种知识资源进行评估。
Mar, 2022
本文介绍了在线工具 GREW-MATCH 如何用于查询和可视化现有的语义注释语料库中的数据。它提供了专用语法来构建简单或复杂的查询并执行它们,从而通过查询结果来检查一个或多个语料库中注释的一致性,并且作为一个错误挖掘工具,GREW-MATCH 可以帮助找到必须修复的句子。最后,GREW-MATCH 还可以作为辅助注释任务的工具,通过在现有语料库中找到注释示例来协助与待注释的数据进行比较。
Jul, 2022
本研究提出一种利用基础文档和少量标注数据进行深度学习提取式问答的方法,并通过对三个不同领域数据集的实验验证了其有效性。
Apr, 2018
研究数据库查询的自然语言生成问题,提出一种基于搜索算法的神经自回归模型改进方法,应用于最先进的语义解析器,以便能够发现可在不同数据集上通过所有测试的查询。
Oct, 2022
本研究提出一个自我学习的组合方法,通过引入具有权重的句法和语义相似度指标来确定来自预定数据库的类似问题,通过全面分析证明其效率和功效高于现有文献。
Apr, 2022
本文提出了使用句法图来表示三种句法信息(单词顺序,依赖关系和从属关系)的方法,并使用图到序列模型对句法图进行编码和解码逻辑形式。基准数据集上的实验结果表明,该模型与 Jobs640、ATIS 和 Geo880 的最新研究成果相当。对抗示例上的实验结果表明,通过编码更多的句法信息,该模型的鲁棒性也得到了提高。
Aug, 2018