本研究讨论了使用远程监督和特征标注相结合的方法解决知识库填充问题,提出了一种名为语义标签传播的方法,并在实验中显示出了显著的性能提升。
Nov, 2015
本文提出了一种将标签从多种高 - 低资源语言进行传递的图形标签传递方法,可与增强的情境化嵌入相结合,实现了无监督标注低资源语言中词性标注的最新技术水平。
Oct, 2022
本论文提出了 PropSegmEnt,这是一个超过 35K 的已由人类专家标注的命题语料库,用于 NLI 任务中的命题分割和关系分类,证明了这个框架有助于理解和解释 NLI 标签的组合性。
Dec, 2022
本文提出一种基于标记跨度和跨度之间关系的统一格式的思想,成功应用于语法、语义、信息内容,情感等多种自然语言处理任务,其结构化的方法能将不同任务转化为相同的格式,同时得到较高的性能表现,并提出多任务学习的优势。最后作者将各数据转换为统一格式来建立一个基准测试,提供了一个综合的测试平台,用于评估未来模型对于通用自然语言处理的表现。
Nov, 2019
我们提出了文学中信息传播建模任务,并使用一种新的流程在超过 5000 部小说中分析信息传播动态,发现填补不同社群之间结构空缺的女性角色比男性角色更常见
Apr, 2020
研究自然语言处理的 NLP 和人工智能领域对实体理解的影响,提出了基于实体概念的方法,并介绍了如何在实体链接任务中使用这种方法。通过核指代文簇难题进行了实验研究,分析了知识库实体集成到文本中的方法并从时间视角分析了实体的演变。
Apr, 2023
本研究提出了一种新的模型来加强文本表达,进而实现信息提取中的 span extraction 任务,并在三个任务,flat NER、nested NER、event detection 中达到了最佳表现,显著减少了训练和推理时间。
Nov, 2021
该研究使用 CrowdTruth 方法将人类注释信号扩展到相似的低维空间中的句子,从而显着提高了句级多类关系分类器的性能。
Sep, 2018
利用自然语言处理方法识别组织实体的分类任务,实现与食物系统本体论的知识图谱构建和整合,研究结果表明 NLP 模型在分类任务上表现良好,且可以广泛应用于其他分类问题。
Sep, 2023
研究了 ConceptNet 定义的由 11 种不同语言的七个语义关系组成的语义网络的特性,发现它们普遍具有稀疏、高度聚集和幂律程度分布等基本属性,少数语言的语义网络由于语法规则的影响出现幂律分布中的峰值。此外,根据语义关系类型和语言不同,语义网络中连接的形成受不同原则的指导,利用语义网络中相似性和互补性知识,可以提高 NLP 算法中的缺失链接推断。