自然语言处理中通过组合标签进行信息传播

May, 2022

自然语言处理中通过组合标签进行信息传播

Information Propagation by Composited Labels in Natural Language Processing

Takeshi Inagaki

TL;DR本文介绍了自然语言处理中的标注任务并定义了标签概念，在实体链接和信息流方面提出了一种新的方法，并通过熵计算信息损失，最终将其视为两个实体在图上路径的距离。

Abstract

In natural language processing (NLP), labeling on regions of text, such as words, sentences and paragraphs, is a basic task. In this paper, label is defined as map between mention of entity in a region on text an

natural language processing labeling entity linkage information flow entropy

发现论文，激发创造

使用语义标签传播技术进行知识库填充

本研究讨论了使用远程监督和特征标注相结合的方法解决知识库填充问题，提出了一种名为语义标签传播的方法，并在实验中显示出了显著的性能提升。

Nov, 2015

基于图的多语言标签传播在低资源词性标注中的应用

本文提出了一种将标签从多种高 - 低资源语言进行传递的图形标签传递方法，可与增强的情境化嵌入相结合，实现了无监督标注低资源语言中词性标注的最新技术水平。

Oct, 2022

PropSegmEnt: 一个用于命题级别分割和蕴含识别的大规模语料库

本论文提出了 PropSegmEnt，这是一个超过 35K 的已由人类专家标注的命题语料库，用于 NLI 任务中的命题分割和关系分类，证明了这个框架有助于理解和解释 NLI 标签的组合性。

Dec, 2022

基于跨度关系表示的自然语言分析泛化

本文提出一种基于标记跨度和跨度之间关系的统一格式的思想，成功应用于语法、语义、信息内容，情感等多种自然语言处理任务，其结构化的方法能将不同任务转化为相同的格式，同时得到较高的性能表现，并提出多任务学习的优势。最后作者将各数据转换为统一格式来建立一个基准测试，提供了一个综合的测试平台，用于评估未来模型对于通用自然语言处理的表现。

Nov, 2019

文学社交网络中信息传播的度量

我们提出了文学中信息传播建模任务，并使用一种新的流程在超过 5000 部小说中分析信息传播动态，发现填补不同社群之间结构空缺的女性角色比男性角色更常见

Apr, 2020

实体中心信息抽取的神经网络方法

研究自然语言处理的 NLP 和人工智能领域对实体理解的影响，提出了基于实体概念的方法，并介绍了如何在实体链接任务中使用这种方法。通过核指代文簇难题进行了实验研究，分析了知识库实体集成到文本中的方法并从时间视角分析了实体的演变。

Apr, 2023

加强语言表示以利用标签知识进行提取

本研究提出了一种新的模型来加强文本表达，进而实现信息提取中的 span extraction 任务，并在三个任务，flat NER、nested NER、event detection 中达到了最佳表现，显著减少了训练和推理时间。

Nov, 2021

关系分类中的众包语义标签传播

该研究使用 CrowdTruth 方法将人类注释信号扩展到相似的低维空间中的句子，从而显着提高了句级多类关系分类器的性能。

Sep, 2018

利用自然语言处理对食品系统本体进行组织分类

利用自然语言处理方法识别组织实体的分类任务，实现与食物系统本体论的知识图谱构建和整合，研究结果表明 NLP 模型在分类任务上表现良好，且可以广泛应用于其他分类问题。

Sep, 2023

语义网络的拓扑特性和组织原则

研究了 ConceptNet 定义的由 11 种不同语言的七个语义关系组成的语义网络的特性，发现它们普遍具有稀疏、高度聚集和幂律程度分布等基本属性，少数语言的语义网络由于语法规则的影响出现幂律分布中的峰值。此外，根据语义关系类型和语言不同，语义网络中连接的形成受不同原则的指导，利用语义网络中相似性和互补性知识，可以提高 NLP 算法中的缺失链接推断。

Apr, 2023