CoRec:协同识别的简便方法
基于神经网络的模型用于协调边界预测,通过多个 LSTM 网络,并在 Treebank 上进行训练,展示了与两个现有技术的比较,以及在 Genia 语料库上的改进。
Oct, 2016
本文介绍了一种过渡式气泡分析器以同时执行协调结构识别和基于依赖的句法分析。基于气泡的结构可以通过编码协调边界和协调结构内部关系来增强依赖树,我们引入了一种过渡系统和神经模型用于解析这些增强型结构。在对英语 Penn Treebank 和英语 GENIA 语料库的实验结果表明,我们的解析器在协调结构预测任务上击败了以前的最先进方法,尤其是在具有复杂协调结构的子句中的表现更佳。
Jul, 2021
本文提出了一种将语言 - 图像预训练模型(如 CLIP)的检索能力与无监督图像分割方法结合的方法,称为 Retrieve and Co-segment(ReCo)。该方法可构建语义分割模型,无需像素级别的标注,具有词汇表中概念名称的预测方便性和零样本转移能力,并能生成少见对象的专用分割模型。
Jun, 2022
通过 OCR-free 序列生成模型,本研究提出了 Coordinate-aware End-to-end Document Parser (CREPE) 模型,用于图像文档理解。该模型不仅可以从文档图像中解析文本,还可以提取文本的空间坐标,并通过引入特殊标记和基于标记的坐标解码实现这些功能。实验结果表明 CREPE 在文档解析任务上取得了最新的性能,其适应性还体现在布局分析、文档视觉问答等其他文档理解任务中。该模型不仅减少了现有依赖 OCR 方法的错误传播问题,还显著增强了序列生成模型的功能,引领了文档理解研究的新时代。
May, 2024
本研究提出一种新的多任务协作网络 (MCN) 模型通过联合学习来实现指代表达理解 (REC) 和分割 (RES) 两个高度相关的任务,并通过创新设计解决预测冲突的挑战,实验结果表明,在三个基准数据集 RefCOCO、RefCOCO+ 和 RefCOCOg 上,MCN 模型相较于现有方法有了显著的表现提升,REC 和 RES 的准确率分别提高了 7.13% 和 11.50%,证实了我们的方法的有效性。
Mar, 2020
本文调查了现代方法解决自然语言与计算机视觉领域中的指代表达理解问题,包括用于编码视觉和文本模态的机制,结构化图表示的模块化架构和基于图形的模型,以及针对小型数据集的结果,提出了复合指称表述理解方向的潜在未来研究方向。
Jul, 2020
本文提出了两种协调推理方法,即 Easy-to-Hard 解码策略和共同实体对齐算法,以解决实体对齐过程中的 “一对多” 问题,并通过扩展当前基线的对齐模型来实现。实验结果表明,该模型达到了最先进的性能水平,提出的推理方法也可以显著改进现有的基线。
Jan, 2020