- 在线学习中的结构化预测
在线学习环境下的结构化预测问题的理论和算法性框架的研究。通过研究,我们发现我们的算法能够推广到监督学习环境中的优化算法,并且在数据非独立同分布的情况下也能达到相同的风险上界。此外,我们还考虑了一种特别设计用于非平稳数据分布(包括对抗性数据) - COLING利用语言增强的嵌入技术进行开放信息抽取
自然语言处理中的开放信息提取(OIE)通过引入预训练语言模型和语言特征,通过 Seq2Seq 预训练语言模型提升 OIE 架构性能,并在性能评估中获得了 24.9%、27.3% 和 14.9% 的改进。此外,还介绍了其他挑战,如利用语义依赖 - EMNLP懒惰 - k:有限制的标记分类解码
我们研究了在结构预测中改善概率模型的可能性。具体而言,我们将这些模型与约束解码方法相结合,用于信息提取中的标记分类。我们评估了几种现有的方法,并提出了一种名为 Lazy-$k$ 的新的解码方法。我们的研究结果表明,约束解码方法可以显著提高模 - SpEL:结构化实体链接的预测
该研究介绍了使用结构化预测进行实体链接的方法,提出了一种名为 SpEL 的实体链接系统,通过细化的微调步骤、上下文敏感的预测聚合策略以及减小模型输出词汇量等新思路,在实体链接任务中取得了比现有方法更好的性能,并且在计算效率方面表现出色。
- EMNLP结构化预测的评估度量的统一视角
我们提出一个概念框架,统一了不同结构预测任务(例如事件和关系提取,句法和语义解析)的各种评估指标。通过将这些任务的输出表示为某些数据类型的对象,并通过匹配共同子结构,可能跟随标准化,推导出指标。我们演示了如何用这个框架简洁地表达许多任务的常 - 关于结构化预测中的认证泛化
在结构化预测中,我们提出了一种新的 PAC-Bayesian 风险界来处理非分离因素和违反 i.i.d. 假设的情况,并按照生成模型的研究,将数据生成为基于 Knothe-Rosenblatt 排序的因子参考测量,以显式提取随机输出变量之间 - 结构化预测中的部分推断
本文探讨了结构化预测中的部分推断问题,采用生成模型方法,考虑在图形标签空间中最大化一种包括一元和成对潜势的评分函数,采用两阶段凸优化算法进行标签恢复,并提供了可证明保证部分恢复的统计和拓扑要求。
- 学习字符串部分序列
本文提出一种基于部分排序的线性时间和空间复杂度算法来解决结构化预测问题,其中通过计算输入字符串中每个令牌的实数并相应地进行排序,得到了尽可能少的 2 个令牌总订单,这些总订单的交集形成了令牌的部分排序,并被解码成代表所需结构的有向图。在英语 - 使用部分标注和自训练的结构预测数据高效主动学习
本文提出了一种基于主动学习的实用方法,利用部分注释来减少结构标签空间的注释成本,并采用自我训练来将当前模型的自动预测作为未注释子结构的伪标签,通过使用错误估计器自适应地确定部分选择比率来解决选择子结构进行注释的挑战,本文在四个结构预测任务中 - 带噪声的改进高斯 - 牛顿算法
本文研究了在大规模统计学环境中用于机器学习和信号处理的 Gauss-Newton 方法及其随机版本,以及它们的非光滑对应物 prox-linear 算法。该文在一个简化的统计学例子和结构化预测学习问题上,对这两类算法的对比表现进行了理论和实 - 一种混合软提示的可控数据生成方法
本文介绍了一种利用大型语言模型作为数据增强工具的技术,即利用软提示的混合模型进行参数有效的数据生成,并通过去噪机制提高生成数据的质量,此方法能够在复杂预测任务中实现对标签语义的保留,达到优于强基准的最新结果。
- ACL结构化预测中可分离损失的不一致性
本文证明了针对结构化预测问题的一种可分离的负对数似然损失不一定是贝叶斯一致的,即最小化此损失并不一定会产生一个在给定输入的数据分布中预测最可能结构的模型,这个事实引出一个问题,即这些损失是否适用于结构化预测,如果适用,则为何适用。
- ECCV基于误差对齐不确定性优化的可靠多模态轨迹预测
通过提出基于误差对齐的不确定性优化方法和引入可训练的损失函数来估算深度神经网络的不确定性,以取得与模型误差相关性强的不确定性预测。该方法适用于连续结构化预测和回归任务,并在包括大规模车辆运动预测任务的多个数据集上进行评估,通过 Pearso - 弱监督升级为结构化预测
在标签输出空间包含二进制或多类标签集以外的结构化预测情况下,本文介绍了一些技术基于伪欧几里得嵌入和张量分解,提供了几乎一致的噪声率估计,并针对常曲率黎曼流形引入了新的不变量作为一致的噪声率估计。
- EMNLP使用语言模型的自回归结构预测
本文研究 NLP 中使用预训练语言模型(PLM)的结构化预测问题,描述了一种基于 PLMs 的结构建模方法,在命名实体识别、端到端关系提取和指代消解三个任务上实现了最新的最优性能。
- Code4Struct: 自然语言生成少样本结构化预测代码
Code4Struct 利用 LLM 的 text-to-structure 翻译能力解决了 NLP 中的结构预测任务。将 PL 与 NLP 问题类比,Code4Struct 通过生成代码处理 EAE 任务,仅使用 50 个训练实例即可超越 - COLING集合全局和局部信息以进行过程文本理解
本文提出了一种新的模型 CGLI,该模型结合了本地和全局视图的输入以及全局输出,旨在实现精度和召回率同时优化,同时在故事推理框架中进行了扩展,实验结果表明这种方法在流程文本理解和故事推理方面均取得了最先进的结果。
- ICLRCrossBeam: 底部向上程序综合中的搜索学习
为了解决程序综合中搜索空间膨胀的问题,我们提出了 CrossBeam,它训练一个神经模型来学习自底向上的搜索策略,从而更加高效地探索程序空间。我们在字符串操作和逻辑编程领域实验后发现,CrossBeam 学会了高效搜索,相比最先进的技术,它 - P4E: 基于提示引导的少样本事件检测及定位
本研究提出了一种结合少量样本激励和结构化预测的识别与定位事件检测框架 P4E,该框架将事件检测分解为识别任务和定位任务,利用填空提示来对准获得预训练任务的目标,从而使我们的模型能够快速适应新的事件类型。
- 场景图生成的约束结构学习
本文提出了一种使用约束结构学习和熵镜像下降方法的图像场景生成模型,相较于基于信息传递的方法,更能适应不同场景下的图像生成任务,并在各基准测试中取得了最优结果。