一种用于预测集合值输出的顺序集合生成方法
本文扩展了 seq2seq 模型,实现了对输入集的合理处理以及通过搜索可能的排序来处理输出集的缺乏结构,并提出相应的解决方案,最终在多项自然语言处理任务和两项人工任务中取得了良好的结果。
Nov, 2015
本文提出将多标签分类任务视为序列生成问题,并应用具有新型解码器结构的序列生成模型来解决这个任务,实验结果表明我们的建议方法大大优于以前的工作,同时分析实验结果表明建议方法不仅捕捉标签之间的相关性,而且在预测不同标签时自动选择最有信息的词。
Jun, 2018
这篇文章提出了一种对于 Seq2Seq 模型的数据增强方法,称为 SETAUG,通过在输入序列中插入集合的大小信息并使用新的排列采样算法,有效地捕捉了集合元素的次序等不变性和基数属性。在进行试验后,这种方法实现了平均相对改进 20%,适用于 BART、T5 和 GPT-3 等多种不同模型。
May, 2022
本文提出了一种无监督学习成本函数,应用于序列分类器中,采用随机原始 - 对偶梯度法建模并优化,实现了端到端的无标注学习,实验表明该方法与其他基线方法相比具有更高的错误纠正能力。
Feb, 2017
本研究提出一种名为 Shuffling sEquence gEneration Network (SEE-Net) 的模型,通过打乱视频帧的顺序并将其与真实视频序列进行比较来学习区分非自然的顺序信息,从而提升了视频预测的效果,实验结果表明该模型在合成和实际场景视频上的表现都优于其他先前的方法,其具有生成更加真实的内容,顺序信息对于视频生成至关重要的特点。
Jul, 2019
连续时间中的神经标记时间点过程为连续时间事件数据的统计参数模型工具箱增添了有价值的内容。本文提出了一个通用框架,用于建模连续时间中的集合值数据,并开发了适用于任何基于强调的递归神经点过程模型的推理方法。在四个真实世界数据集上进行系统实验,通过对基于集合的序列进行重要性抽样,证明了效率大幅提升。通过展示如何使用该框架来执行不涉及一步预测的似然度进行模型选择。
Dec, 2023
本文介绍了一种用于文本到表格生成的新模型,该模型在考虑到多行中的大多数组合不敏感的情况下,首先采用文本编码器编码输入文本,再加入了一种表头生成器来以序列生成的方式输出表头,之后再使用具有可学习的行和列嵌入的表体生成器并行生成一组表身行,实验结果表明,此模型优于基线,达到了公认的数据集上的最佳性能。
May, 2023