- 学习预测常识生成的概念排序
通过对多个语言模型(LMs)和概念排序策略进行系统研究,我们发现使用 BART-large 模型在按照 CommonGen 训练数据中概念顺序进行微调时,表现始终优于其他所有考虑到的 LMs,并通过多个评估指标进行了衡量;此外,即便使用专门 - DimonGen:用于解释概念关系的多样化生成常识推理
本文提出了 DimonGen,它旨在在各种日常情境中生成描述概念关系的多样化句子,并通过调整现有的 CommonGen 数据集来支持此任务。提出一个名为 MoREE 的双阶段模型,由检索模型和生成模型混合而成,并通过实验表明 MoREE 在 - 词汇复杂性控制的句子生成
我们提出了一个新颖的任务,即控制词汇复杂度的句子生成,该任务旨在使用具有所需复杂度水平的关键词生成句子。我们提出了一种基于复杂度嵌入的简单而有效的方法,用于训练模型和微调预训练模型,并在英文和中文数据集上进行了广泛的实验。结果表明,相对于基 - ELF22: 一份基于上下文的反网络喷子数据集用于打击网络喷子
针对网络恶意评论的问题,本研究提出了一种新的数据集用于自动生成反击评论,经过实验验证,该数据集可以有效地改善对抗策略控制的句子生成。
- 基于进化伪标记的零样本视频字幕生成
本文提出了一种零样本视频字幕生成方法,采用了冻结的 GPT-2 语言模型和 CLIP 图像 - 文本匹配模型,并通过生成过程中的优化方法生成了连贯、具有广泛实际知识的视频字幕。
- 使用特定单词构造句子
本文介绍了一种使用 BART 模型完成基于任意单词集构建句子的任务,并通过使用四个单词生成句子进行训练,从而实现了很高的句子生成质量,该任务可用作任何语言模型的评估机制。
- 医学图像报告组成的关系句子生成和检索统一
本研究提出了一种新型的框架,将模板检索和句子生成相结合,以处理普通和罕见异常情况,同时确保检测到的医学术语之间的语义一致性,该方法在两个医学报告基准测试上取得了明显的优势。
- 使用 Gumbel-CRFs 进行潜在模板归纳
本文中,我们探索使用结构化变分自编码器来推断句子生成的潜在模板,使用软,连续松弛来利用重参数化进行训练,并提出了 Gumbel-CRF 方法。它是 CRF 采样算法的连续松弛,使用了一种松弛的前向 - 向后采样方法。通过使用重新参数化的梯度 - EMNLP超越反馈环的自回归文本生成
本文介绍了一种将潜在状态空间模型与 CRF 观察模型结合的自回归观察模型,在无条件句子生成中,与基线模型相比具有更好的性能,避免了自回归模型的一些典型失败模式。
- BERT 有嘴巴,必须开口:BERT 作为马尔可夫随机场语言模型
该研究表明 BERT 是一个马尔可夫随机场语言模型,其生成的句子具有较高的多样性但略逊于传统从左至右的语言模型。
- NIPS对话系统技术挑战赛 7
本文介绍了第七届对话系统技术挑战赛(DSTC)的概况和研究成果,包括不同追踪和数据集的详细描述。该比赛聚焦于建立端到端的对话系统,并于句子选择、句子生成和音视频场景感知对话等方面展开研究。参赛者使用最先进的技术取得了显著的成果。
- 图像字幕的深度学习综述
该研究综述了基于深度学习的图像描述技术,包括目标识别、句子生成及评估度量等方面进行了探讨。
- ACL通过词汇预测加速强化学习句子生成
通过使用动态词汇预测的方法来缩小活动空间,从而提高了基于强化学习的句子生成效率,在 6 个机器翻译和 2 个图像字幕数据集上的实验证明,该方法比全词汇方法更快,使用的 GPU 内存更少,并且在 CPU 上的解码速度也更快,并且强化学习的 B - ACL基于随机 Wasserstein 自编码器的概率句子生成
本文介绍 Wasserstein 自编码器 (WAE) 的应用,用于概率句子生成,并与其他概率模型进行比较。研究表明,在 stochastic encoding 由固定分布制备时,该分布往往趋向于变成 Dirac delta functio - AAAI在句子生成中使用鉴别器:一种 Gibbs 采样方法
本论文提出了一种使用 Gibbs Sampling 的新框架来生成限制条件下的句子,通过逐步迭代更新候选句子,并用新单词取代旧单词,证明了该方法生成的句子具有合理性和多样性。
- 从 Wikidata 学习生成单句传记
利用循环神经网络的序列到序列模型,结合注意力选择 Wikidata 中的事实并生成与之相关的维基百科传记句,模型通过人类偏好评估接近于维基百科参考水平,并且通过分析内容选择,模型可以在推断知识和错觉错误信息之间进行折中。
- 学习用于图像字幕生成的递归视觉表示
本研究探索了图像及其基于语句的描述之间的双向映射,提出了使用递归神经网络学习该映射的方法。我们使用相同的模型生成新的描述句子,并重新构建与图像相关的可视化特征,同时使用新颖的递归视觉记忆来辅助语句生成和可视化特征重构。在生成新的图像描述任务