使用超图表示的合成文本生成
本文介绍了一种新型图形转换编码器,可处理知识图谱等非层次性图形的内容,应用于科学文本领域的图 - 文本生成,评价结果表明,该技术可以产生比竞争的编码解码方法更具信息量且结构更好的文本。
Apr, 2019
本文提出了一种基于图形表示的模型,并演示了我们不仅可以跨文档检索语义相似的信息,而且我们生成的嵌入空间也捕获了有用的语义信息,类似于仅适用于文本序列的语言模型。
Feb, 2022
该论文提出了符号基于生成(SymGen)的方法,通过与条件数据中的显式符号引用交替输出文本,实现对大语言模型(LLMs)输出文本的验证和溯源,从而减少人工验证的工作量,同时保持流畅和准确。
Nov, 2023
本文介绍了受控产生合成文本的方法,以解决政治科学家在使用受监督文本模型方面面临的挑战。作者用三个应用程序证明了合成文本的实用性,包括生成描述乌克兰战斗的虚拟推文,为训练事件检测系统的合成新闻文章,以及训练句子级民粹主义分类器的多语言语料库。
Mar, 2023
自动从长文档的文本中生成演示文稿是一个具有挑战性和有用的问题。我们提出了一种基于图神经网络和语言模型组合的方法,通过学习输入文档的图形并为每张幻灯片分配内容,生成具备更好的非线性叙述性的演示文稿,并与直接使用语言模型的方法进行了实验证明我们方法的优点。
May, 2024
本文介绍了一种名为 Hybrid Span Generator (HySPA) 的混合跨度生成器,它可以对文本中的信息图进行可逆映射,直接生成节点和边类型的交替序列,并在线性时间和空间复杂度内对跨度和类型进行解码。在 ACE05 数据集上的实验表明,该方法在联合实体和关系提取任务上也显着优于现有技术。
Jun, 2021
本文提出一种新的名为 Hierarchical Latent Semantic Mapping (HLSM) 的主题生成方法,它可以自动从语料库中生成主题,并使用单词之间的关联和层次生成主题网络。实验表明,相比于现有的一些最先进的方法,HLSM 在几个文档集合上表现良好。
Nov, 2015
提出了一种利用分层语义图实现对人体运动生成的细粒度控制的方法,通过将运动描述分解成三个层次的语义图,从整体到局部的结构帮助全面理解运动描述和对运动生成进行细粒度控制,并对分解的文本到运动扩散过程进行了优化,通过修改分层语义图的边权重,实现了生成运动的持续细化,具有超过基准数据集 HumanML3D 和 KIT 的优越性能。
Nov, 2023
本文针对自然语言描述的运动合成问题,提出了一种基于两级流模型的生成复合动作的技术,利用两个流分别表示上下半身的动作,能够有效地生成短句和复合句中描述的 3D 姿态序列,与已有研究相比,实验结果表明我们的模型在客观评价方面进步了 50% 以上,在主观评价方面也得到了很好的实验结果。
Mar, 2021