使用超图表示的合成文本生成

Sep, 2023

Synthetic Text Generation using Hypergraph Representations

Natraj Raman, Sameena Shah

TL;DR使用基于超图的方法生成语义框架，通过变换框架内容生成多样、连贯、风格、情感、格式、结构和事实都有变化的文档。

Abstract

generating synthetic variants of a document is often posed as text-to-text transformation. We propose an alternate LLM based method that first decomposes a document into semantic frames and then generates text us

generating synthetic variants text-to-text transformation semantic frames hypergraph diverse documents

发现论文，激发创造

使用图形 transformer 从知识图谱生成文本

本文介绍了一种新型图形转换编码器，可处理知识图谱等非层次性图形的内容，应用于科学文本领域的图 - 文本生成，评价结果表明，该技术可以产生比竞争的编码解码方法更具信息量且结构更好的文本。

Apr, 2019

利用图变换网络对复杂文档布局中的文本语义进行建模

本文提出了一种基于图形表示的模型，并演示了我们不仅可以跨文档检索语义相似的信息，而且我们生成的嵌入空间也捕获了有用的语义信息，类似于仅适用于文本序列的语言模型。

Feb, 2022

朝可证实的文本生成方向前进：带有符号引用

该论文提出了符号基于生成（SymGen）的方法，通过与条件数据中的显式符号引用交替输出文本，实现对大语言模型（LLMs）输出文本的验证和溯源，从而减少人工验证的工作量，同时保持流畅和准确。

Nov, 2023

用于监督文本分析的合成文本

本文介绍了受控产生合成文本的方法，以解决政治科学家在使用受监督文本模型方面面临的挑战。作者用三个应用程序证明了合成文本的实用性，包括生成描述乌克兰战斗的虚拟推文，为训练事件检测系统的合成新闻文章，以及训练句子级民粹主义分类器的多语言语料库。

Mar, 2023

文本文件的变分深层语义哈希

本文提出了一系列新颖的基于深度生成模型的文本哈希方法，并通过实验证明了深度学习在文本哈希中的有效性。

Aug, 2017

图神经网络与语言模型相遇：用于具有归属属性的文档转化为演示文稿

自动从长文档的文本中生成演示文稿是一个具有挑战性和有用的问题。我们提出了一种基于图神经网络和语言模型组合的方法，通过学习输入文档的图形并为每张幻灯片分配内容，生成具备更好的非线性叙述性的演示文稿，并与直接使用语言模型的方法进行了实验证明我们方法的优点。

May, 2024

HySPA：用于可扩展文本到图形提取的混合跨度生成

本文介绍了一种名为 Hybrid Span Generator (HySPA) 的混合跨度生成器，它可以对文本中的信息图进行可逆映射，直接生成节点和边类型的交替序列，并在线性时间和空间复杂度内对跨度和类型进行解码。在 ACE05 数据集上的实验表明，该方法在联合实体和关系提取任务上也显着优于现有技术。

Jun, 2021

自动主题生成的分层潜在语义映射

本文提出一种新的名为 Hierarchical Latent Semantic Mapping (HLSM) 的主题生成方法，它可以自动从语料库中生成主题，并使用单词之间的关联和层次生成主题网络。实验表明，相比于现有的一些最先进的方法，HLSM 在几个文档集合上表现良好。

Nov, 2015

随心所欲：具有层次语义图的运动扩散模型细粒度控制

提出了一种利用分层语义图实现对人体运动生成的细粒度控制的方法，通过将运动描述分解成三个层次的语义图，从整体到局部的结构帮助全面理解运动描述和对运动生成进行细粒度控制，并对分解的文本到运动扩散过程进行了优化，通过修改分层语义图的边权重，实现了生成运动的持续细化，具有超过基准数据集 HumanML3D 和 KIT 的优越性能。

Nov, 2023

从文字描述中合成构成动画

本文针对自然语言描述的运动合成问题，提出了一种基于两级流模型的生成复合动作的技术，利用两个流分别表示上下半身的动作，能够有效地生成短句和复合句中描述的 3D 姿态序列，与已有研究相比，实验结果表明我们的模型在客观评价方面进步了 50% 以上，在主观评价方面也得到了很好的实验结果。

Mar, 2021