- 事实与感受:在表格转文本生成中捕捉客观性和主观性
通过对线性化表格进行序列到序列模型的微调和在流行的大型语言模型上进行提示,我们分析了从定量和定性的角度来确保捕捉主观性和事实的一致性的结果,显示出微调的 LMs 可以接近提示的 LLMs。根据我们的了解,我们提供了一种多类型和包含主观性的表 - 基于表格转文本方法探索在基于 LLM 的领域混合数据上增强问答效果的影响
通过比较分析不同 Table-to-Text 方法生成的语料库对 QA 系统性能的影响,为开发稳健 QA 系统的学术和工业界提供有价值的参考。
- LLMs 的有效表格推理能力提炼
本论文提出了一种新颖的基于表格推理的蒸馏方法,通过将大型语言模型(LLMs)蒸馏成专门为基于表格推理任务设计的小型模型,实验证明使用蒸馏数据进行微调的 0.22 亿参数模型(Flan-T5-base)在科学表格文本生成数据集(SciGen) - STOAT: 用控件将结构化数据转化为分析性文本
本论文提出了一种基于 STOAT 模型的分析文本从结构化数据(如表格)生成方法,该模型可在输出中增加给定的推理类别,如数字推理、常识推理、时间推理、表格知识和实体知识,并在人类评价中比基准模型生成了 15.3% 更忠实和分析的描述。
- ACLTabGenie:一款用于表格到文本生成的工具包
TabGenie 是一个工具包,使用统一的表格文本生成框架使研究人员能够探索、预处理和分析多种数据到文本生成的数据集。
- 基于提示的少样本表格文本生成适配器
本文介绍了一种基于 Prompt-based Adapter (PA) 的方法,通过注入 prompt 模板对特定领域的知识和表格相关的表示进行数据增强,从而在少量样本情况下实现表格到文本的生成任务。相比之前的方法,在 Humans、Boo - ACL提高用户控制的表格到文本生成鲁棒性
本研究探讨用户控制的表格转文本生成,针对嘈杂、冗余、不连贯的单元选择提出了一种微调策略,使生成模型的性能可以在用户噪声输入上得到提高,同时在 ToTTo 数据集上达到与现有最先进模型相当的性能水平。
- ACLPlan-then-Seam: 实现高效的表格到文本生成
本文提出了第一个完全的非自回归表格到文本模型(Plan-then-Seam,PTS),通过使用一个新颖的重新思考指针预测器编写和校准内容的计划,然后将计划作为上下文进行拼接以解码描述,从而在保持并行解码的同时,通过共享参数并迭代执行这两个步 - 带有提示计划和知识记忆的少样本数据表格转文本生成
本论文提出 PromptMize 框架,通过 prompt signal 和 knowledge adapter 对 pre-trained language models 进行 few-shot table-to-text generat - EMNLPPLOG:表格到逻辑预训练用于逻辑表格到文本生成
通过提出预先训练逻辑形式生成器(PLOG)框架,该框架首先在表格生成逻辑形式的任务上进行了预训练,然后在下游的表格到文本任务上进行 fine-tuning,可以有效地提高表格到文本生成模型的逻辑水平。在两项基准测试中,PLOG 在逻辑水平上 - ACL具有结构感知等变学习的强健 (可控) 表格到文本生成
提出一种基于自我注意力机制的等变学习框架,通过在单元格层面有效表达表格内容之间的关系,并保证模型对内容不变的结构变换具有鲁棒性以提高 table-to-text 生成模型在 ToTTo 和 HiTab 数据集上的性能。
- 参与、记忆和生成:向忠实、少样本表格到文本生成迈进
本文提出一种基于少样本学习在表格文本生成中应用的新方法 AMG,该方法通过对多粒度上下文的关注、动态记忆表格分配状态和综合上下文和记忆状态来生成忠实的文本,实验结果表明,该方法在准确性和连贯性等方面优于其他基准模型。
- ACL素描并完善:向忠实和信息丰富的表格到文本生成迈进
本研究提出了一种基于骨架的两阶段方法,将自回归和非自回归方法相结合用于表格到文本生成中,通过集成骨架的硬约束来提高生成的覆盖率和忠实度,实验结果显示了我们的方法在自动和人工评估中都表现出优越性能。
- AAAI从实体中心视角探索开放领域表格生成的忠实度
本文旨在评估表格生成的忠实度,并采用两个与实体相关的度量标准来评估生成忠实度,并基于这些数据提出了两种增强训练方法和训练实例选择方法来提高生成保真度,在完整数据集和少量数据集学习中均有所改善。
- GPT-$3$ 中适宜的上下文示例是什么?
本文提出一种基于召回模块的提示选择策略,以更好地利用 GPT-3 的少样本能力,并在自然语言处理和生成任务中实现了显著的性能提升,特别是在表格转文本和开放领域问答等任务中。
- EMNLP三维有效分层编码表格生成文本
本文主要介绍了一个改进型的 Seq2Seq 模型,可用于将多维表格转化为文本,并针对表的多个维度建模,并在 NBA 篮球比赛数据的基准数据集 ROTOWIRE 上进行了评估,效果明显。
- 以关键事实为枢轴:低资源表格到文本生成的双阶段模型
在仅有有限平行数据的低资源情况下,本文提出了一种将结构化数据转化为非结构化文本的表格转文本生成模型,将生成过程分为关键事实预测和表面实现两个阶段,其中关键事实预测需要的注释数据更少,而表面实现则可以通过伪平行语料库进行训练,在传记生成数据集 - AAAI结构感知 Seq2seq 学习的表格到文本生成
本文提出一个新结构的 seq2seq 模型,包含场门编码器和生成器,以及双重注意力机制,通过编码和解码阶段实现了对表格内容和结构的建模,从而实现了表格到文本的生成任务,并在 WIKIBIO 数据集上取得了优于基线的结果。
- 基于结构化数据的订单规划神经文本生成
研究人员提出了一种基于训练有素的神经网络的文本生成模型,以便从结构化数据中(例如表格)生成自然文本,该模型能够捕捉不同字段之间的关系,以生成更流畅的文本。