实用信息文本生成
提出一种自然语言生成系统设计的概念框架,以实现复杂的交际目标,并通过现代统计方法提供针对目标、成本和效用的具体建议。同时,倡导开发可以通过类人的方式推理目标、成本和效用的 NLG 系统。
Oct, 2022
人们通过上下文来丰富文字表达,实现简洁而有效的沟通,为了让人工智能系统能够与人类进行自然交互,需要强调语用学技能,从分享语言目标和约定到视觉和肢体世界中的语境等,利用各种上下文信息有效地运用语言。本文调查现有的语境实现和语用模型方法,并分析了每个工作中的任务目标、环境语境和沟通便利之间的关系,从而丰富了语言含义。我们提出了关于未来基于任务设计的语境需求,以自然地引出语用现象的建议,并建议在更广泛的沟通语境和便利方面继续探索。
Nov, 2022
本文研究了在信息不对称的对话中生成信息丰富的问题的问题,提出了一种基于启发式思考而非答案预设的提问策略,并使用强化学习算法优化问题的信息丰富程度,并优化问题的特定性,结果表明此策略比其他对比模型更能有效提高提问问题的信息量和特定性。
Apr, 2020
本文通过在英语材料的专家评估集上进行零 - shot 提示,进行了人类和语言模型在七个语用现象上的精细比较,发现最大的模型可以实现高精度和匹配人类错误模式,同时发现证据表明模型和人类对相似的语言提示敏感,旨在探讨人类语用处理机制和语言模型之间的关系。
Dec, 2022
本文介绍了一些控制文本生成的方法以增强语言生成模型的创造力和公平性,包括层级生成和约束解码,并应用于故事、诗歌、比喻语言的创意生成,以及减少生成模型的社会偏见。
Sep, 2022
论文分析了自然语言生成过程,并通过信息理论解释了高概率和高质量并不总是一致的现象,得出语言生成应包含接近自然字符串分布熵的负对数概率数目,初步实证结果表明高质量的文本具有信息量与自然字符串分布熵更接近的特点。
Mar, 2022
通过端到端训练的两步生成模型,即首先由句子级内容规划器决定涵盖的关键词组和所需的语言风格,然后由表面实现解码器生成相关和连贯的文本,可以显著优于现有竞争模型,在 Reddit 的说服性论证、维基百科的正常和简单版本的段落生成以及科学文章的摘要生成等任务中得到验证。
Sep, 2019