- LIDAO: 限制干预以解决(大规模)语言模型偏见问题
大型语言模型中的公平性和流畅度之间的权衡问题研究,提出了一种基于信息论的框架 LIDAO,用于使语言模型更好地实现公平性而仍保持流畅度。
- 大型语言模型是语法错误修正的最先进评估器
研究发现大型语言模型(LLMs)在语法错误纠正(GEC)评估中表现优异,特别强调了流畅度作为评估标准的重要性。
- 辛普森悖论与翻译的准确性与流利性权衡
一篇关于翻译质量评估和机器翻译系统的研究,发现在语料库的层次上准确性和流畅度呈正相关,但在单个源段的层次上二者存在权衡,对于评估翻译质量和改进机器翻译系统具有重要影响。
- 语言模型的流利梦境
采用进化提示优化算法来实现语言模型的流畅梦幻,从而同时最大化所选内部特征和提示流畅性之间的帕累托前沿。
- ACL用于评估句子级流畅性的无监督方法:我们真的需要参考吗?
该研究在不使用参考文献的情况下,利用各种词嵌入和递归神经网络结构的语言模型,通过比较分析 10 种印度语言中的流畅度评分与人工判断的相关性,提供了一种测量文本流畅性的新方法。
- EMNLP走向统一的对话推荐系统:基于上下文化知识蒸馏的多任务学习
论文提出了一种多任务学习的统一对话式推荐系统,通过上下文知识蒸馏,在提高推荐效果的同时增强了流畅性,并在多样性方面取得了可比较的结果。
- 理解长文问答的检索增强
通过使用相同的证据文档比较使用不同检索增强模型生成的答案,分析了检索增强对不同语言模型的影响,以及检索文档集的质量对相同语言模型生成的答案的影响。研究了生成答案的各种属性(如流利度、长度、差异等),重点是将生成的长篇答案与上下文证据文档进行 - 构建可靠流畅的大型语言模型:在问答系统中引入反馈学习循环
为了解决大型语言模型在引文、正确性和流畅度方面存在的问题,本研究通过构建数据集、引入自动化反馈机制和反馈学习循环,成功提高了 ChatGPT 的引文和流畅度指标,并保持高水平的正确性。
- 通过听觉引导的零射频音频字幕生成
音频字幕任务与图像和视频字幕任务在本质上相似,但鲜有关注。我们提出了音频字幕的三个愿景:生成文本的流畅性,生成文本对输入音频的忠实度以及听觉可感知性。我们的方法是零样本方法,不通过学习而是通过推理过程来进行字幕生成,其中涉及的三个网络对应三 - MM对话式问答的提示引导式复制机制
在本文中,我们提出了一种可插拔的抽取方法,引入了一种新的提示引导复制机制,以提高提取回答的流畅性和适切性。我们的方法使用提示来链接问题和答案,并利用注意力来指导复制机制,验证提取回答的自然性并进行必要的编辑,以确保回答流畅且适切。三个提示包 - 评估检索增强型大语言模型的归属和流畅度平衡
研究探讨了在知识密集型对话设置中,提示检索证据的 LLMs 的流畅度与归属之间的关系,并提出了改善 LLMs 总体质量的方法。实验结果显示,更大的模型在流畅度和属性方面表现更好,并且使用 top-k 检索可以提高属性,但有损于流畅度。研究提 - 以人类判断为指南,引导正式转移的自动度量
本文针对文本形式转换的评估问题进行研究,重点关注了风格强度、内容保留和流畅度等三个方面的评估,对常见与新型度量标准进行了人工评估和相关分析,提出了在通用性使用情况下建议及其在相关任务中的外推性。
- ACL无监督和有监督机器翻译中系统风格差异及其在高资源机器翻译中的应用
比较了具有相似质量的监督机器翻译和无监督机器翻译系统之间的翻译结果,发现无监督输出在流畅性和结构上比监督机器翻译更不同,同时提出一种将两种方法相结合的方式,可通过人工评估提高充分性和流畅性。
- 在数据到文本生成中控制单词级别的幻觉
通过使用多分支解码器,结合基于共现分析和依存解析的简单高效的评分过程,针对 Data-to-Text Generation 的问题 ——Hallucinations 作出了研究,成功地减少了 Hallucinations,同时保持生成文本的 - 神经生成的即时注意力调节
本研究通过分析语言模型在句子级别的注意力模式,发现神经退化可能与注意机制对任务特征的学习不足有关。因此,提出了一种称为‘实时注意力调节’的方法,该方法在推理过程中向注意力计算注入学习先验知识,有效地改善了语言模型生成的文本的流畅性、创造性和 - 鲁棒对话话语改写的序列标注
该论文提出了一种基于序列标注的对话重写模型,通过在 REINFORCE 框架下注入 BLEU 或 GPT-2 等损失信号,提高了生成语句的流畅度,进而在领域转移方面显示出比当前最先进系统更大的改进。
- COLING探究生成深度问题的问题特定奖励
通过强化学习优化针对问题产生特定目标的奖励,如流畅性、相关性和可回答性,以提高生成问题的质量。优化问题特定的奖励通常会在自动评估指标中表现出更好的性能,但是,仅与人类判断相关的奖励(例如相关性)会在实际问题质量上带来真正的改善。只优化可回答 - ACL关于使用回译训练的机器翻译系统的评估
使用反向翻译作为数据增广技术可以提高自然文本和翻译文本的翻译质量,并且人类翻译者更喜欢反向翻译的产物,因为它们更加流畅,建议使用语言模型得分来衡量流畅度。
- EMNLP非平行文本转换的无监督评估指标和学习标准
该研究提出了一种自动生成文本释义并修改其属性或属性的方法,解决了 “无对照数据” 的问题,利用多种模型进行实验并给出新的损失函数和训练策略,提高了语义保留和流畅度,该方法能够显著提高基准方法。
- 面向文档相关对话的数据集
本研究介绍了一个文档驱动的文本对话数据集,包含关于热门电影的维基百科文章,利用两种神经网络模型对话,结果表明这种方法引入了更多信息,提高了生成回答的流畅度和吸引力。