- 结构度量解锁:引入 PDD,一种用于位置语篇连贯性的自动度量
提出一种新的,用于量化两篇长篇文章之间的话语分歧的自动度量标准,该指标在代表性领域的三个数据集上进行了广泛的实验,证明与人类的偏好和 GPT-4 的连贯性评估更加一致,并且胜过了现有的评估方法。
- 使用图卷积网络建模文档结构相似性进行连贯度评估
研究了一种基于 GCN 的连贯性模型,能够捕捉文档之间的结构相似性,实现对语篇的连贯性评估和自动化文本评分,并在两个任务中实现了总体最佳。
- AAAI学习记忆蕴涵和语篇关系以实现一致的人物对话
本研究提出了一种学习记忆包含关系和对话关系以实现人物 - 一致性对话任务的方法,通过自然语言推理数据集中的包含文本对应用于前提 - 假设生成任务,学习隐含包含关系,同时以类似架构的内存应用于对话中的话语信息,这两个记忆空间的正交性限制确保隐 - 量化省略代词的话语支持程度
该研究通过中文话题链理论阐述了角色 - 动词的连续性如何区分了省略的代词和表述的故事角色的选择,并表明省略主语的情况下,角色 - 动词连续性比非省略主语更显著,从而证明了话题的一致性在可选省略代词的语言和情境中确实促进了代词的省略。
- ACLDiscoScore:使用 BERT 和上下文连贯性评估文本生成
介绍了一种基于 Centering 理论和 BERT 的参数化的 Discourse 评估度量,DiscoScore,在结构连贯性、事实一致性等方面优于当前流行的评估度量 BARTScore。
- ACLBlonDe:一种用于文档级机器翻译的自动评估指标
本文提出了一种新型的自动评估方法 BlonDe,通过将话语连贯性考虑在内来扩大自动翻译评估的范围,从句子级别提高到文档级别,该方法能够更好地区分文档级别的翻译质量改进和句子级别的改进,并且具有更好的判别性、可解释性和敏感性。在大规模的人类研 - ACL一种用于连贯性建模的多任务学习方法
本研究提出一种层次神经网络模型,通过多任务学习,同时预测文档层次的信息连贯得分和词级别的语法角色,利用两个任务之间的归纳转移,提高模型泛化能力,并在不同任务中达到了新的最优表现。
- AAAI论述性神经机器翻译的连贯性建模
本研究提出一种使用话语上下文和奖励机制来从话语角度提高翻译质量的模型,能够有效提高翻译质量和话语连贯性。
- 野外话语一致性:数据集、评估和方法
本文针对真实世界数据中的语篇连贯性方法进行了评估,并引入了新的数据集和神经模型进行性能比较和分析,结果表明神经模型表现最佳,在四个领域的低连贯性文本中发现了一些规律。
- 基于话语的目标实现快速无监督句子表示学习
该研究针对神经网络句子编码器的无监督训练提出了一种新的客观函数,通过利用段落级话语连贯性的信号训练这些模型以理解文本,该目标是纯判别式的,使我们能够比之前的方法更快地训练模型,并且产生在外部评估中表现良好的模型。
- 开放领域话语连贯性的神经网络模型
本研究提出了一种无域限制的神经模型,可用于度量多个方面的连贯性,并能在生成新语句时保持连贯性,该模型包括区分性模型和生成性模型,以及一种新的基于神经潜变量马尔科夫生成模型,可捕获文本中句子之间的隐含连贯性依赖关系,并在多个连贯性评估方面取得