上下文中的结构化缩写扩展

EMNLPOct, 2021

Structured abbreviation expansion in context

Kyle Gorman, Christo Kirov, Brian Roark, Richard Sproat

TL;DR该研究探讨了在上下文中恢复规范化的缩写消息的任务，开发了两种强大的基准线来进行缩写扩展，并生成了一个大型的开源缩写数据集。

Abstract

ad hoc abbreviations are commonly found in informal communication channels that favor shorter messages. We consider the task of reversing these abbreviations in context to recover normalized, expanded versions of abbreviated messages. The problem is related to, but distinct from, spell

ad hoc abbreviations message normalization abbreviation expansion spelling correction data set

发现论文，激发创造

具有不完整信息的自然语言推断

通过混合演绎（前向）和择优推断（后向）生成步骤进行阴性推断，以验证其他假设的缺失证据，避免致信任错误。

Jul, 2023

如果只需检索，是否真的需要长文本背景？朝着真正困难的长文本 NLP 迈进

长文本任务的困难程度及其特性对于研究具有重要意义，需要使用更准确的词汇和描述来理解长文本任务的相似性和差异性。本文提出了两个衡量长文本任务困难程度的维度：信息扩散和任务范围，并通过对相关文献的调查和定位，阐明了其重要性和未来的研究方向。

Jun, 2024

自然语言推断与不完整信息

提出了一个处理模糊的假设的新系统，使用自然语言生成模型来从一个前提中推出另一个前提并以双向的方式搜索。使用回路验证程序过滤质量不佳的生成来确保正确性。该系统在修改后的 EntailmentBank 数据集和名为 “Everyday Norms：Why Not?“的新数据集上表现出可以恢复跨领域和非领域的前提的能力。

Nov, 2022

文本摘要的上下文重写

本文探讨了在提取式摘要中基于全文进行 contextualized rewriting，将其形式化为 seq2seq 问题，引入 group tag 作为解决方案来建立关联，通过基于内容的寻址方法识别提取式摘要，结果表明我们的方法明显优于非上下文的重写系统，无需采用强化学习，在多个提取式摘要生成器上显示出显着提高的 ROUGE 分数。

Jan, 2021

本地典型采样

本文提出了一种信息论分析的方法，可用于生成自然语言，可以更好地解释概率语言生成器的行为，提出了一种名为本地典型采样的过程，并证明该过程在生成摘要和故事时可以提高质量。

Feb, 2022

机器翻译人类评估的有效性改进探讨

本研究探讨了一种简单的降低标注成本的方法，即采用分层抽样和控制变量等技术，结合文档成员身份信息和自动评估指标，从而在固定标注预算下获得更高的准确性。在测试集上，相比于纯随机抽样，平均误差降低了高达 20%。该技术易于实现且适用于类似结构的问题。

Apr, 2022

基于领域适应的大型语言模型性能评估 —— 生成医院病程简介的基准测试

利用临床备注合成摘要（BHC synthesis）的大型语言模型（LLMs）在临床研究中表现出良好的性能，本研究提出了一个新的评估标准和数据集，用于评估临床备注合成中 LLMs 的性能，并通过定量和定性评估展示了高质量的摘要表现。

Mar, 2024

一个干草堆的总结：对于长文本 LLMs 和 RAG 系统的挑战

在长文本任务中，我们提出了一种评估方法，该方法设计了一个合成文本集合来评估语言模型和检索模型的输出质量，并以摘要的形式呈现相关见解和引文。研究结果表明，当前的系统在这种任务上仍存在挑战，并希望未来的系统能够在该任务上取得超越人类的性能。

Jul, 2024

通过从摘要中进行分层监督进行长文本生成的总结，概述和阐述

提出了一种新的生成长文本的方法 SOE，它采用了概述、大纲和扩展的方法来为每个段落生成高效的文本，并通过重构策略无监督地提取每个段落的摘要以避免繁琐的总结过程。

Oct, 2020

代码概括模型学习所得的解析

本文首次给出了代码概括模型所发现的模式的形式化定义，并提出了一种推断正则语言文法的声学算法。 PATIC 对代码 2vec 和代码 2seq 进行了评估并发现提取出的模式受限于局部和语法代码结构并缺乏语义含义。基于这些发现，本文介绍了正式定义模式的两个新方法：评估健壮性和提高代码概括模型的准确性。

Mar, 2023