上下文中的结构化缩写扩展
长文本任务的困难程度及其特性对于研究具有重要意义,需要使用更准确的词汇和描述来理解长文本任务的相似性和差异性。本文提出了两个衡量长文本任务困难程度的维度:信息扩散和任务范围,并通过对相关文献的调查和定位,阐明了其重要性和未来的研究方向。
Jun, 2024
提出了一个处理模糊的假设的新系统,使用自然语言生成模型来从一个前提中推出另一个前提并以双向的方式搜索。 使用回路验证程序过滤质量不佳的生成来确保正确性。 该系统在修改后的 EntailmentBank 数据集和名为 “Everyday Norms:Why Not?“的新数据集上表现出可以恢复跨领域和非领域的前提的能力。
Nov, 2022
本文探讨了在提取式摘要中基于全文进行 contextualized rewriting,将其形式化为 seq2seq 问题,引入 group tag 作为解决方案来建立关联,通过基于内容的寻址方法识别提取式摘要,结果表明我们的方法明显优于非上下文的重写系统,无需采用强化学习,在多个提取式摘要生成器上显示出显着提高的 ROUGE 分数。
Jan, 2021
本研究探讨了一种简单的降低标注成本的方法,即采用分层抽样和控制变量等技术,结合文档成员身份信息和自动评估指标,从而在固定标注预算下获得更高的准确性。在测试集上,相比于纯随机抽样,平均误差降低了高达 20%。该技术易于实现且适用于类似结构的问题。
Apr, 2022
利用临床备注合成摘要(BHC synthesis)的大型语言模型(LLMs)在临床研究中表现出良好的性能,本研究提出了一个新的评估标准和数据集,用于评估临床备注合成中 LLMs 的性能,并通过定量和定性评估展示了高质量的摘要表现。
Mar, 2024
在长文本任务中,我们提出了一种评估方法,该方法设计了一个合成文本集合来评估语言模型和检索模型的输出质量,并以摘要的形式呈现相关见解和引文。研究结果表明,当前的系统在这种任务上仍存在挑战,并希望未来的系统能够在该任务上取得超越人类的性能。
Jul, 2024
提出了一种新的生成长文本的方法 SOE,它采用了概述、大纲和扩展的方法来为每个段落生成高效的文本,并通过重构策略无监督地提取每个段落的摘要以避免繁琐的总结过程。
Oct, 2020
本文首次给出了代码概括模型所发现的模式的形式化定义,并提出了一种推断正则语言文法的声学算法。 PATIC 对代码 2vec 和代码 2seq 进行了评估并发现提取出的模式受限于局部和语法代码结构并缺乏语义含义。基于这些发现,本文介绍了正式定义模式的两个新方法:评估健壮性和提高代码概括模型的准确性。
Mar, 2023