- 用校准的置信度评分增强对由 LLM 生成的代码摘要的信任
通过使用大型语言模型 (LLMs) 自动 AI 方法生成的摘要进行性能测量和校准来检测其是否与人工生成的摘要足够相似。
- SPEER:通过嵌入式实体检索进行长临床摘要的句子级规划
通过训练较小的编码器模型预测显著实体,使用 SPEER 进行句子级规划以增强摘要的内容涵盖度和准确性。
- 从稀疏到稠密:GPT-4 基于密度链的摘要生成
通过密度链(CoD)提示,GPT-4 生成更多抽象、融合度更高、少有引导偏见的摘要,人类更喜欢这些摘要,表明了信息量和可读性之间的权衡。
- SUMBot: 开放域对话系统中的上下文概述
本文研究了在开放式对话系统中将相关信息作为上下文的问题,并提出了一种替换上下文部分的简易方法以增加模型跟踪先前相关信息的能力,以期提高答案生成任务的效果。
- CHQ-Summ: 消费者健康问题摘要数据集
为了解决消费者在网络上描述医疗需求时使用过度描述性和周边信息,从而导致自然语言理解困难的挑战,我们介绍了一个新的数据集 CHQ-Summ,其包含 1507 个专业领域的消费者健康问题及相应摘要。同时,我们在多个最先进的摘要模型上对该数据集进 - 可微分多智能体演员 - 评论家算法在多步放射学报告摘要中的应用
本研究提出一种新的基于层级结构的放射学报告摘要方法,将提取性摘要分解为关键句和关键词的提取任务,并采用两步法的方式进行生成,实验结果显示此方法与传统单一或双一的实验方法相比,能够更准确地生成摘要,总体 F1 得分提高了 3-4%。
- 以问答形式作为自动度量指标,评估摘要的内容质量
提出一种基于问答的评估度量标准(QAEval)来评估摘要的内容质量,通过分析 QAEval,证明 QA-based methods 相较于传统的基于文本内部匹配的度量标准(如 ROUGE)更加准确。
- ACL从争论到关键点:自动争论摘要化
本文提出了将大量讨论中的摘要表示为少量关键点的想法,并根据其显著性对每个关键点进行评分。通过分析大型数据集及实验结果表明,针对一个特定话题,少量关键点通常足以涵盖绝大部分的讨论内容,同时也发现领域专家通常可以提前预测这些关键点。文章探讨了将 - AAAI抽象化摘要的联合解析与生成
本文提出了一种新颖的神经网络架构用于抽象概括及句法解析的同时生成摘要,同时还描述了一种新颖的人工评估协议来评估摘要是否符合原始含义,经评估证明该方法在多个摘要数据集上与强基线相比表现出有竞争力的结果。
- 基于查询条件的三人对抗网络在视频摘要中的应用
本文提出了一种查询驱动的三方生成对抗网络,通过学习用户查询和视频内容的联合表示,并引入三方损失函数,即鼓励生成器学习更好的摘要结果,避免生成随机无意义摘要。实验结果表明,该方法在一些查询驱动的视频摘要基准数据集上表现出了高效性和可行性。
- 通过联合嵌入和稀疏优化实现多视角监视视频汇总
介绍一种通过联合嵌入和稀疏代表选择的新颖无监督框架来总结多视角视频,该方法能够提取出多视角视频之间的复杂内部和外部关联,实现高效准确的摘要生成。
- 判别式书籍摘要新的对齐方法
采用不监督的方式对一本书的全文与人工撰写的摘要进行对齐,通过使用基于隐马尔科夫模型的两种新方法来解决长度差异的问题,并在抽取式书籍摘要任务上取得了一定的效果。尽管还有很大的提升空间,但无监督对齐在提供哪些书籍特征值得总结方面具有内在价值。