- 神经文本生成的最佳 -$k$ 搜索算法
本文提出了一种平衡生成质量和多样性的确定性搜索算法,并在四个自然语言生成任务中进行了实验,结果表明该算法相较于强基准表现更具多样性和自然性,同时维持高生成质量。
- CJaFr-v3: 一个免费可获取的经过过滤的日法对齐语料库
本文介绍了一个包含 1500 万对日文 - 法文句子的平行语料库,展示了资源的数量和质量,以及他们进行过的过滤方式和评估结果。通过该语料库训练和评估了一些标准的 MT 系统,证明了其实用性和过滤质量的有效性。
- ACLBRIO:让抽象化摘要更有序
提出了一种新的非确定性分布训练方法,通过根据其质量分配概率质量到不同的候选摘要,从而解决确定性分布训练方法在推断时导致的性能下降问题, 在 CNN/DailyMail 和 XSum 数据集上均取得了优于现有方法的最优结果,并且与质量水平更相 - 评估英印方向的编辑后工作量
本文通过对英印文翻译的后编辑效率调查,证明后编辑技术可将翻译时间缩短 63%,击键次数减少 59% 且屏息次数减少 63%,同时还没有明显影响翻译质量。
- ACL使用长输入文本进行问答的 QuALITY 模型
本文介绍了一个名为 QuALITY 的多项选择问答数据集,它包含英文上下文段落,其平均长度约为 5,000 个标记,远长于现有典型模型所能处理的长度。该数据集基于整篇文章编写和验证问题,有一半的问题无法在时间限制下回答,说明简单的浏览和搜索 - EMNLP神经机器翻译质量与后编辑表现
本研究测试了在专业翻译中使用神经机器翻译(NMT)是否能够节省人工处理时间,并发现更好的 MT 系统确实能够减少英文到捷克文翻译过程中的修改次数,但是质量和编辑时间之间的关系并不是直接的关系,并且与短语词汇表机器翻译不同的是,BLEU 不能 - GRUEN 用于生成文本的语言质量评估
本研究提出了一种新的基于 GRUEN 模型的评估语法、无冗余、焦点、结构和连贯性等语言生成质量的自动评估指标。该指标不需要人工参考,具有无监督,确定性和适应性等优点,并通过实验验证了与人类评判高度相关的结果。
- MM提高实际场景神经机器翻译系统的鲁棒性
本文讨论机器翻译中神经机器翻译的鲁棒性在实际应用中的问题,以及提高模型鲁棒性的方法。
- ACL在文本生成模型中联合测量多样性和质量
本文章提出一种同时评估生成文本方法质量和多样性的度量标准,通过逼近学习生成模型和真实数据分布的距离,并介绍了基于 n-gram 和 BERT 特征的度量方法,并且在 Oracle 训练模式下使用相应显式分布之间的距离。最后,使用现有和提出的 - ACL将人类和统计评估统一为一体:自然语言生成
本文提出了一个统一的框架来评估 “人或机器生成” 的句子的错误率,并结合人类和统计学的评估来评估自然语言生成系统的多样性和质量,带来了更准确和全面的结果。
- 蛋白质模型质量评估的深度迁移学习
该研究提出了一种基于深度神经网络的蛋白质模型质量预测方法,利用少量输入特征和粗略模型描述以及数据库中已知蛋白质结构的迁移学习,达到了最先进的性能表现。
- 机器翻译的质量期望
该论文旨在讨论机器翻译是如何被应用的,如何评估其输出,以及如何提高机器翻译的质量,特别是作为人类翻译的生产力增强工具,其中需要考虑翻译本身的预期生命周期以及质量评估等问题。
- Texygen: 文本生成模型基准测试平台
Texygen 是一个支持对开放域文本生成模型进行研究的基准测试平台,它实现了大多数文本生成模型,并涵盖了一组用于评估生成文本的多样性、质量和一致性的度量标准。该平台有助于标准化文本生成研究,促进研究人员共享调整优化的开源实现,并改善未来文 - IJCAICOBRA:一种带有成对约束的快速简单的主动聚类方法
研究了约束条件下的聚类算法,并提出了一种名为 COBRA 的主动方法,该方法应用最适用的约束来尽可能少地产生好的聚类结果,以提高聚类质量和运行时间。
- 简单贝叶斯算法的最佳臂识别
本文提出了三种简单直观的贝叶斯算法,旨在通过适应性地分配测量功夫,有效地识别有限选项或设计中的最佳选择,而这些简单算法能够以最佳方式实现这一目标。
- IJCAI通过众包构建概念层次结构
本文提出一种基于众包的层次结构构建系统,包括不确定性建模和用信息增益准则选择问题的方法,实验结果表明该系统具有噪声鲁棒性、高效性和高质量的层次结构。
- 基于 IHS 变换的图像融合
研究论文探讨了不同的 IHS 转换技术并将其用于图像融合,并使用多种方法定量评估融合图像的质量和信息改善程度。