BriefGPT.xyz
Ask
alpha
关键词
nlg metrics
搜索结果 - 5
文本摘要中不确定性估计方法的性能评估可信吗?
通过引入综合评估标准,研究本文对两个大型语言模型和一个预训练语言模型在三个数据集上进行的不确定性估计能力的评估表明,多个不相关的自然语言生成指标和多样化的不确定性估计方法对于可靠高效地评估 UE-TS 技术至关重要。
PDF
11 days ago
语言生成模型对合成流量生成任务的评估度量
本文提出并评估了几种用于比较生成的流量与真实用户文本分布的度量标准,证明了常见的自然语言生成度量指标对于评估合成流量生成任务不适用。通过在三个任务上的实验验证,即购物话语生成、产品问题生成和查询自动完成,我们得出结论:我们的度量标准对于评估
→
PDF
8 months ago
排名:通过基于排名的方法增强孟加拉文本摘要
本文旨在通过利用基于排名的方法,比较四种不同的预训练孟加拉文本摘要模型的输出,从而识别给定文本的最准确和最有信息量的摘要,并使用标准自然语言生成指标来评估生成的摘要的有效性,结果表明通过利用每个预训练转换器模型的优势并结合它们,我们的方法显
→
PDF
a year ago
ACL
测验设计任务:帮助教师使用自动化题目生成器创建测验
本篇研究旨在利用标准化的 NLG 指标来检测 QGen 模型所带来的实际效果,并以教师自动生成阅读理解测试为例进行实际应用测试。虽然我们发现近期 QGen 取得了显著进展,但最佳模型仅得到了 10 名教师中的 68.4%同意接受的问题,同时
→
PDF
2 years ago
ACL
关于自然语言生成评估中自动度量标准进行更好验证研究
本文主要探讨自然语言生成领域中测评方法中的自动指标的应用和验证,提出了验证研究的最佳实践,并在 WMT'17 度量共享任务中进行了分析,同时也突出了未来的发展方向。
PDF
5 years ago
Prev
Next