Aug, 2022

DialogSum Challenge:对话摘要共享任务结果

TL;DR本文讨论对话摘要的 DialogSum Challenge 中四个团队使用自动和人工评估度量探索改进对话摘要性能的结果,并发现人工评估和自动评估之间存在巨大差距,需要更细致的评估方法。