BriefGPT.xyz
Ask
alpha
关键词
qa evaluation
搜索结果 - 3
评估开放式问答系统评估
本研究针对认知智能领域中的 Open Question Answering 任务进行评估,提出了 QA Evaluation 任务和相应的数据集,在考虑到自动评估方法的局限性的基础上,采用人工评估来更准确地衡量基于人工智能的答案的准确性和
→
PDF
a year ago
EMNLP
公开域问答的答案等效性问题
本文探讨了利用知识库中的别名实体作为额外的 “金标准答案” 来提高 QA 系统的评估和训练效果,并在三个 QA 基准数据集上验证了其有效性。
PDF
3 years ago
ACL
NoiseQA: 以用户为中心的问答挑战数据集评估
本文研究 Question-Answering 系统在实际部署中的问题,发现在回答引擎之前的管道部件可能会引入多样化且可观的错误,而且即使是针对强大的预训练 QA 模型,性能也会因为这些上游噪声源而显著降低。作者认为在 QA 系统能够真正有
→
PDF
3 years ago
Prev
Next