BriefGPT.xyz
大模型
Ask
alpha
关键词
interactive evaluation
搜索结果 - 3
通过交互评估数学语言模型
使用交互式评估方法评估大型语言模型在大学级数学推理方面的能力,为人工智能从业者和数学教授提供可行的建议,重点在于模型应该如何处理不确定性和人类纠错。
PDF
a year ago
AAAI
DSTC9 中的对话跟踪交互式评估
该论文介绍了针对开放领域对话系统的交互式评估方法,为开发基于知识的响应生成模型,探索将其扩展到与真实用户的交互中提供挑战,从而介绍了从静态语料库到交互式评估的进展,以及如何最好评估开放领域对话模型的见解。
PDF
2 years ago
走向统一的对话系统评估:对当前评估协议的全面分析
本文针对对话系统中的评估协议不统一的问题,综合研究了人工评估和自动评估方法,建议建立更加健壮和统一的评估协议,并对目前使用的自动、静态和交互式评估方法进行分析,最终通过与 Alexa Prize 2020 中的系统 - 用户对话数据进行比较
→
PDF
4 years ago
Prev
Next