BriefGPT.xyz
Ask
alpha
关键词
human evaluation framework
搜索结果 - 3
ACL
文本简化系统是否保留含义?通过阅读理解的人工评估
自动文本简化(TS)旨在自动化重写文本的过程,使人们更容易阅读。本研究引入了人类评估框架以评估简化文本是否保留了含义,并通过阅读理解问题对文本进行了深入的人类评估和九种自动系统评估。
PDF
7 months ago
腾讯 LLMEval:人类对齐的 LLMs 的实际能力的层次评估
通过构建一个综合的人工评估框架,我们提出了一个评估大规模语言模型在不同实际任务中遵循指令的能力的方法,同时设计了详细的评估标准和过程,释放了一个包含不同难度水平和知识领域的测试集,并分析了自动化评估的可行性。我们的研究为评估英语和中文大规模
→
PDF
8 months ago
ECCV
HIVE: 评估视觉解释的人类可解释性
本研究提出了针对人类用户视觉解释的人类解释性评估框架 HIVE,通过对四种不同计算机视觉解释方法的评估,结果表明解释可以引起人类的信任,但人们难以区分解释的正确性,该框架开源以便未来研究和鼓励更多的以人为中心的解释性研究。
PDF
3 years ago
Prev
Next