Jul, 2024

BotEval:促进互动人类评估

TL;DR本研究针对现有自然语言处理模型在复杂交互任务中的评估缺口,提出了BotEval,一个可轻松定制的开源评估工具包。BotEval通过允许人类评估者与聊天机器人互动来改进评估过程,其灵活性与用户友好性得到了良好平衡,具有丰富的模板和与流行众包平台的内置兼容性。该工具能够显著提升对聊天机器人的评估效率,尤其是在对话管理方面。