BriefGPT.xyz
大模型
Ask
alpha
关键词
dialogue-level human-annotated scores
搜索结果 - 1
ComperDial: 基于常识和角色的对话数据集与基准
我们提出了一个新的基准系统 ComperDial,用于为开放领域对话系统的训练和评估提供测评度量标准。ComperDial 包括来自 99 个对话代理的 1,485 个对话中的 10,395 个对话转折的人工评分响应,除了单个对话转折的评分
→
PDF
17 days ago
Prev
Next