BriefGPT.xyz
大模型
Ask
alpha
关键词
human metrics
搜索结果 - 1
面向人的对话系统评估指标
提出基于心理学,对话系统评估的度量标准,包括情感熵、语言风格和情感匹配度、宜人性和共情等 5 个指标。将这些指标与 6 个最先进的自动评价指标进行比较,并使用三种不同模型(ChatGPT、GPT-3 和 BlenderBot)的对话数据集进
→
PDF
a year ago
Prev
Next