BriefGPT.xyz
大模型
Ask
alpha
关键词
multidimensional evaluation
搜索结果 - 2
SD-Eval: 口语对话理解的基准数据集超越文本
为了评估和改进大型语言模型在口语对话理解和生成方面的能力,我们提出了 SD-Eval 标准数据集,该数据集聚合了代表情感、口音、年龄和背景声音的四个维度的 7,303 个话语,总计 8.76 个小时的语音数据,并通过客观和主观评估方法,以及
→
PDF
15 days ago
使用 ChatGPT 进行文本风格转移的多维度评估
本文旨在通过评估 ChatGPT 在文本风格转换多维度评估中的作用,与现有的自动度量以及人类判断的对比。结果表明,在不同等级下,与现有的自动度量相比,ChatGPT 与人类判断具有相似的相关性。
PDF
a year ago
Prev
Next