BriefGPT.xyz
大模型
Ask
alpha
关键词
automated metric
搜索结果 - 3
SelfEval:利用生成模型的判别性质进行评估
使用文本到图像生成模型的自动化方法 SelfEval,可用于评估生成模型在多模态文本 - 图像辨别任务中的性能,并展示其与人工评估结果在文本忠实性上具有高度一致性。
PDF
21 days ago
通过用户满意度估计进行多域会话质量评估
本文提出了一种新的基于响应质量注释方法的自动化指标,通过引入五个新的与领域无关的特性集,实现了在单轮和对话层面上估计用户满意度的机器学习模型,并取得了较高的预测表现。
PDF
4 years ago
CVPR
CIDEr:基于共识的图像描述评估
本文提出了一种基于人类共识的评估图像描述的新方法,包括新的基于三元组的人类注释方法、一种捕捉共识的新自动化指标(CIDEr)和包含 50 个对每个图像进行描述的句子的两个新数据集(PASCAL-50S 和 ABSTRACT-50S)。使用这
→
PDF
9 years ago
Prev
Next