BriefGPT.xyz
Ask
alpha
关键词
contrast set
搜索结果 - 1
使用对比集的大型语言模型评估:一种实验方法
在自然语言推理领域中,交叉熵损失度量被广泛应用于多输入文本分类任务,但该度量方式在有效评估模型理解语义蕴涵能力方面存在不足。本研究引入一种创新技术,通过自动替换动词、副词和形容词的近义词来产生斯坦福自然语言推理数据集的对比集,以评估模型表现
→
PDF
3 months ago
Prev
Next