BriefGPT.xyz
大模型
Ask
alpha
关键词
ensemble disagreement scores
搜索结果 - 1
有效的人工标注代理:工业自然语言处理中大型语言模型的集成不一致得分
在这篇论文中,我们通过在关键词提取任务上的评估,展示了集成不一致分数作为语言模型在零样本、少样本和微调设置下人类标注的代理的良好效果。通过与真实错误进行比较,我们发现,不一致分数比使用另一个语言模型作为机器标签或银标签,更好地估计了模型的性
→
PDF
10 months ago
Prev
Next