BriefGPT.xyz
Ask
alpha
关键词
error taxonomy
搜索结果 - 3
SIGIR
超越准确性:探究 GPT-4 对 USMLE 问题的错误类型
GPT-4 在医疗问答任务中表现出高准确性,但仍存在约 14% 的错误。因此,我们引入了一种与医学学生合作得出的新的领域特定错误分类系统。我们的 GPT-4 USMLE Error(G4UE)数据集包含 4153 个 GPT-4 正确回答和
→
PDF
3 months ago
探索会议总结的自动评价指标
会议总结的关键任务是识别和提取关键字,但现有评估指标无法准确捕捉会议特定错误,本文通过对人工评估和自动评估的相关性研究,揭示自动指标无法捕捉可观测错误且掩盖了某些错误,同时发现不同模型架构对会议文件中的挑战有不同的响应,存在明显的挑战与错误
→
PDF
3 months ago
ACL
形态变化中的噪声研究
本文旨在探讨稀缺高质量数据的语言中的形态学屈折系统,包括对非监督形态学范式完成的管道内遇到的噪声类型进行了错误分类和注释流程、比较不同类型噪声对现有最新型变型模型的影响、再提出使用字符级屏蔽语言建模(CMLM)预训练目标探索其对模型的抗噪性
→
PDF
a year ago
Prev
Next