BriefGPT.xyz
Ask
alpha
关键词
g4ue dataset
搜索结果 - 1
SIGIR
超越准确性:探究 GPT-4 对 USMLE 问题的错误类型
GPT-4 在医疗问答任务中表现出高准确性,但仍存在约 14% 的错误。因此,我们引入了一种与医学学生合作得出的新的领域特定错误分类系统。我们的 GPT-4 USMLE Error(G4UE)数据集包含 4153 个 GPT-4 正确回答和
→
PDF
3 months ago
Prev
Next