BriefGPT.xyz
Ask
alpha
关键词
multiple choice quizzes
搜索结果 - 1
COGNET-MD,医学领域中大型语言模型基准的评估框架和数据集
大型语言模型 (LLMs) 在医学诊断中具有辅助医生或模拟医生工作流程的能力,本研究提出了一种用于医学领域中 LLM 评估的认知网络评估工具包 (COGNET-MD),该工具包包含了一个评分框架以提高对 LLMs 解读医学文本的能力,并伴有
→
PDF
2 months ago
Prev
Next