BriefGPT.xyz
Ask
alpha
关键词
clue
搜索结果 - 3
CLUE: 用于 LLMs 的临床语言理解评估
为填补现有研究中缺乏对医疗领域广泛应用的临床任务的评估的空白,我们提出了一种适用于现实世界临床任务的基准测试工具 CLUE,并通过评估多个生物医学和通用领域 LLMs 的临床表现和适用性,推进医疗领域的 LLMs 评估和开发的标准化方法。
PDF
3 months ago
ICLR
δ-CLUE: 不确定性估计的多样解释集
通过扩展 CLUE 方法,我们提出了 δ-CLUE 来提供多个潜在的解释,使得模型对预测的结果更加有信心,从而更好地解释不确定性估计和概率模型。
PDF
3 years ago
COLING
CLUE:一个中文语言理解评测基准
该论文介绍了第一个大规模的中文语言理解评估基准,名为 CLUE,以帮助解决英语特定的自然语言理解模型难以用于其他语言的问题,并使用 9 个最先进的中文预训练模型来报告结果,并引入了一系列辅助数据集和工具以促进中文自然语言理解技术的进一步发展
→
PDF
4 years ago
Prev
Next