Oct, 2023

PromptCBLUE: 医学领域的汉语提示调优基准

TL;DR为了促进医学大语言模型的研究,我们将中文生物医学语言理解评估 (CBLUE) 基准重新构建为一个大规模的提示调整基准,PromptCBLUE,用于评估中文大语言模型在广泛的生物医学任务上的多任务能力,包括医学实体识别、医学文本分类、医学自然语言推理、医学对话理解和医学内容 / 对话生成。在这些任务上,我们已经进行了实验并报告了目前使用不同微调技术微调的 9 个中文大语言模型的结果。