Jan, 2024

将医师诊断逻辑纳入大型语言模型:从过程反馈中进行偏好学习

TL;DR采用偏好学习的过程反馈(PLPF)方法,将医生的诊断逻辑整合到大型语言模型中,提高医疗对话生成的准确性和连贯性。实验结果表明,PLPF 方法在医学对话中通过 17.6%的基线模型提高了诊断准确率,并且在多轮和单轮对话任务中均表现出有效性。