Jun, 2023
基于领域内语言模型的诊断推理多任务训练
Multi-Task Training with In-Domain Language Models for Diagnostic
Reasoning
TL;DR 本研究的重点是使用 DR.BENCH 这一包含6个任务的综合生成AI框架对领域内和领域外语言模型进行比较分析,发现多任务、经过临床训练的语言模型在DR.BENCH中的问题总结任务中表现超过了其一般领域的对应物,取得了28.55的ROUGE-L得分,显示出了为优化临床诊断推理任务而进行领域特定的训练的价值。