Jun, 2023

基于领域内语言模型的诊断推理多任务训练

TL;DR本研究的重点是使用 DR.BENCH 这一包含 6 个任务的综合生成 AI 框架对领域内和领域外语言模型进行比较分析,发现多任务、经过临床训练的语言模型在 DR.BENCH 中的问题总结任务中表现超过了其一般领域的对应物,取得了 28.55 的 ROUGE-L 得分,显示出了为优化临床诊断推理任务而进行领域特定的训练的价值。