Mar, 2024

基于领域适应的大型语言模型性能评估 —— 生成医院病程简介的基准测试

TL;DR利用临床备注合成摘要(BHC synthesis)的大型语言模型(LLMs)在临床研究中表现出良好的性能,本研究提出了一个新的评估标准和数据集,用于评估临床备注合成中 LLMs 的性能,并通过定量和定性评估展示了高质量的摘要表现。