Mar, 2024
基于领域适应的大型语言模型性能评估——生成医院病程简介的基准测试
A Benchmark of Domain-Adapted Large Language Models for Generating Brief
Hospital Course Summaries
TL;DR利用临床备注合成摘要(BHC synthesis)的大型语言模型(LLMs)在临床研究中表现出良好的性能,本研究提出了一个新的评估标准和数据集,用于评估临床备注合成中LLMs的性能,并通过定量和定性评估展示了高质量的摘要表现。