Apr, 2024

临床记录生成的两种模型设计比较;LLM是否是一种有用的一致性评估器?

TL;DR使用PEGASUS-XTransformer模型,分析了两种不同的方法来生成SOAP记事单的不同部分,并在记事单的一致性方面进行了比较。通过人工评估发现,Llama2等LLM模型可以与人类评估者达成相同的结果,从而证明LLM的使用在捕捉由自动度量衡无法获取的质量指标上具有可扩展性。