Aug, 2024

大型语言模型的概率医学预测

TL;DR本研究解决了大型语言模型(LLMs)在生成临床预测概率时的可靠性问题。通过对比显式和隐式概率,该研究发现显式概率在区分、精确度和召回率方面的表现较差,尤其是在小型LLM和不平衡数据集上更为明显。这一发现强调了在临床应用中对生成概率的谨慎解读与研究的必要性。