Aug, 2024
原始数据的胜利:大型语言模型嵌入在医疗机器学习应用中的数值数据表示是否有效?
When Raw Data Prevails: Are Large Language Model Embeddings Effective in
Numerical Data Representation for Medical Machine Learning Applications?
TL;DR本研究针对在医疗场景中,如何有效集成表格数值数据与大型语言模型(LLM)进行探讨,填补了该领域的研究空白。通过比较LLM的最后隐藏状态生成的向量表示和原始数值电子健康记录数据在传统机器学习算法中的表现,发现尽管原始数据仍具优势,LLM嵌入在医疗预测任务中同样具备竞争力,指向了未来研究的新方向。