Aug, 2024

基于稀疏相关信息的领域特定长文本分类

TL;DR本研究针对当前大型语言模型在处理域特定长文本时的信息稀疏性问题,提出了一种新的分层模型,该模型利用潜在目标词汇列表来提取候选句子,并将其上下文化嵌入表示为分类依据。研究结果表明,此模型在医学文档分类任务中优于现有的较大语言模型,具有显著的实际应用潜力。