Feb, 2024

利用大型语言模型进行提示弱监督中的结构学习

TL;DR利用大型预训练语言模型作为弱监督框架中标记函数的基础,通过扩展语言模型在循环中的应用来解决弱监督的主要挑战之一:学习监督来源之间的统计依赖结构。我们提出了一种结构细化模块的简单而有效的方法,通过利用嵌入空间中的内在结构,通过询问语言模型来评估标记函数之间的相似度。与从弱标签中学习依赖关系的先前方法相比,我们的方法找到了与标记函数本身相关的依赖关系,而不太依赖于数据。我们证明了该结构细化模块可以在基准任务上将 PromptedWS 管道的性能提升高达 12.7 个百分点,并通过全面的消融实验和分析探索了效率和性能之间的权衡。