Apr, 2024

语境与先验知识在语言模型中的比较

TL;DR语言模型的先验知识与上下文信息的整合方式对不同问题和上下文情境具有可预见的特征,模型在涉及熟悉实体的问题中更依赖于先验知识,易受特定情境影响。我们提出两个基于互信息的度量,分别衡量模型对上下文的依赖和对实体先验的敏感性。通过经验测试,验证了这些度量的有效性和可靠性,并发现其与模型对实体的熟悉程度存在关联,提供两个使用案例来说明其优势。