共形语言建模
本文通过使用conformal prediction方法对$p$参数进行校准来研究top-$p$采样在各种语言上下文环境下是否与其概率意义对齐,结果表明OPT模型存在过度自信,而校准与模型大小存在适度的反比关系。
May, 2023
探讨如何利用符合性预测方法对大型语言模型进行不确定性量化,以提高其在多选题答题等任务中的可靠性及稳定性。研究发现,符合性预测所估计的不确定性与模型的预测准确性存在密切关联,这一发现可以用于选择性分类及过滤低质量预测结果等下游应用。研究还探讨了符合性预测对于超出问题领域的问题的处理方法。本工作旨在为大型语言模型在安全关键性场景中提供更加可信和可靠的使用保障。
May, 2023
通过利用最近对非交换式依从预测的研究结果,我们提出了一种新的统一预测框架的扩展,名为非交换式依从核心采样,用于基于最近邻的生成。我们的方法可以后处理任意模型,提供具有统计保证的标记级预测集,并且在机器翻译和语言建模实验中展示了令人鼓舞的生成质量结果。通过产生更紧的预测集并实现良好覆盖率,我们从理论上给出了一种更有原则性的具有依从保证的抽样方法。
Feb, 2024
通过连接语言建模和符合预测,我们提出了一种名为符合真实性的框架,可以确保语言模型输出的高概率正确性保证。我们观察到语言模型输出的正确性等同于一个不确定性量化问题,其中不确定性集合被定义为语言模型输出的蕴含集合。利用这种连接,我们展示了在语言模型中的符合预测对应于一种回退算法,通过逐步使语言模型输出不太具体(并扩大相关的不确定性集合)以提供高概率的正确性保证。这种方法适用于任何黑盒语言模型,并且只需要很少的人工标注样本。我们对我们的方法在闭卷问答(FActScore,NaturalQuestions)和推理任务(MATH)上进行评估,结果表明我们的方法可以在保留大部分语言模型原始输出的同时提供80-90%的正确性保证。
Feb, 2024
本研究旨在解决大型语言模型中无法访问 logits 的不确定性量化的普遍挑战。我们提出了一种面向 API-only 语言模型的新型 CP 方法,通过同时利用粗粒度(如样本频率)和细粒度(如语义相似性)的不确定性概念来构建不确定度量,实现了更好的预测性能。实验证明,我们的方法在封闭式和开放式问答任务中大多能够胜过基于 logits 的 CP 对照组。
Mar, 2024
我们开发了一个原则性的方法,确定一个大型语言模型在一般领域中,何时应该放弃回答而选择回答“我不知道”,而不是胡言乱语或错误答案。通过使用自洽性作为一种更可靠的模型置信度度量的早期方法的基础上,我们提出使用语言模型本身来自我评估其对于给定查询的每个采样响应之间的相似性。然后,我们进一步利用符合预测技术来开发一种放弃回答的方法,该方法在误报率(错误率)上具有严格的理论保证。在实验中,我们的符合预测放弃方法可可靠地限制了各种闭书、开放领域的生成问答数据集的胡言乱语率,同时与基于对数概率分数量化不确定性的基线相比,在长答案的数据集(时间序列)上保持了一个显著较低的放弃率,同时在短答案的数据集(TriviaQA)上实现了可比较的性能。为了自动评估实验,需要确定两个答案在给定问题下是否等价。遵循标准做法,我们使用一个阈值相似性函数来确定两个响应是否相匹配,并提供了一种根据符合预测进行阈值校准的方法,并在匹配预测的准确性上具有理论保证,这可能具有独立的兴趣。
Apr, 2024
快速增长的大型语言模型和自然语言处理(NLP)应用对不确定性量化提出了关键需求,以减轻幻象等风险并提高关键应用中的决策可靠性。条件预测正在成为一个理论上健全且实用的框架,结合了灵活性和强有力的统计保证。它的模型无关性和无分布性质使其特别有希望解决源于NLP系统缺乏不确定性量化的现有缺点。本文对条件预测技术、其保证以及NLP中的现有应用进行了全面调研,指出了未来研究的方向和面临的挑战。
May, 2024
我们开发了新的一致推断方法,用于获取大型语言模型 (LLMs) 输出的有效性保证。我们通过过滤控制函数的评估结果来确定出LLM响应中满足高概率正确性保证的文本子集。我们的方法解决了现有方法存在的两个问题,首先,所述保证并非条件有效;其次,因为评分函数不完善,过滤步骤可能会删除许多有价值和准确的声明,我们通过两种新的一致方法解决了这两个挑战。
Jun, 2024
通过从预测集构建的置信度条件中整合正确性对齐的不确定性准则,本研究在自然语言生成任务中,将确定性预测转化为严格的理论保证,从而解决了最近大型语言模型中的异构不确定性问题,并利用抽样不确定性测量方法提高了先前最先进的方法。通过在模型的非固定答案分布中校准预测集,实现对6个大型语言模型在4个自由格式的自然语言生成数据集上的正确覆盖率的严格控制,证明了我们的方法在实际开放式自然语言生成应用中提供可靠保证的高效性。
Jun, 2024
本研究针对生成模型在安全关键应用中缺乏严格统计保证的问题,提出了一种名为顺序符合性预测生成模型(SCOPE-Gen)的新方法。该方法通过初始样本的逐步处理,实现了显著降低合规评估的次数,从而提高了在高风险领域的应用效率。
Oct, 2024