BriefGPT.xyz
Ask
alpha
关键词
probabilistic evaluation
搜索结果 - 3
ACL
每个答案都重要:用概率测度评估常识
大型语言模型在常识任务上展现了令人印象深刻的性能;然而,这些任务通常作为多项选择题提出,使模型能够利用系统偏差。常识也具有概率性,存在多个正确答案。为此,我们提出了一种新的生成任务 - 常识框架补全(CFC),通过多个开放式生成来评估常识。
→
PDF
a month ago
带有隐变量因果模型的顺序计划的概率评估
研究了在存在未测量变量的情况下,具有若干并发或顺序行动的计划的概率评估,并建立了图形判据以识别只通过测量变量的被动观测就可以预测给定计划效果的情况。当满足该标准时,为计划实现指定目标的概率提供了一个闭合表达式。
PDF
11 years ago
因果效应的可识别性测试
本篇论文关注于在未测量变量存在的情况下行动效果的概率评估。我们展示了单例变量 X 和一组变量 Y 之间的因果效应的辨识可以系统地完成,其时间复杂度多项式。当可辨识因果效应时,可以获得一个封闭形式的表达式,用于描述行动达到指定目标或一组目标的
→
PDF
11 years ago
Prev
Next