- 多智能体强化学习中的善良
人们在决策中常常考虑公平,并通过对待回报以回应行为的友善。本研究提出了一种称为 KindMARL 的方法,通过对环境行为的反事实推理来衡量代理人的意图,并将其应用于多智能体强化学习中。实验结果表明,基于 KindMARL 的训练方法使得代理 - ICCV如果电视关闭了会怎么样?研究多模态语言模型的反事实推理能力
我们聚焦于多模态大型语言模型的反事实推理能力进行基准测试,并通过新收集的测试数据集评估了最新的视觉语言模型和代码生成 LLMs 的能力,发现目前存在较大的发展空间。
- 基于深层反事实推断的阿尔茨海默病预测的量化可解释模型
通过使用我们提出的框架,综合对应于反事实的结构性磁共振图像,并将其转化为灰质密度图来衡量其在感兴趣区域(ROI)中的体积变化,本研究通过采用一个轻量级的线性分类器来增强构建的 ROIs 的有效性,进而实现了定量诠释,达到了与深度学习方法相当 - 早产儿小点白质病变的分割:反事实生成学习的推动
准确分割点状白质病变是相关发育障碍的及时诊断和治疗的基础,本文提出了一种结合反事实推理和脑组织分割辅助任务的深度学习框架(DeepPWML),通过学习点状白质病变的细粒度定位和形态学表示来实现精确的定位和分割。
- 通过反事实回顾和预测解释实现用户可控的推荐
我们提出了一个用户可控的推荐系统,通过整合可解释性和可控性,通过提供回顾性和预测性的解释,用户可以与这些解释进行交互以自定义对系统的控制。实验证明,我们的框架在 MovieLens 和 Yelp 数据集上具有有效性,并且提供用户控制选项可以 - ICML利用情境反事实推理进行信念校准
通过用多目标优化来校准背景驱动的反事实推理,我们提出了 “信仰校准周期” 框架,以更全面地校准信仰多样性。
- 离线强化学习的预算对比实验
本文提出了一种采用动态规划和固定点求解的方法,用以控制训练中的数据采样分布并改善数据利用效率,在 D4RL 数据集上表现优于其他已有方法的离线强化学习培训方式。
- IJCAI分析自主智能体在不确定性下的有意行为
通过量化有意行为的证据来分析自治代理的行为,该方法适用于动态和不确定环境下区分人为意外和故意行为的问题,并且通过对相关情景的自动生成以提高评估的准确性。
- 从数据库修复到数据库因果推断和更多
本文介绍了针对数据库中查询答案的基于分数的解释的一些最新方法,重点介绍了作者及合作者所做的工作,并强调了使用反事实推理进行分数规范和计算的重要性,并展示了几个例子说明了这些方法的灵活性。
- MM时序逻辑的模数下的反事实
该研究论文扩展了 Lewis 关于反事实推理的理论,提出了一个结合时间和反事实操作的逻辑来自动化推理并解决可满足性和追踪检查问题。
- 通过归纳性来强化图神经网络中的反事实推理
本研究介绍了一种称为 INDUCE 的归纳算法,旨在为节点推导科学中的 GNN 提供因果关系解释,并通过引入边缘增强来改善 counterfactual 结果,此外,归纳建模方法使 INDUCE 直接预测反事实扰动,无需特定示例的训练,从而 - ACL探究大型编程语言模型的因果推理能力中的 IF 魔术
研究人员比较了基于文本和代码的大型语言模型对因果推理的能力,结果表明,相较于只针对文本的模型,基于代码编写的模型在因果推理方面更为出色。
- 概率逻辑编程中的 “What if?
本文扩展了 ProbLog 语言,增加了 “What if” 查询的功能,并提出了一种能够处理 ProbLog 程序的反事实查询的方法,同时提供了完整的实现以及对查询可扩展性的影响的洞见,并显示了该方法与具有析取注释的逻辑程序的因果语义一致 - IfQA: 面向反事实前提的开放领域问答数据集
本文介绍了第一个 counterfactual open-domain question-answering(QA)数据集(IfQA),并通过在该数据集上进行实证分析证明了如果就文本假设进行推理和检索是一项具有挑战性的任务。
- ACLSCOTT: 自洽思维串讲压缩
提出了一种知识蒸馏方法以学习从比自身大几个数量级的大型语言模型中生成一致合理的解释的小型自洽 Chain-of-Thought(CoT)模型,它使用教师模型生成的合理解释来学习学生模型,并使用对抗性约束来保证学生模型保持一致性和反事实推理, - 利用上下文结构生成有用的辅助任务
通过生成和学习有用的辅助任务,最大化经验重用,从而学习解决给定任务的方法,通过计数推理和离线策略方法同时学习这些辅助任务,从而实现多任务强化学习的新框架。
- 公平无知背景下的反事实推理用于偏差评估与检测
该研究论文探讨了即使在没有敏感特征的情况下,机器学习模型仍可能存在歧视偏见的问题,并提出了利用反事实推理揭示模型潜在偏见的方法。
- 反事实公平机会:利用反事实推理测量决策模型公平性
本研究提出一种利用反事实推理揭示机器学习和去偏见模型不公平行为的方法,在三个不同数据集上获得验证。
- 面向行为相关非平稳环境的离线评估
本论文提出了一种算法 OPEN,它可以在系统状态的积极、消极或混合非稳态变化的情况下预测未来绩效,其基础是双重应用反事实推理和一种新的重要性加权工具变量回归。
- 反事实推理的复杂度
研究计算复杂性和结构因果模型条件下反事实推理的关系并指出,如果在完全指定的情况下关于结构因果模型的干预性推理是可行的,则反事实推理也是可行的。