通过探究代理与环境的交互作用,并提出一种特定的目标函数,本文证实无需外在激励信号的情况下,能够发现独立可控因素并实现解耦。
Feb, 2018
本文旨在研究如何在交互环境中通过找出学习者可控制的因素来寻找控制观察数据变异因素的因素,提出了一种新颖的方法并在实验中进行了测试。
Mar, 2017
本文提出了 IFactor 框架,它由四类潜在状态变量建模,以捕捉强化学习系统中各种信息的不同方面,并在合成环境和深度强化学习环境中展示了其性能优于基线的实验结果。
Jun, 2023
本文提出一种表示学习算法,该算法可以将隐含特征分解为可控和不可控两个部分,从而提高表示的可解释性并有效学习和规划。通过在三个不同的环境中展示该算法的分解性质,强调了该方法的优势。
Oct, 2022
该论文指出只需要知道环境中有多少因素发生了变化,而不必了解哪些因素发生了变化,就足以学习到分离的表征,同时实验表明,这种弱监督方式足以在多个基准数据集上可靠地学习到分离的表征,并在多个任务上发挥作用,包括协变量漂移下的一般化、公平性和抽象推理。
Feb, 2020
我们提出了一种有条件的生成模型,用于学习将标记的观察结果的隐藏变化因素分离并分解成互补代码,实验结果表明该方法能够推广到未见过的类别和内类别变异。
Nov, 2016
本文研究了如何使用自编码器模型来解决因素糾纏問題,並通過在圖像對和三元組之間施加約束來訓練它。在實驗中,我們證明了此模型可以成功地在多個數據集上轉移屬性,但也存在參照模糊的情況。
Nov, 2017
这篇论文通过引入共变量先验偏好,提出了一种名为 C-Disentanglement 的框架,用于识别因果生成因子,并在领域变化下取得了与各种 SOTA 基准方法相比具有竞争力的结果。
Oct, 2023
本文提出了一种新的框架来学习具有所需结构属性的多元数据的可控和通用表示,该模型利用图模型中的掩码变量表示归纳偏置,并扩展多元信息瓶颈理论来强制执行结构依赖性,从而提供原则性方法来学习一组语义上有意义的潜在因素,其反映了各种类型的期望结构,如捕获相关性或编码不变性。同时还提供了自动估计数据中依赖关系的灵活性,该框架统一了许多现有的生成模型,并可应用于各种任务,包括多模态数据建模、算法公平性和不变风险最小化。
Jul, 2020
提出一个称为 Controllable fActor Feature Attribution (CAFA) 的方法,将特征划分为可控和不可控部分来计算相关特征的相对重要性,使用 CAFA 算法在现有数据集和 COVID-19 的非药物控制措施数据集中测试,得到的实验结果表明,使用 CAFA 算法的解释可以排除不可控特征的影响,同时保留完整的数据集进行预测。
Mar, 2022