BriefGPT.xyz
Ask
alpha
关键词
information theoretic framework
搜索结果 - 4
基于信息论的基于上下文的离线元强化学习框架
离线元强化学习(OMRL)的出现作为离线 RL 和元 RL 的结合在使 RL 代理能够多任务和快速适应并安全地获取知识方面显示出了巨大的潜力。我们提出将离线元强化学习的几个关键里程碑整合到一个统一的信息论框架中,并展示了现有的上下文 OMR
→
PDF
5 months ago
监督学习中的公正性:信息论方法
研究提出了一个信息理论框架来设计公平的预测器,以在监督学习环境中防止对指定敏感属性的歧视。使用平等的机会作为歧视标准,这要求在实际标签的条件下,预测应独立于受保护属性。同时确保公平和泛化,将数据压缩到辅助变量,再通过贝叶斯决策规则得到最终预
→
PDF
6 years ago
多智能体系统的全分散策略:信息理论方法
本文提出了基于信息论的速率畸变理论框架,它使得我们能够分析完全分散的政策能够重构最优解的程度,同时,该框架提供了自然的扩展解决了一个代理应该与哪些节点通信以提高其个体策略的性能的问题。
PDF
7 years ago
一个信息论的视角:聚类数量
研究聚类问题中的最优聚类数量问题,提出了一种基于信息理论框架的方法,其利用熵和温度之间的关系来找到数据集的最佳聚类数量,以及通过校正聚类标准来解决采样误差问题,找到最大的有意义结构和聚类的解决方案。
PDF
21 years ago
Prev
Next