关键词reinforcement learning agents
搜索结果 - 25
- O-RAN 中的智能与学习,用于数据驱动的 NextG 蜂窝网络
本文探讨了 O-RAN 联盟提出的解聚的网络架构是否为 NextG 网络的关键要素,并在此框架下研究了数据驱动优化方法的潜力、挑战和局限性,以及实现自主和自优化网络愿景的深度强化学习智能体通过实时分析与控制的闭环集成的可行性。
- ICML强化学习中的序列迁移与生成模型
本研究旨在探讨如何设计强化学习代理,通过从之前解决的任务中转移知识,明确减少学习新任务的样本复杂度。具体地,本文关注第二种目标,即当代理具有状态行为对的生成模型时,如何快速识别最精确的解法。我们将转移设置降至一个隐马尔可夫模型,并使用谱方法 - 机器与人类交替学习
本文提出一种具有自适应性的算法,使得现有的强化学习代理可以在机器和人类代理之间进行控制转换,在类似环境中可以找到多个转换策略序列,并演示了该算法在半自动驾驶场景中具有优越性。
- AAAI辩论动态下的知识图谱推理
通过辩论动态理论提出了一种自动推理知识图谱的新方法,以三段式分类为例,该方法基于增强学习代理和二进制分类器解释和预测关于知识图谱中观点真实性的辩论证据,从而可用于知识图谱的推理和链接预测,实验表明该方法优于其他基线模型。
- 强化学习行为套件
介绍用于强化学习的行为套件 ——bsuite,它是一系列经过精心设计的实验,目的在于收集和研究能够捕捉通用和高效学习算法设计核心问题的清晰、有信息量和可扩展的问题,以及通过这些共享基准测试评估代理人行为,这一库使用 Python 编写,容易