Jul, 2023

QSOM 和 QDSOM 算法的多智能体伦理一致自适应强化学习

TL;DR本文提出了 QSOM 和 QDSOM 两种算法,旨在解决机器道德领域中的挑战,即如何使 AI 系统与我们的伦理考虑保持一致,并能够适应时间和社会规范的变化。通过将 Q 表与(动态)自组织映射相结合,这些算法是能够处理连续和多维状态和动作空间的。在智能电网案例中,它们证明了其适应能力和相比基准强化学习算法更高的性能。