Oct, 2024

离线逆约束强化学习在医疗卫生领域的安全关键决策

TL;DR本研究解决了医疗卫生中强化学习导致的不安全决策问题,提出了逆约束强化学习的新方法来推断专家演示中的约束。研究发现,采用因果注意力机制和生成模型的约束变换器能有效捕捉不安全状态,并在多个医疗场景中实现了降低死亡率的策略,从而减少了不安全行为的发生概率。