TranDRL: 基于 Transformer 的深度强化学习驱动的预防性维护框架
提出了一种基于编码器 - Transformer 结构的多元时间序列预测框架,用于预测系统剩余可用寿命,与其他 13 种当前最先进模型相比,其性能提升了平均 137.65%。
Aug, 2023
通过利用大型语言模型的强大计算能力,本研究首次探索了基于语言模型的物理知识决策变换器 (PIDT) 框架,以解决传统强化学习方法在电力系统运行中分布式系统修复 (DSR) 问题中的伸缩性挑战,并通过比较研究评估其性能。
Jun, 2024
我们引入了一种深度强化学习 (DRL) 方法来解决包括库存管理、动态定价和推荐等管理问题。这种 DRL 方法有潜力基于特定的变压器神经网络结构构建一个大型管理模型,从而为各种管理任务提供一种人工通用智能范式。我们的方法能够统一框架下解决问题,考虑不同任务之间的相互关系。实验结果验证了我们基于 DRL 的框架在复杂和动态的商业环境中的有效性。这项工作为 DRL 在管理问题中的应用开辟了新的道路,突显了其改革传统商业管理的潜力。
Mar, 2024
本文提出了一种层次建模方法,通过将输入输出隐马尔可夫模型和强化学习相结合,检测和解释故障的根本原因以及涡轮风扇引擎的健康退化,同时提供最佳维修策略,具有良好的解释性和性能表现。
Jun, 2022
该论文综述了强化学习和深度强化学习在维护计划和优化问题上的应用,介绍了利用条件监控数据和强化学习开发智能维护规划者的方法,以及该领域的研究差距、关键见解和未来工作领域。
Jul, 2023
我们提出了一个多智能体深度强化学习框架,用于管理大型交通基础设施系统的全生命周期。该框架通过约束的部分可观测马尔可夫决策过程,解决了在存在不确定性、风险考量和有限资源的情况下,对交通基础设施进行优化管理的问题。通过开发一种名为 DDMAC-CTDE 的 Deep Decentralized Multi-agent Actor-Critic 方法,该框架在美国弗吉尼亚州的一个具有代表性和现实性的交通网络应用中展示了优越的性能。与传统的管理策略相比,该方法在真实约束和复杂性下提供了近乎最优的解决方案。
Jan, 2024
提出了一种基于模型的深度强化学习方法,用于设计短期电压稳定性问题的紧急控制策略,并使用基于深度神经网络 的动态代理模型进行训练,最终在 IEEE 300 总线测试系统上实现了 97.5% 的样本效率和 87.7% 的训练效率。
Dec, 2022
本文探讨了用人工智能和深度学习 (特别是神经网络) 进行预测性维护、诊断和预测的新兴技术应用,开发并测试了多种神经网络结构,使用公共数据集进行了诊断和预测。在结合深度学习技术 (如主成分分析和信号处理) 进行数据处理和特征提取的同时,探讨了这些技术在油田临界设备的预测性维护中的潜在应用,以降低意外停机和维护成本。
Jun, 2023
该研究使用深度强化学习方法针对不断恶化的水管开发了一种自动确定最佳恢复策略的成本效益资产管理解决方案,并证明了基于深度强化学习的策略相对于标准的预防性、校正性和贪婪性计划方案具有更好的效果。
Aug, 2022