该论文提出了一种被忽视的应对不确定性的策略类别 ——RDOT(风险降低设计和运营工具包),该工具包可以应用于受到高度不确定性影响的决策问题,使其变得更容易处理。论文总结了 90 多种 RDOT 策略,并提出了一个将其纳入多目标优化的决策模型的框架。
Sep, 2023
本文简要回顾了优化领域中不确定性处理的现状,并聚焦于处理随机性和认知不确定性的不同方法,控制领域的应用占据了重要的地位。
Dec, 2022
本文将近期发展的决策理论的不完全偏好和概率信息转移到多目标设置中,并通过利用可能的部分基数和部分概率信息,比帕累托序提供更详细的订单来比较决策。我们讨论了所提议的决策选项之间的一些有趣属性,并展示了如何通过线性优化来计算它们。最后,在比较不同表现度量下的算法的场景中演示了我们的框架。
本文综述了决策制定中的不确定性状态,并关注走在经典解释之外的不确定性,尤其是区分了可变性不确定性和认知不确定性。作者提供了多种解决方案,包括离散和连续模型,从正式验证、控制抽象到强化学习,以优秀解法应对认知不确定性,并列举和讨论了处理丰富类型不确定性时出现的重要挑战。
Mar, 2023
研究智能系统以经济合理性解释其行为,其中包括涉及函数或效用的优化原则,最近这一理论已将约束纳入进来,即在满足某些信息处理约束的同时最大化效用。研究智能系统已从热力学工具中受益,本篇论文的目标是澄清这些结果在研究智能系统中的适用性,并改善对排序结构的分类和对能够允许这样的框架的要求的理解。
Jun, 2024
针对机器学习模型影响采纳的关键因素之一 —— 信任,本研究提出了一组特征量,可以表征一个实例的复杂程度,并借助元学习框架评估误分类的风险。该框架在提高模型开发的复杂性方面具有潜在的应用前景,同时提供新的模型自我阻抗和解释手段。
Apr, 2023
本篇论文介绍和综合了基于马尔可夫决策过程相关的方法,显示它们为建立 AI 中研究的许多类计划问题提供了一个统一的框架,并概述了用于易于构建策略或计划的计算工具的几种类型的表示和算法。
May, 2011
本论文利用因子模型处理 Markov 决策过程中的参数不确定性问题,提出了一种鲁棒性方法来有效计算最优策略,并在相关领域进行了实验研究。
Nov, 2018
本研究主要关注序列决策算法中的不确定性和风险问题,通过探索规划和强化学习两种方法,尤其是面向基于模型算法的研究,旨在缓解 epistemic 和 aleatoric 不确定性问题。
提出了一种新的统计假设检验方法来利用数据设计鲁棒优化的不确定集合,该方法灵活适用于各种领域,并且计算复杂度可行,理论和实践上都具有可靠性。操作研究领域的计算实验证明,当数据可用时,与传统的鲁棒优化技术相比,我们的数据驱动集合显著优于传统技术。
Dec, 2013