- MM利用奖励塑形模仿学习方法合成生成类似人类数据以解决序列决策问题
本研究通过结合奖励塑造和模仿学习算法,提出了一种生成人工智能系统中类似于人类决策数据的新算法,证明使用这种合成的数据可以成功解决具有逐步增加难度的计算机游戏中的决策任务,并且与人类表现几乎无差异。
- 基于学习预测的自主驾驶交互合并决策
本篇论文提出了一种自动驾驶的决策方法,采用了 POMDP 和 Monte Carlo tree search 等方法对车辆在道路上的交互进行建模和规划,实现了高质量的行驶决策。
- 基于证明数的蒙特卡罗树搜索
本文提出了一种新的游戏搜索算法,PN-MCTS,该算法将 Monte-Carlo 树搜索(MCTS)和证明数搜索(PNS)相结合。我们定义了三个领域,在这些领域中,在 MCTS 树中收集的证明和反证号所提供的额外知识可能会被使用。在不同的时 - 决策基础模型:问题、方法与机遇
本文检查了基于决策制定的基础模型的范围,并提供了理解问题空间和探索新研究方向的概念工具和技术背景。通过各种方法,例如提示、条件生成建模、规划、最优控制和强化学习,审查了将基础模型用于实际决策制定应用的最近方法,并讨论了该领域的常见挑战和开放 - 深度主动推理的解构
本文介绍了基于主动推理的深度强化学习理论,利用 Monte-Carlo 搜索和深度学习扩展此框架,实现更复杂任务的解决,实验表明,除了最后一层的 critic network 以及转移和编码器网络的方差层,将期望自由能最小化的主动推理代理与 - AAAI决策导向的评估:分析已部署的不安定多臂赌博机的性能
研究 RMAB 系统在公共卫生领域的部署,发现整体预测准确性的提高可能会伴随着 RMAB 系统性能的降低;使用决策评估度量来评估预测组件,更好地解释了 RMAB 系统的整体性能表现。
- AAAI在与 AI 搭档做出复杂决策时的启发式和偏见作用
研究表明,一些参与者过于信任人工智能辅助工具,导致选择结果不佳,适用于复杂选择的人工智能辅助工具的研究需要采用新的实验范例和计算建模方法。
- AAAI 2022 秋季研讨会:关于机器能力自主评估的经验教训
本文研究智能自主系统的关键问题,包括自我评估和任务分配的能力,以及在其能力限制内维持系统的操作能力的能力。
- 利用人工智能行为描述改善人工智能与人类的协作
研究表明,向人们显示 AI 系统的高层行为特征是帮助人们在决策过程中恰当地依赖 AI 的关键,这将大大提高 AI 援助下的决策准确性。
- 利用高维度传感器反馈的深度强化学习进行灌溉调度
该研究采用深度强化学习技术,提出了一种有效的灌溉方法,旨在为农民提高粮食产量和效益。对于考虑的每天,决策规则基于九个状态变量输入,返回每天五个不同灌溉量的概率性建议,经过测试证明该决策规则可以在大多数情况下同时实现最高的灌溉效益和经济效益。
- 在严重不确定情况下进行多目标决策
本文将近期发展的决策理论的不完全偏好和概率信息转移到多目标设置中,并通过利用可能的部分基数和部分概率信息,比帕累托序提供更详细的订单来比较决策。我们讨论了所提议的决策选项之间的一些有趣属性,并展示了如何通过线性优化来计算它们。最后,在比较不 - 将移动健康用户建模为强化学习智能体
本文介绍了一个框架,通过提供不同类型的干预措施,帮助使用移动健康技术的患者在日常生活中采取或保持健康的行为,同时优化了马尔可夫决策过程的参数,以解决人类决策过程中可能出现的问题。
- 医疗决策中因果干预的贝叶斯网络模型:文献综述与软件评估
本文归纳了系统文献搜索的结果,确定了 Bayesian 网络模型在支持医疗决策方面的应用。通过筛选多篇研究论文,并对公共数据集进行了分析,使用了 Wang B,Lyle C,Kwiatkowska M(2021)开发的因果干预分析软件工具以 - AAAI利用双极论证和马尔可夫网络解释随机森林(技术报告)
利用马尔可夫网络编码提供充分必要的论证解释以代替理解复杂的决策树算法过程
- 模糊性、不确定性与软集:前沿与展望
本文介绍了从 Zadeh 的模糊理论、Atanassov 的直觉模糊集合、Smarandache 的不确定性和 Molodstov 的软集合之间的主要步骤,提出了两种改进的混合评估和决策方法,并介绍如何将拓扑空间的概念扩展到模糊结构和如何在 - 基于风险意识元层决策的不确定探索
本研究提出了一种基于风险感知的元层决策框架来平衡本地和全局勘探的权衡,将覆盖计划者的传统层次结构建立在元层决策制定的基础上,利用环境历史、可通过性风险和运动动力学约束等信息来决定本地和全局决策之间的转换,进而提高大规模环境勘探的效率。
- 引入 RISK
本文介绍了开发 “风险” 系统的初步步骤。该系统旨在通过模拟实现人工智能系统的透明度,并通过模拟的假设情境,帮助系统做出更明智的决策,并向非专业观察者解释行为背后的原因。
- 估计权重下加权多数投票的稳定性
研究了加权多数投票算法的不确定性和稳定性以及如何衡量和分析在决策正确性和优化性之间的稳定性,提供了一种基于信任和信任值来支持决策的算法,并讨论了在信任和真实值之间变化时,决策正确性的敏感性。
- ACLGisPy:文本中关键信息推断得分测量工具
本研究开发了一种用于衡量文本底线含义的 GIS 的 Python 开源工具 GisPy,证明该工具可以显著区分低和高概括性文档,可用于新闻和科学文本领域。
- 一种解释统一化方法 -- 集成一致解释
本文研究透明度和解释与人工智能决策相关的问题。通过引入反事实解释的概念,提出一种新方法,即针对决策集合提供一致且高效的解释。