野外环境中的惊奇度量
利用人工好奇心提高强化学习系统的探索能力,本文提出了一种利用贝叶斯惊奇度作为衡量模型参数先验和后验之间差异的方法,将其应用于代理模型的潜在空间中,大大降低计算成本,研究表明其对连续任务的环境探索和视频游戏分数的影响要好于当前最先进技术,同时具有对抗随机性环境的鲁棒性。
Apr, 2021
这篇文章研究了采用包含最新的人类感知、决策 - making 和运动控制理论的新颖认知似然模型 --Commotions 模型用于预测人类在交通互动中的行为,展示了此模型在自然情景数据集中与数据驱动模型相竞争甚至胜出,证明了吸纳认知理论在自动驾驶行为预测模型中的巨大潜力。
May, 2023
基于主动推理(active inference)的模型提供了一个基于最小化预期自由能的单一目标函数来处理目标追求和信息追求(解决不确定性)行为,从而无缝解决不确定性,实现类似人类的适应性驾驶行为。
Nov, 2023
本文提出了一种基于概率方法的安全性评估模拟方法,能够快速地对危险事件进行探测和评估,并证明了方法在统计和计算效率方面的优越性,最后在多种场景下进行了测试,证明了该方法对于开发和测试安全关键自主系统的敏感性分析和模型比较的重要性。
Aug, 2020
本研究基于大西雅图地区的交通流量和拥堵情况,开发出 JamBayes 服务来预测交通流量和拥堵,我们评估了模型精度,并通过建模和预测来识别当前和未来的意外情况。
Jul, 2012
提出了三种反事实因果发现方法,其通过提取事件的方式解决了动态环境中因果链的不稳定性,同时采用反事实模拟来克服因无法在公共道路上进行实验而带来的干扰,实验结果表明,该方法在智能驾驶中因果关系的建立方面表现显著优于传统方法。
Jun, 2023
我们提出了一种新的计算模型,用于强化学习中的内在奖励,解决了现有基于惊喜驱动的探索的局限性。奖励是惊喜的新颖性,而不是惊喜的规范。我们通过内存网络的检索错误来估计惊喜的新颖性,其中内存存储和重构惊喜。我们的惊喜记忆(Surprise Memory,SM)增加了基于惊喜的内在动机的能力,保持了对激动人心的探索的兴趣,同时减少了对不可预测或嘈杂观察的不必要的吸引力。我们的实验表明,结合各种惊喜预测器的 SM 表现出高效的探索行为,并显著提升了稀疏奖励环境中的最终性能,包括嘈杂的电视、导航和具有挑战性的 Atari 游戏。
Aug, 2023
使用机器学习和深度学习技术,从路上的驾驶行为数据中估计驾驶员的心理特征,建立具有自适应能力的驾驶辅助系统,研究结果表明,我们的模型能够以高准确度预测心理驾驶风格和负荷敏感度等特征,而不同持续时间的分割对准确性的影响因特征而异。
Feb, 2023
通过探讨大规模训练的生成模型的特性,本文发现这些模型表现出可预测的失真以及不可预测的特性,从而提出了文献和实际观察所展示的社会有害行为的实例,并分析了这些相互冲突的特性如何导致模型的开发和部署受到各种挑战。作者提出了可能的干预措施,以便 AI 社区创造有益的影响。
Feb, 2022