BriefGPT.xyz
Ask
alpha
关键词
collision
搜索结果 - 5
ReMAV: 为自动驾驶车辆寻找可能故障事件的奖励建模
通过使用离线轨迹来分析自动驾驶车辆的现有行为,并确定找到故障事件的概率的适当阈值,我们提出了一个黑盒测试框架 ReMAV。 通过创建行为表示,突出显示可能存在不确定行为的区域,我们的奖励建模技术帮助提高效率,无需进行计算和低效的主动对抗学习
→
PDF
10 months ago
基于深度强化学习的碰撞动量用于对抗行人建模
本文提出了一种基于强化学习算法的行人模拟方法,专门针对边缘案例下自动驾驶控制器的不足,并且能够产生更严重的碰撞,以便在复杂多变的情况下识别并纠正自动驾驶算法的缺陷。
PDF
a year ago
使用混合最小值原理求解刚体动力学带碰撞的最优控制
提出一种解决混合动力系统最优控制问题的算法,通过解决混合最小原则 (HMP) 导出的方程,采用逐步逼近法,解决了由不连续性产生的多个数字挑战,其准确性和收敛性均优于基于梯度下降的直接方法和深度强化学习方法。
PDF
2 years ago
ICCV
利用神经重新模拟生成单张图像中的反弹
本文提出了一种使用神经网络生成虚拟物体与静止图像环境真实交互的视频的方法,该网络能够通过学习来纠正物理模拟的不完整和不准确信息,称之为神经再仿真过程,实验结果显示该方法可以在合成场景和现实图片中取得显著提高。
PDF
5 years ago
不观测冲突信息的多人赌博机
该研究探讨了多人随机多臂赌博问题,其中玩家不能相互通信,且如果两个或两个以上的玩家拉动同一臂,就会发生碰撞并且涉及到的玩家将不会收到奖励,在此研究中,作者提出了两个反馈模型,即一种可以观察到碰撞是否发生和一种更难的模型,即没有碰撞信息。作者
→
PDF
6 years ago
Prev
Next