simulation environments | BriefGPT

关键词simulation environments

搜索结果 - 16

通过注入基于学习的估计误差来提高机器人手术模拟的逼真度
通过从物理机器人收集的数据训练神经网络，我们提出了一个方法来估计手术模拟器中的机器人位置精度误差，并将这些误差注入模拟器中，以产生具有物理机器人特性性能的仿真机器人。我们的结果表明，误差注入将模拟机器人与物理机器人之间的平均位置和方向差异从
PDF25 days ago
ICML通过自对准使用大型语言模型学习机器人技能的奖励
在没有人类干预的情况下，我们提出了一种通过使用大型语言模型（LLM）来学习奖励的方法，该方法通过迭代的自我对齐过程，最小化 LLM 和学习奖励函数之间的排名不一致性，从而在训练效果和效率方面实现了一致的改善，并且相比于基于突变的方法消耗了更
PDF2 months ago
基于随机网络蒸馏的深度强化学习在 AGV 路径规划中的应用
在智能仓储系统中，自动引导车 (Automated Guided Vehicle, AGV) 的技术经历了快速发展，而路径规划是其中的关键挑战。此研究通过引入随机网络蒸馏 (Random Network Distillation, RND)
PDF3 months ago
基于导航提议的深度主动感知目标检测
深度学习已经在机器人视觉任务中取得了显著进展，但大多数现有的深度学习方法依赖于传统的计算机视觉流水线中固有的静态推理范例。最近的研究发现，积极感知通过超越这些静态模式来改善各种模型的感知能力。本文提出了一个通用的监督式积极感知流水线，用于目
PDF7 months ago
地下停车场模拟场景中 AVP 算法训练评估探讨
通过预先输入的 2D 地下停车场结构计划，本研究提出了一种自动生成具有不同难度级别的 3D 地下车库模拟场景的方法。
PDF9 months ago
利用模拟校准兽医医学实际数据采集
使用仿真环境进行数据采集和诊断的创新性研究，特别关注于犬只的步态分析。该研究利用 Blender 和 Blenderproc 库生成反映不同解剖学、环境和行为条件的合成数据集。通过图形表示和标准化以实现最佳分析，利用生成的数据集来训练机器学
PDFa year ago
基于人工智能的 OTN 解决方案模块化仿真环境
通过提出模块化解决方案，提高数据生成的可配置性，以应对大数据收集、高精度分析和优化算法评估的需求，从而为自动化网络和机器学习在下一代网络中的应用提供了更高精度和逼真度的数据集。
PDFa year ago
SocNavGym：面向社交导航的强化学习 Gym
本文介绍了一种名为 SocNavGym 的仿真环境，该环境可以生成各种社交导航情景，并可以与不同的社交奖励信号配合使用以提供评估结果，同时可以训练出具有高度社交合规性的导航智能体。
PDFa year ago
从物体点云中学习家具装配
本文介绍了一种基于学习的方法，使用模拟环境实现家具组装规划，无需连接标签，仅依靠原始点云图像来训练神经网络以成功组装不同类型的家具。
PDF2 years ago
数字干预强化学习算法设计：实施前指南
该研究介绍了如何使用预测性、可计算性和稳定性（PCS）框架设计在线强化学习算法来个性化数字干预，提供了指南并展示了如何在模拟环境中评估候选算法，以加强现实时间限制和用户动态环境的稳定性，从而在 Oralytics 项目中改善用户的口腔健康，
PDF2 years ago
CVPRSAMPLE-HD: 同时动作和运动规划学习环境
本文提供了一个新的环境，用于学习交互式推理的视觉和行为方面的模拟，以掌握家庭用品的操作技能，并利用 SAMPLE-HD 环境生成场景、语言指令和训练路径。
PDF2 years ago
没有强化学习，没有模拟：学习导航而无需导航
本研究提出了一种基于自监督学习的方法，通过对漫游的被动视频学习导航，而无需交互、地图信息或强化学习，旨在解决基于图像目标的导航任务，该方法可以作为使用强化学习或模拟的任何未来基于图像的导航任务的强大基准。
PDF3 years ago
ICLR智能体能力光谱基准测试
文章介绍了一种名为 Crafter 的开放世界生存游戏，可评估智能代理的广泛能力，并通过提供的奖励信号或内在目标进行学习和评估，以使代理成功解锁所有成就需要强大的泛化、深入探索和长期推理。
PDF3 years ago
重新排列：具身人工智能面临的挑战
本文提出了一个以重新排列任务为基础的体现智能 (AI Embodied) 的研究和评价框架，并描述了四个不同的仿真环境中重新排列方案的实验测试床和性能度量标准，以支持重新排列代理的训练和部署。
PDF4 years ago
ICLR部署期间的自监督政策适应
本文旨在研究如何在不同的环境之间进行强化学习模型的泛化，通过自我监督的方法实现模型的持续学习并在 36 个环境中的 31 个上实现了显著的改进，这些环境包括来自 DeepMind 控制套件和 ViZDoom 的多样的仿真环境以及实际机器人操
PDF4 years ago
IJCAIObstacle Tower: 视觉、控制和规划的泛化挑战
该研究提出了新的人工智能基准测试环境 —— 障碍塔，通过该环境智能体必须学会解决低级控制和高级规划问题，同时学习像素和稀疏奖励信号。除了评估环境外，还要评估智能体在未见环境中的表现，已有的深度强化学习方法和人类玩家的基线实验结果表明，这些算
PDF5 years ago