BriefGPT.xyz
Ask
alpha
关键词
task constraints
搜索结果 - 3
任务成功并不足够:调查使用视频 - 语言模型作为行为批评家以捕捉不良代理行为
在具体 AI 领域,利用大规模生成模型结合外部验证者,根据验证反馈逐步迭代推导最终解决方案,以验证是否达到说明中的目标条件,以便无缝整合到日常生活中,超越任务成功,和大范围的约束和个人偏好,为此构建一套测试基准,通过全面评估视觉与语言模型在
→
PDF
5 months ago
使用基于记忆的学习来解决具有状态 - 动作约束的任务
使用基于记忆的学习方法,利用任务的符号特性和动作的时间顺序,快速获取和传输高级信息,以解决不连续性约束的任务,这种代理方式比基于模型和无模型深度强化学习方法解决这些任务更快。
PDF
a year ago
使用生成模型近似约束流形进行基于采样的约束运动规划
该论文介绍了一种基于深度生成模型的采样策略,以解决受任务约束条件下的运动规划问题。研究使用两种深度生成模型 CVAE 和 CGAN 来生成满足约束条件的样本配置,并通过模拟和实验评估其采样准确性和采样分布的覆盖率。
PDF
2 years ago
Prev
Next