BriefGPT.xyz
Ask
alpha
关键词
human control
搜索结果 - 3
人类控制:定义与算法
该论文提出了一种人类如何控制人工智能系统的方法 —— 可纠正性,即要求智能体遵循人类监督者的指示,而不会对其进行不适当的影响。它还定义了一种可纠正行为的变体称为关机教示性,并表明它意味着适当的关机行为,保留人类自主权和避免用户危害。研究了三
→
PDF
a year ago
UniControl:一种用于自然环境中可控视觉生成的统一扩散模型
UniControl 是一种新的可控生成基础模型,集成了多种可控因素,实现了基于任意语言提示的像素级精确图像生成,并通过多任务学习,使其具有适应不同可控条件的能力,实验证明其性能优于其他同类型模型。
PDF
a year ago
IJCAI
使用 Actor-Critic 强化学习训练机器人代理人时进行同时控制和人类反馈
该研究探索一种使用人类提供的同时人类控制和反馈信号来训练一个强化学习机器人代理的方法,并旨在缩小用户控制方法和控制的机器人数量之间的差距。作者采用物理和模拟机器人系统的实验比较了在环境中获得奖励、由人类提供奖励以及这两种方法的组合下的训练表
→
PDF
8 years ago
Prev
Next