BriefGPT.xyz
Ask
alpha
关键词
human-ai system
搜索结果 - 2
MM
利用奖励塑形模仿学习方法合成生成类似人类数据以解决序列决策问题
本研究通过结合奖励塑造和模仿学习算法,提出了一种生成人工智能系统中类似于人类决策数据的新算法,证明使用这种合成的数据可以成功解决具有逐步增加难度的计算机游戏中的决策任务,并且与人类表现几乎无差异。
PDF
a year ago
MM
一种错误易发人工智能和人类代理之间的委派认知框架
研究人工智能系统和人类在同一环境下应怎样理解和相应对方行为,通过认知模型预测双方行为并通过中介控制实现目标的达成。
PDF
2 years ago
Prev
Next