BriefGPT.xyz
Ask
alpha
关键词
behaviors
搜索结果 - 5
多智能体学习系统的数学:博弈论与人工智能交叉界面
进化博弈论和人工智能两个领域虽然乍看起来不同,但它们具有显著的联系和交叉点。本文旨在通过交叉思想促进多智能体学习系统的数学进展,特别是在 “集体合作智能” 领域,以连接进化动力学和多智能体强化学习。
PDF
4 months ago
EMNLP
从价值到观点:利用注入价值的大型语言模型预测人类行为和立场
利用价值注入的大型语言模型 (VIM) 预测意见和行为的可行性与效果进行了系列实验,结果显示使用价值注入的大型语言模型可更好地预测人们的意见和行为,而且通过注入人类核心价值的变种,其性能显著优于基准方法。
PDF
8 months ago
RoboTAP:用于少样本视觉模仿的任意点追踪
我们探讨了密集跟踪作为一种表征工具,使机器人能够更快、更通用地从示教中学习,并展示了通过密集跟踪生成的稳健机器人策略能够解决复杂的物体排列任务,如形状匹配、堆叠,甚至全路径跟踪任务,如涂胶并粘合物体,这些示教仅需数分钟即可收集。
PDF
10 months ago
BITS: 交通仿真的双层模仿
本研究提出了一种基于数据驱动的方法(称为 BITS)来生成具有现实感、多样性和远期稳定性的交通行为,该方法将交通仿真问题分解为高层意图推断和低层驾驶行为模仿的双层层次结构,并引入了规划模块来获取稳定的长期行为。同时,还开发出一种软件工具,统
→
PDF
2 years ago
DOMiNO: 多样性优化,保持接近最优的发现策略
该论文提出了 DOMiNO 方法用于强化学习中多样性和优化的平衡,通过约束马尔可夫决策过程找到不同的策略,能够发现具有意义的多种行为并且对干扰有很强的鲁棒性。
PDF
2 years ago
Prev
Next