- 神经调谐和表征几何学
本文探究了神经调谐和表征几何之间的关系,发现虽然神经调谐可诱导出表征几何,但不同的调谐神经元可以诱导相同的表征几何,包括 Fisher 信息、互信息和行为表现。因此,未来的研究可以从考虑调谐和几何两方面入手,更好地理解神经编码,揭示刺激、脑 - ACL神经机器翻译模型的不合理波动性
研究了神经机器翻译模型的行为,发现模型在翻译极其相似的句子时具有不稳定的行为,并且在极端情况下可能导致误译,突出了当前 NMT 模型的泛化问题。发现 RNN 和变压器模型分别在 26%和 19%的句子变化中都表现出不稳定行为。
- ICML视频游戏中非玩家角色的交互式训练
通过训练一个多分辨率的马尔可夫模型的集合,我们提出了一种互动式的模仿学习的方法来创建高质量的 NPC 行为,从而大大减少了传统手工制作 NPC 的时间和工作量。
- 学习复杂连续社交困境中的互惠原则
本研究提出了一种通用的在线强化学习算法,该算法能够向其合作伙伴表现出互惠行为,并在与自私代理一起学习时能够诱发更广泛的群体互惠行为,无论是在 $2$-player Markov game 还是 $5$-player intertempora - 模仿学习的算法视角
本论文介绍了仿真学习的基本概念、假设、方法及其算法,探究其与机器学习、控制论等领域的关系,为机器学习专家与机器人及应用人工智能专家提供知识储备与工具。
- 使用深度学习进行用户定义特征的无标记跟踪
通过深度神经网络的迁移学习方法,本论文提出了一种高效的无标记跟踪方法,可以在不同的实验环境中跟踪动物不同的身体部位,尤其在少量训练数据的情况下也能获得很好的跟踪效果。
- 跨尺度的行为测量
本文综述了理论和数据分析思路如何与计算机和实验方法相互作用,通过各种背景,时间尺度和时间尺度回答这些问题,并试图突出方法之间的共性和在行为量化方面进一步发展的必要性。
- MM推荐的因果嵌入
本文介绍了一个基于领域适应算法的建议优化策略,通过预测完全随机的建议策略下的建议效果来实现学习,比目前最先进的因子分解方法、因果推断等方法有着明显的提升。
- NIPS重复逆强化学习
介绍了一种新颖的反向强化学习问题:代理人必须代表人类执行一系列任务,并希望在行动不符合人类期望时最小化惊讶人类的任务数量,每当人类感到惊讶,代理人会提供人类所期望的行为演示。
- 在未知环境中跟随自然语言指令的学习模型
本文提出了一个新的学习框架,使得机器人可以成功地遵循自然语言路线指令,而无需任何先前环境的知识。该算法利用通过命令传达给机器人的空间和语义信息来学习关于空间扩展环境的度量和语义属性的分布,并将自然语言指令解释为关于预期行为的分布。通过对地图 - 社交网络中的动态和爆发式交互
我们提出了一个用于动态和爆发性社交互动代理联系网络的建模框架,考虑了在短时间尺度内各种尺寸的断开的小组成为接触网络的情况,通过考虑具有记忆效应的转换概率获取不同的接触时间和个体之间的两次接触的时间。