- 简化和加强隐式协同过滤负采样
本文提出一种简化负采样模型的方法,通过针对设计的内存进行高效采样,解决模型学习中的假阴性问题。在两个合成数据集和三个真实数据集上的实证结果表明,该方法在负采样方面具有鲁棒性和优越性。
- 大规模 D2D - 启用的边雾网络上的多阶段混合联邦学习
本研究提出了一种基于多层聚类结构的分层式多阶段混合联邦学习方法,考虑了设备到设备通信,通过多圆形层次结构实现多阶段参数中继和局部同意来更新模型参数并与分布式控制算法协同运行,具有优越的资源利用率和收敛性能。
- ICLR切片核化斯坦差异度
提出了基于切片的 Stein discrepancy 和其可扩展和带核变体,这些变体采用基于核的测试函数,定义在最佳一维投影上,用于拟合优度检验和模型学习。在高维度下的拟合优度检验以及基于不同差异训练独立分量分析模型的结果表明,所提出的差异 - Omnipush: 精准、多样、真实世界的 RGB-D 视频推动动力学数据集
本文介绍了一个用于机器人推动运动的高度多样化数据集,可用于学习模型,并包括元学习动态模型的基准测试和其他相关任务的提议。
- ACL无监督的语句改写
该论文提出了一种从非标记的单语语料库中学习的重述模型,通过在重述识别,生成和训练增强方面与基于机器翻译的方法进行比较,发现单语重述在所有场景中均优于无监督翻译。
- POMDP 数据高效模型学习的变分推断
本研究提出 DELIP 作为 POMDP 模型学习的方法,利用摊销结构化变分推理,模型结合最先进的规划器能够在不确定性环境下获得有效的控制策略。
- CVPR人机合作:自监督样本挖掘的目标检测
该论文提出了一种基于自监督样本挖掘(SSM)过程的主动学习(AL)框架,针对目标检测中的真实挑战,通过自动发现和伪标记可靠的区域提案来增强目标检测器,逐步将未标注或部分标注的数据纳入模型学习中,同时最大限度地减少用户的注释工作。对两个公共基 - 自编码序列蒙特卡罗
利用自动编码序列蒙特卡罗的方法模型和提议学习,通过序贯蒙特卡罗的效率执行结构化概率模型的推理并利用深度神经网络对复杂的条件概率分布进行建模。实现同时学习深度生成模型的模型和提议适应的快速、易于实现和可扩展的方法。
- 连续状态 - 动作非高斯系统的集中模型学习和规划
引入了一个针对具有连续状态和动作空间以及非高斯转移模型的随机域的模型学习和规划框架。该框架高效,因为只有在计划器需要它们时才估计局部模型;计划器集中于当前规划问题的最相关状态;计划器专注于信息最丰富和 / 或价值最高的动作。我们的理论分析显 - NIPS从原始图像中嵌入控制:一种局部线性潜在动力学模型用于控制
介绍了 Embed to Control (E2C) 的方法和结果,E2C 是一种从原始像素图像学习非线性动力系统模型并控制其的方法,采用变分自编码器的深度生成模型来学习在局部线性约束下动力学的潜在空间,并支持图像序列的长期预测。
- ICML基于模型的强化学习中的不可知系统识别
通过在线学习算法获取训练误差较小的模型,并使用良好的探索分布可以获得近乎最优的策略,适用于离散和连续域,并具有强大保证性。
- 连续智能体环境系统的赋能
本文将探讨如何将授权延伸到连续状态,并使用高斯过程回归进行模型学习和预测,研究 empowerment 在探索和在线模型学习方面的应用。