- 基于物理系统辨识的多步预测的一次反向传播
提出了一个新颖的通用框架用于识别可能相互关联的系统,并保留其物理特性并提供多步预测的准确性,引入了基于反向传播的多步损失函数梯度计算的分析递归算法,直接为学习算法提供物理和结构洞察力。作为案例研究,测试了该方法用于从状态观测开始估计太空碎片 - 脑样柔性视觉推理:通过利用反馈前馈对齐
通过反馈与前馈路径的关联对齐机制,提出了一种学习算法 Feedback-Feedforward Alignment (FFA),通过共同优化分类和重建任务,使得反馈连接具有去噪、解决遮挡、幻觉和想象等视觉推理功能,并提供了比传统的反向传播方 - 用扩散自抑 MCMC 学习基于能量的先验模型
本文介绍了一种基于扩散的摊销方法来解决长期 MCMC 采样问题,并基于此开发了一种新的学习算法,用于隐空间 EBM。实验证明,与强对手相比,我们的方法在几个图像建模基准数据集上具有优秀的性能。
- 多拷贝强化学习代理
该论文研究了一种新型的多智能体问题,其中一个智能体通过复制自身来更好或更高效地完成单一智能体任务。我们提出了一种学习算法,用于解决多重复制问题,它利用价值函数的结构有效地学习如何平衡添加额外复制的优势和成本。
- 关于在线排名中的最小化后悔问题与前 k 反馈
在线排名中,使用学习算法对一组项目进行顺序排名,并将排名的相关度以反馈分数的形式接收。本文通过解决 Chaudhuri 和 Tewari [2017] 提出的一些开放性问题,进一步研究了带有前 k 个项目反馈的在线排名问题,并为 Pairw - 学习感知交互式自主安全性
为了确保机器人等自主车辆的广泛部署,本文提出了一种新的闭环范式用于综合安全控制策略,明确考虑系统在可能的未来情景下的演变不确定性,通过物理动力学和机器人的学习算法共同推理,利用对抗深度强化学习进行放大,展示了该框架能够处理贝叶斯信念传播和大 - 学习自一个单独的图可为无线网络提供近最短路径路由
我们提出了一种学习算法,用于本地路由策略,只需从单个图中获取的少量数据样本即可在标准无线网络模型中推广到所有随机图。
- 基于赌博算法的网络拓扑与舆论动态联合学习
提出一种基于多臂赌博算法的学习算法来解决连通性结构和混合意见动态之间的联合学习问题,目的为了找到每个 agent 的更新规则并学习底层的网络同时通过减少网络误差改善预测表现,此算法在数值实验上表现出比稀疏线性回归和高斯过程回归等方法更好的效 - 学习广播协议
研究了使用 learning algorithm 和 SMT solver 学习带有任意进程数量的分布式系统中的有限广播协议问题,证明了有限广播协议是可教的,但特征集尺寸无法降低到多项式级别。
- 高维数据流自适应伯恩斯坦变化检测器
本文提出了一种名为 ABCD 的方法,用于在高维数据流中检测变化,该方法可以确定变化发生的子空间和严重程度,并比其他最先进的方法表现更好。
- 泰勒学习
本文介绍了一种不使用梯度下降或经验风险最小化技术来构建模型的学习算法,以构建实分析函数模型为例,将熟悉的泰勒逼近方法置于从分布中抽样数据的情境中,并证明了该学习结果的非均匀性。
- 可学概念的语义沟通
该研究提出了一种通过学习算法来优化概率分布并将其传输到受限通道中的方法,从而在保证模型准确性的前提下降低数据失真,同时介绍了一种经验协调概念与网络中的强协调概念。
- ICLRLAVA: 无需预先指定学习算法的数据估值
本文介绍了一种新的数据估值框架,可以在不确定具体学习算法的情况下对数据进行估值,并提出了基于 Wasserstein 距离和敏感性分析的方法来估值,可以检测低质量的数据并在性能方面显著提高。
- 含不完整观测数据的回归分析
本文提出了一种针对无法消除或填补的不完整观测数据进行学习的模型,通过显式建模具有负值的非对称噪声,使得算法不会对具有不完整观测数据的标签进行偏差预测,同时显著提高了学习效率和准确性。
- 预测、学习、一致收敛和规模敏感维度
提出了一种新的学习算法,利用基于 Vapnik 维度的泛化界限定了算法的误差上界,并根据学习任务的特性使用一种依赖于尺度的维度定义,获得了新的打包数边界和样本复杂度上界,进而得到了一系列关于学习性质和可学性的充分条件和必要条件。
- ICLR无法从未知噪声率的噪声响应中学习贝叶斯分类器
本文探讨在使用含噪标签的分类器时,大多数情况下无法确定 Bayes 决策规则,也无法通过修改学习算法来解决该问题,只有少数特殊情况可以用简单算法来学习 Bayes 决策规则。
- 多值神经网络 I:多值联想记忆
介绍了一种新的多值关联记忆的概念,利用模糊神经网络作为广义基础。在多值关联记忆的情况下,基于阈值的模糊关联记忆的结果得到了扩展。探讨了这样一种在没有数字的网络中的性质,并在多值情况下给出了一种学习算法。通过格运算来建立输入的网络输出,并且我 - 分布式 GFlowNets 与分位数流
本文提出了一种名为 Quantile Matching 的新型 GFlowNet 学习算法,它采用了分布法来处理代理的激励波动性,并且对具有决定性的激励任务也有显著的改进。
- 从互联网视频中学习手眼协调技能
利用网络视频的人类手部动作行为作为真实世界经验来指导机器人任务,使用人类视频数据集的视觉、动作、物理规律作为机器人行为的先验知识的学习算法 VideoDex,在机器人手臂和灵巧的基于手的系统上进行测试,并在各种操作任务上显示出强大的结果。
- MM学会休息:可持续优化长期用户参与度
本文旨在提高用户参与度的同时避免滥用或成瘾行为,介绍了使用 Lotka-Volterra 动力学模型的框架,学习个性化休息策略并通过半合成数据的理论保证和实证评估了其性能。