- 随机梯度下降在玻璃能量地形中恢复高维信号的效果优于梯度下降
使用随机梯度下降(SGD)算法对神经网络进行培训,研究表明 SGD 在优化高维度非凸成本函数方面比梯度下降(GD)算法更为有效。
- 利用多目标元模型优化机器学习中的公平性权衡
使用多目标优化的方法直接优化错误 - 公平性权衡,并提出了一个灵活的框架来定义权重分类问题和多个代价函数,以减少优化参数,同时在真实问题中获得了更好的错误 / 公平性权衡解决方案。
- 基于 SMT 的带有不确定性的一致性检查 (扩展版)
论文介绍了如何通过应用 SMT 编码来检验具有不确定性的记录信息与数据感知型参考过程的一致性,且作者设计的方法具有模块化和可扩展性为不同类型的不确定性提供适当的成本函数以应对不同的一致性检验任务,并通过实际实现验证了其正确性和可行性。
- 用自然语言反馈纠正机器人计划
本文探讨了将自然语言应用于机器人校正的方式,阐述了从自然语言句子到代价函数变换的映射方法,以及该方法如何通过多种方式对机器人进行校正,进而解决规划任务失败的问题,该方法已在模拟环境和真实环境中得到了验证。
- 自动驾驶奖励(误)设计
本文旨在解决奖励设计过程中常见误区的问题,提出了 8 项简单的方法来鉴别奖励函数的缺陷,并对强化学习中的自动驾驶任务的奖励函数进行了分析,揭示了奖励设计的普遍缺陷。最后,探讨了自适应奖励函数设计的可能方向。
- AAAI在线学徒式学习
本研究为解决没有成本函数难题,提出 Online Apprenticeship Learning (OAL) 算法,通过两个镜像下降算法,优化策略和学习最坏成本,采用乐观探索得出收敛性和算法误差,并实现了基于深度学习的 OAL 算法,并在互 - 机器人运动风格的成本函数
本文提出采用成本函数捕捉机器人运动的风格表现,并探究手工设计特征和神经网络参数化两种方式实现;通过实验研究发现,两者性能表现相似,均优于基准线,但各自有优劣。
- 深度学习与神经科学的集成
本文考虑在神经科学和机器学习之间建立联系,提出脑部通过优化各式各样的代价函数来实现数据高效学习和定向行为,其中包括关注、递归等结构体系和各种形式的短时和长时记忆存储,作者提出了未来神经科学试图改进和检验这些假设的方向。
- 战略分类
机器学习中的好斗现象及其解决方案的研究,通过将分类问题建模为一种游戏的方式,提出了一种近乎最优的、能够抵抗 “好斗” 现象的分类器设计算法,尤其对于一类自然代价函数而言,该算法在计算上也是高效的。
- GloVe 与 word2vec 的链接
本文讨论了 GloVe 和 skip-gram 两种单词向量表示方法在训练目标上的相似性,指出它们的目标与代价函数虽不同但具有类似性。
- 决策图上的交互式成本配置
这篇论文讨论了如何将基于二进制决策图(BDD)的配置扩展到涉及表示用户偏好的成本函数的情景中,并证明即使在其最简单的形式下,多成本配置也是 NP - 难问题。
- 价值约束满足问题的线性规划能力
本研究提出了一种基于线性规划松弛的计算方法,用于解决在有价约束语言下的约束最小化问题,包括子模型、双子模型以及树状子模型等。
- 具有线性计算成本的最优变点检测
本文提出一种新的方法来检测大型数据集中的多个变化点,通过找到代价函数的最小值,从而确定变化点的最优数量和位置,并且计算成本与现有方法相比显著降低。同时,与二进制分割算法相比,我们的方法可以显著提高数据推断分割的准确性。