- 限制下的强化学习中的反馈安全性
在安全关键的强化学习环境中,通过引入额外的成本函数来确保智能体安全行为的方法优于修改奖励函数的繁琐任务。然而,设计或评估这样的成本函数可能会非常昂贵。为了应对这个问题,我们提出一种可以在复杂环境中扩展并得到超越状态级反馈的方法,从而减轻评估 - 重点校准:受限温度缩放
我们研究了用于诊断决策的卷积分类器的校准问题。临床决策者可以使用校准后的分类器来最小化在其成本函数下的期望成本。在训练时,这样的函数通常是未知的。如果最小化期望成本是主要目标,算法应该侧重于调整概率单纯形中影响决策的区域的校准。我们给出一个 - 一种在端到端 ASR 系统中修复分词器词汇大小的成本最小化方法
通过在 LibriSpeech 100 小时数据集上的实验证明,当仔细选择标记数量时,端到端 ASR 系统的性能会有所提升。
- 具有零和非负 MTW 张量的最优输运中的费用族
我们计算了具有形式 u (x^ty) 的成本函数的 R^n 上最优输运问题的 MTW 张量(或交叉曲率),其中 u 是具有逆 s 的标量函数,x^ty 是属于 R^n 的开子集上的向量 x、y 的非退化双线性配对。MTW 张量在 Kim-M - 统一框架 RYU:构建安全球的终极方案
该论文提出了一种名为 “RYU” 的新框架,用于构建安全的球体,即确保包含目标优化问题的对偶解的区域。该框架在标准设置下集中于成本函数为两项之和的情况,这两项分别为闭合的、适当的、凸的利普希茨平滑函数和闭合的、适当的、凸的函数。RYU 框架 - 公平的多项式对数逼近低成本层次聚类
公平机器学习领域的关键问题是公平聚类算法的研究,特别是在现代智能系统引发了许多伦理争议的情况下。Ahmadian 等人提出了针对分层聚类的公平性研究,但他们的算法是高度理论化的。Knittel 等人提出了第一个实际的成本公平近似算法,但未能 - SceneScore:学习对象布置的成本函数
通过学习 cost function 和图神经网络,我们的方法 SceneScore 能够评估目标排列的可取性,从而实现对缺失目标的姿态预测以及与其他约束条件的组合。
- 优化异构能源存储系统的可解释深度强化学习
能源储存系统是能源市场中至关重要的组成部分,本研究提出了一种异质光伏 - 能源储存系统,利用了电池能量存储和氢能存储的特性,通过开发全面的成本函数和基于人为设计的原型网络,实现了透明的调度策略并取得了令人满意的效果。
- 生成熵神经最优传输在空间内和空间间的映射
学习度量到度量映射是机器学习中的一项关键任务,而神经最优输运方法(Neural OT)结合了神经网络模型和最优输运理论,将最优输运作为归纳偏置,并通过实验表明其在单细胞生物学中具有实用性。
- 最佳优先自顶向下的程序合成
该论文通过引入一种名为 Bee Search 的新的最佳优先从底向上搜索算法,解决了现有的基于成本指导的底向上搜索算法在信息损失和成本函数排序方面的问题。实证结果表明,Bee Search 在更复杂的领域特定语言(DSLs)中优于现有的成本 - 深度学习网络的几何结构和全局 L^2 最小化器的构建
用几何方法解释了 Deep Learning(DL)网络的结构,包括 L 个隐藏层、坡度激活函数、L2 Schatten 类(或 Hilbert-Schmidt)成本函数以及相等维度的输入输出空间 R^Q。隐藏层在空间 R^Q 上定义,并且 - 浅层神经网络的几何结构与 L2 代价最小化构建
提供了一个浅层神经网络的结构的几何解释,该网络具有一个隐藏层、一个斜坡激活函数、一个 L2 Schatten 类(或 Hilbert-Schmidt)代价函数、输入空间 R^M、输出空间 R^Q(其中 Q≤M),以及训练输入样本大小 N>Q - 一个利用 Wasserstein 距离减少情感计算中受主体影响噪声的新型损失函数
我们提出了一种利用深度学习和新型代价函数来检测情绪状态的方法,该代价函数利用了 Optimal Transport Theory 中的 Wasserstein Distance 来缩放个体相关数据的重要性,从而提高对所有参与者共同的数据模式 - 数据易于 (对于 K-Means)
该论文研究了 $k$-means 算法的能力,正确地恢复互相分离的簇群。基于常见的簇群定义,考虑了簇内同质性和簇间多样性的要求,并找到了一种特殊情况的互相分离簇群,使得 $k$-means 的代价函数全局最小值与互相分离性一致。通过实验发现 - MM如何逃离尖锐的极小值
探讨了如何高效地找到近似的优化算法的平坦极值,提出了基于梯度和随机扰动的算法,在训练数据成本函数的情况下,提出了更快的算法。
- 通过验证任务级别属性提供安全的深度强化学习
本文介绍了一种使用 “违规指标” 来惩罚无法确保安全的状态,从而更好地实现安全深度强化学习的方法,并在机器人地图导航任务中进行了实验研究,结果表明相较于进行 Safe DRL 的基线策略,使用违规指标的策略在性能上有了更好的表现,且能够大幅 - AutoCost:进化内在代价的零违规强化学习
本文提出了 AutoCost 框架,并在 Safety Gym 上进行了验证,结果表明其在 constrained RL 中实现了零违规性能,同时与基线有可比性的表现。
- 学习先验概率的概率融合用于标准 3D 重建流水线
本研究提出将单视角深度先验与传统三维重建系统融合,通过预测概率分布并使用代价函数最小化来提取深度图,并证明了该方法在整个系统性能方面的优越性。
- MM智慧的(分箱)群众:一种用于群众计数的贝叶斯分层范式
本研究针对训练众数统计深度网络的数据通常具有数量分布的重尾特征并在数量范围内表现出不连续性的问题,提出了一种新的平滑贝叶斯样本分层采样方法和一种新的成本函数,可以明显降低误差标准偏差,从而为研究人员提供了一种平衡和细致的性能表征方式。
- 高维情况下近似最优的可解释 k 均值算法
介绍了一种可解释性聚类方法,算法通过应用决策树将数据划分为轴平行超平面聚类,使得聚类边界简单,同时保证聚类代价函数的可解释性约束,聚类的代价至多是比不考虑可解释性约束的情况最小代价增加 $k^{1-2/d}$ 倍,与其他方法的代价上界取最小