- 线性二次调节器的样本复杂度:强化学习视角
我们提供了一个新的算法,可以在没有依赖于两点梯度估计的情况下,在大约 1/ε 个函数评估内确保 ε- 最优性,适用于具有未知参数的折扣离散时间 LQR 问题。
- 超定基的大型语言模型的量化
基于 Kashin 表示原理,我们引入了一种数据量化算法,通过将给定的向量、矩阵或张量分解为两个因子,其中第一个因子具有小的无穷范数,而第二个在乘以正交矩阵后也具有相似的限制范数。通过分解后的因子条目意外地集中在几个峰值附近,允许我们有效地 - 基于模型的离线量子强化学习
这篇论文提出了第一种基于模型的离线量子强化学习算法,并在滑车杆平衡问题上展示了其功能。模型和待优化的策略都以变分量子电路的形式实现。通过梯度下降,模型被训练以拟合预先记录的数据集。策略使用无梯度优化方案,以模型给出的回报估计作为适应度函数进 - 电力系统中的异常检测与上下文无关学习
提出了一种新颖的上下文感知异常检测算法 GridCAL,它考虑了常规拓扑和负荷 / 发电变化的影响,通过将实时功率流测量值转化为上下文不可知的值,以统一的统计模型为基础进行异常检测。数值模拟结果表明,该方法准确且计算效率高,优于当前最先进的 - 通过集体感知缓解脆弱道路用户遮挡风险:一个实证分析
最近,世界卫生组织的报告显示,易受伤路用户(VRUs)参与的道路死亡事故超过一半,其中遮挡风险是一个关键因素,即 VRUs 被如停放车辆等障碍物遮挡且被驾驶员看不见。因此,我们提出了一种基于车辆和 VRUs 的动力学量化遮挡风险的新算法。该 - 在增量不确定数据库中挖掘加权序列模式
由于科学技术的迅速发展,不确定、嘈杂和不确定数据的重要性以指数速度增加。因此,挖掘不确定数据库中的模式引起了研究人员的关注。此外,需要发现这些数据库中的频繁项目序列以获得具有重大影响的有意义知识。因此,在挖掘序列模式时需要处理权重的约束。然 - 一种伪似然方法的修正
我们给出一个反例来说明最大伪对数似然估计失败,并提供了解决方案来纠正文章中提出的算法。
- 半监督学习在不确定标签情况下的渐近贝叶斯风险
在高斯混合模型上考虑半监督分类设置,其中数据并不像通常那样严格标记,而是具有不确定的标签。我们的主要目标是计算该模型的贝叶斯风险,并对该模型的贝叶斯风险和已知的最佳算法进行比较。这种比较最终提供了对算法的新见解。
- 带有条件效果的 PDDL 领域的安全学习 -- 扩展版本
通过学习条件效应,我们提出了能够解决规划问题的第一个算法 ——SAM Learning of Conditional Effects (Conditional-SAM)。实验结果表明,Conditional-SAM 学习到的行动模型可以在大 - 联邦设置下的因果多标签特征选择
在分散设置中,本文研究了因果多标签特征选择的挑战性问题,并提出了一个包含三个新颖子程序的分散因果多标签特征选择 (FedCMFS) 算法,能够在不集中数据的情况下保持数据隐私,实现对相关特征的选择和移除,为分散设置中的因果多标签特征选择提供 - 需要多少数据?第 2 部分:预测深度学习类别的训练数据集大小
通过考虑每个类别的训练样例数量而非整体训练样例数量,本文提出了一种预测机器学习分类模型性能的算法,并应用于 CIFAR10 和 EMNIST 数据集,以解决由此引发的组合问题。
- 保持相关性:一种生成合成数据的统计方法
我们提出了一种生成具有统计代表性的合成数据的方法,其主要目标是在合成数据集中保持原始数据集中存在的特征相关性,同时以舒适的隐私级别以满足特定客户需求。
- 一种高效的多实例反事实解释的两阶段算法
该研究论文提出了一个灵活的两阶段算法,用于找到实例组以及具有成本效益的多实例反事实解释方法,以解决在黑盒系统中找到满足多个实例的单一反事实的问题。
- 基于事件驱动的脉冲神经网络学习
通过两种新型事件驱动学习方法(STD-ED 和 MPD-ED),本研究在静态和神经形态数据集上进行了广泛评估,证实它们在 CIFAR-100 数据集上分别超过现有事件驱动算法 2.51% 和 6.79%。此外,本研究理论上和实验上验证了这些 - 差分隐私最坏组风险最小化
通过差分隐私等方法研究最差组风险最小化,提出了优化算法,分析了广义误差的稳定性和泛化误差,探讨了在线和离线两种情境下的最差组风险最小化。
- inGRASS:基于低电阻直径分解的增量图谱稀疏化
本研究介绍了 inGRASS 算法,用于大型无向图的增量谱稀疏化。通过多级电阻嵌入框架,该算法能够高效地识别关键边和冗余边,并利用低阻直径分解方案将初始稀疏化图分解成多个节点聚类。inGRASS 算法能在保持相当解决方案质量的同时,实现高达 - 一种用于 3D 混凝土图像裂缝检测的统计方法
提出了一种高效的算法,用于在大规模计算机断层扫描(CT)图像中识别裂缝区域,并验证了其在提高裂缝分割效率和减少计算资源需求方面的有效性。
- 差分隐私公正的二元分类
在本研究中,我们调查了在差分隐私和公平性的约束下的二元分类问题。我们首先提出了一种基于解耦技术的算法,用于学习一个只保证公平性的分类器。该算法接受在不同人口群体上训练的分类器,并生成一个满足统计平衡的单个分类器。然后,我们改进了该算法以加入 - AAAI改进相机位姿和分解低秩张量辐射场的鲁棒性优化
我们提出了一个算法,允许使用仅具有 2D 图像作为监督来共同优化由分解低秩张量表示的相机姿态和场景几何,利用分解低秩张量的分解属性,我们的方法在仅产生少量计算开销的情况下实现了等效于蛮力 3D 卷积的效果。
- ICLR关键补丁提供者:关键补丁包含丰富信息
本研究引入一种名为 Key Patch Proposer (KPP) 的新型算法,用于在图像中选择关键补丁,无需额外训练。通过重建和分类任务,我们的实验证明了 KPP 捕获语义信息的强大能力。KPP 的有效性表明其在语义分割的主动学习中有潜