- 强化学习强化强度控制:基于选择的网络营收管理应用
通过利用强化学习框架在选择网络收入管理作为案例研究中的强度控制,不需要事先对时间进行离散化,从而降低计算难度和离散化误差,并通过综合的数值研究展示了我们方法相对于其他最新技术基准的优势。
- 利用分类器作为回归辅助构建变量:实证评估
该论文提出了一种自动创建变量的方法(在回归的情况下),以补充初始输入向量中包含的信息。该方法作为预处理步骤工作,将要回归的变量的连续值离散化为一组间隔,然后利用这些间隔定义值阈值。然后训练分类器来预测要回归的值是否小于或等于每个阈值。分类器 - 基于不确定性的离散异构数据隔离中可扩展代码本的联合学习
利用分布式数据集的联邦学习(FL)面临数据异质性的挑战。我们提出一种名为基于不确定性的可扩展码本联邦学习(UEFL)的创新而简单的迭代框架,通过动态映射潜在特征到可训练的离散向量,并评估不确定性,专门扩展那些具有高不确定性的数据集的离散化字 - 学习使用 GOMEA 的离散贝叶斯网络
从可解释人工智能的角度出发,本论文扩展了基于 Gene-pool Optimal Mixing Evolutionary Algorithm(GOMEA)的最新结构学习方法,用于联合学习变量的离散化。提出的离散贝叶斯网络 GOMEA(DBN - 基于深度学习的离散化模型诊断方法
本论文提出了一种名为 Discret2Di 的方法,用于自动学习基于一致性的诊断的逻辑表达式。该方法通过结合时间序列和符号域的机器学习,解决了逻辑计算在动态系统离散化方面的关键问题。
- 通过吸引子动力学构建离散、组合和符号化表征
通过吸引子动力学对连续表示空间进行分区,并在符号空间中实施结构,可以实现丰富感官输入的吸引子支持表示空间中的组合性。
- 深度残差网络对神经常微分方程的隐式正则化
深度残差网络与神经常微分方程之间的离散化联系被建立,证明了在特定条件下网络收敛至全局最小值。
- 强对数凹分布的朗之万蒙特卡罗方法:随机中点重访
本文针对具有强烈对数凹密度的平滑目标分布的采样问题进行探究,借助随机中点离散化方法,建立可计算的 Wasserstein-2 误差的上界,并基于中点离散化的 Langevin 扩散过程进行分析以明确其基本原理和提供有价值的见解,进而建立起更 - 通过自监督学习实现基于可穿戴设备的人类活动识别离散表示学习
本文探讨了离散化方法在人类活动识别 (HAR) 领域的应用,作者采用了向量量化技术 (Vector Quantization,VQ),提出了一种从短时间的传感器数据到码本向量的映射方法,证明了离散化方法不但可用于活动分类,还可用于符号序列分 - 降低 Frank-Wolfe 方法的离散化误差
通过改进多步骤的 Frank-Wolfe 方法和 LMO - 平均方案使用一阶和高阶离散方案,从而减少离散化误差,其局部收敛速率通过一般凸集可以加速从 O (1/k) 到 O (1/k^{3/2}),改善 Frank-Wolfe 算法的收 - AAAI从时间序列中学习离散事件系统的基于持久性的离散化方法
为了更好地理解动态系统,必须有一种可解释和多用途的模型。本文介绍了一种称为 Persist 的离散化方法,它使用 Wasserstein 距离来代替 Kullback-Leibler 散度,可帮助更好地捕获原始时间序列的信息,并使其更适用于 - 多语言翻译中基于人工语言的知识共享学习
本篇论文研究了多语言神经翻译的基石,即跨语言共享表示;论文通过将编码器输出离散化为一系列条目的方式,提高了模型的鲁棒性和泛化能力,并尝试使用一种人造语言来分析模型的行为,发现类似的桥梁语言能够增加知识共享。
- 具有动态向量量化的自适应离散通信瓶颈
本研究提出了一种基于动态选择离散化紧密度的方法,通过调整 VQ 方法中的码本大小和离散码数来实现,以应对数据中的复杂性差异,这种方法可在视觉推理和强化学习任务中提高模型性能。
- AAAI突破收敛障碍:通过固定时间收敛流进行优化
本文提出了一种基于漸进时间稳定性的梯度优化框架,从而加速收敛速度并提供了理论分析及在一些数值例子中的验证。
- ICML来自演示的动作量化连续控制
本文提出了一种基于 RL 的新方法 AQuaDem,可从人类演示中学习连续动作空间的离散化,以实现在连续控制问题上的离散动作深度 RL 技术应用,并通过实验证明了优于 SAC 和 GAIL 的性能。
- ICML最优输运的高效离散化
本文提出基于最小化(熵正则化)Wasserstein 距离的算法来计算离散化解决方案,可以通过将连续解决方案的近似值与独立同分布抽样方法相结合,来获得具有可比性的方案,并证明了近似误差边界及在多种问题上的性能表现。
- 重尾梯度噪声下随机梯度下降的首次退出时间分析
本研究提出了一种新的视角来分析随机梯度下降,即将其作为一阶随机微分方程(SDE)的离散化,进而推导出了使得离散化后的系统与连续时间系统行为相似的步长条件,并分析了算法和问题参数对误差的影响。
- 离散化解决方案:安全机器学习抵御对抗攻击
通过在深度神经网络中限制输入维数或参数维度,采用离散化方法可以显著提高不同数据集上的对抗攻击鲁棒性,2bit 离散化可在最大程度上提高对抗攻击抵抗力而只损失 1-2% 的精度。
- AAAI离散化连续动作空间的策略优化
本文研究了对连续控制中动作空间的离散化对于基于策略优化的影响,发现动作空间的离散化采用可分解动作分布的策略可以有效地解决离散动作数量的爆炸性增长,并且在复杂动态高维任务上可以通过在策略中使用序数参数化引入自然排序从而获得性能显著提升的优越表 - 深度强化学习中连续动作的离散顺序预测
本文提出了一种使用神经网络模型 对连续动作空间离散化建模的方法,通过预测单个维度的方法对高维空间进行建模,实现了有效解决 高维连续控制问题 的技术,其中利用基于 Q learning 算法的离策略 (off-policy) 方法取得了最先进