- ACL开放领域对话生成的动态随机解码策略
作为一个开放领域聊天系统,动态解码策略 (DDS) 可以根据不同上下文来调整解码空间以实现序列水平和令牌水平的自适应搜索,旨在提高预训练对话模型的性能。
- 线性二次系统控制的全自适应保证后悔算法
提出了一种解决具有未知系统模型的线性二次(LQ)控制问题的算法,其遗憾为 O (√T),并在此基础上提出了首个完全自适应的算法,同时控制策略更新次数和自适应地优化遗憾上限,避免了计算复杂性问题。
- 通过编码树与运动方程在实时中适应协变偏移
Xenovert 是一种自适应算法,可动态适应输入分布的变化,并通过将连续的输入空间自适应地划分为几个密度均匀的区间,间接地将源分布映射到变化后的目标分布,以实现数据与下游解码器 / 操作的关系保持不变。本文中,我们展示了整合 Xenove - 学习漂移离散分布的改进算法
我们提出了一种适用于在分布漂移下学习离散分布的新的自适应算法。
- 多用户延迟反馈中的改进 EXP3 及其自适应变体在对抗性赌博中的应用
对于带有延迟反馈的对抗性多臂赌博问题,我们设计了一种改进的 EXP3 算法 MUD-EXP3 来处理多用户延迟反馈,同时提出了一种自适应算法 AMUD-EXP3,这两种算法在实验中被证明是正确且有效的,并给出了关于遗憾的理论分析。
- 重尾臂赌博机中实现全自适应遗憾最小化
学习重尾分布下的遗憾最小化问题,引入自适应算法并提供适应性鲁棒 UCB 方法,以最小化重尾 MAB 问题的遗憾。
- 使用异构工人对一组对象进行排名:一个相当简单的问题
我们研究了通过不同可靠性的工作者提供的具有噪声的成对比较,对 N 个对象进行排名的问题。我们提出了一种名为 QUITE 的非自适应排名算法,它可以同时估计工作者的可靠性和对象的质量,并在不同场景中与之前提出的算法进行了比较。最后,我们展示了 - 未知动态下的长期公平性
本文提出了一种在在线强化学习中形式化长期公平的方法;该方法可以适应不同的控制目标,通过牺牲短期激励来推动分类器 - 人群系统朝着更理想的均衡状态发展,从而在损失和公平违规之间实现同时概率边界的算法。
- ICML插值区间中的私有优化:更快速率和难度结果
该研究使用随机凸优化方法解决私有化环境的插值问题,并提出了自适应算法来提高样本复杂性。
- ICML具有平滑遗憾的情境臂控算法:连续行动空间高效学习
提出了一种平滑遗憾函数的背景自适应算法,可用于大量或连续动作空间下的通用背景自适应问题,并能适应各种光滑度级别的问题,取得了先前优化遗憾函数的最优性保证。
- AdaBest: 通过自适应偏差估计实现联邦学习中最小化客户端漂移
本文提出了一种自适应算法,用于准确估计联邦学习中客户端间的漂移,并通过约束漂移估计的范数使联邦学习更实际,并实验结果表明所提出的算法在各种联邦学习基准中更快达到收敛并实现更高的准确性。
- 多分辨率语义分割的无人机自适应路径规划
本文提出了一种基于深度学习的无人机自适应路径规划算法,解决了无人机低空精细监测和高效数据采集的问题,并提出了一种新的深度学习精度模型,可以在不浪费能源的情况下获得高分辨率的语义分割图像。实验结果表明本方法可推广应用于不同领域。
- ICML凸优化的私有自适应梯度方法
本研究探讨了差分隐私凸优化中的自适应算法,通过实现不同差分隐私变量 Stochastic Gradient Descent(SGD)算法和 Adagrad 算法的私有版本,证明了我们的私有版本的 Adagrad 优于自适应 SGD,而这又优 - 多种最佳臂的遗憾问题
本篇论文旨在应对多臂赌博机问题中存在多个最优 / 近似最优机械臂的后悔最小化问题,通过提出自适应算法来自动适应问题的难度,并在理论和实验方面展现了该算法的优越性。
- 自适应个性化联邦学习
本文提出了一种自适应个性化联邦学习算法,采用局部和整体模型混合的方法来提高模型的个性化能力,并使用通信高效的最优化方法来协同学习个性化模型,实验证明了该算法的有效性与泛化理论的正确性。
- MM一种自适应快速收敛的差分隐私深度学习方法
本文提出了 ADADP 算法,该算法是一种自适应且具有可证明隐私保证的学习算法,通过引入自适应噪声以及自适应学习率,显著降低了隐私成本并减轻了差分隐私对模型准确性的负面影响。ADADP 在真实数据集上的实验结果表明,它在隐私成本和模型准确性 - UniXGrad:一种具有优化保证的通用自适应约束优化算法
提出了一种新颖的自适应加速算法,通过 Mirror-Prox 方法,同时实现了平滑 / 非平滑问题和确定性 / 随机一阶预测器的最优解,且不需要先验知识,这是第一个在约束条件下实现最优解的自适应、统一算法,并通过大量数值实验展示了其实用性。
- X - 臂赌博机的多项式适应代价
本文提出了一种自适应算法以应对目标函数的未知平滑度,展示并计算适应于 H {"o} lder 正则性的多项式成本以进行后悔最小化,提供了有限时间分析和关于渐近最优性的彻底讨论。
- 自适应复合泊松因子分解从原始数据生成推荐
本篇论文旨在通过 recently proposed compound Poisson Factorization(cPF)方法,建立基于原始计数数据的推荐系统。研究结果表明,应用 dcPF 模型可以有效地调整过度离散数据,并提高推荐得分。
- 局部差分隐私下的线性查询估计
研究使用局部差分隐私约束下的敏感数据集来估计一组关于一些未知分布的 $d$ 个线性查询的问题,提出了离线和自适应问题的新算法。