- IJCAI深度频率导数学习用于非平稳时间序列预测
我们提出了一种基于频率导数学习的非平稳时间序列预测框架 DERITS,通过整个频率谱将时间序列进行转换,使其从频率角度充分利用数据分布,从而在时间序列预测和分布偏移方面表现出持续的优越性。
- 利用储层计算从时间序列中无监督提取缓慢变动系统参数动态预测未观测到的分叉
使用水库计算框架从时间序列数据中无监督地提取系统的缓慢变化参数,进而预测快速动态中未知的分岔现象。
- 一种广义 Borda 准则下最优和自适应的非平稳对决多臂老虎机算法
对比辩论问题中实现严重非稳态度的底线非希望恶化情况下,解决 Borda 动态后悔上界问题的技术,揭示了 Condorcet 与 Borda 后悔目标在对比辩论问题中学习到严重非稳态度的根本差异。
- 非稳态强化学习的复杂性
研究探讨了强化学习中连续学习的问题,证明了一种最坏情况下的复杂性结果,即改变强化学习问题中单个状态 - 行动对的概率或奖励需要大量时间来更新价值函数,除非强指数时间假设是错误的。
- 具有漂移数据的弱监督自适应方法
提出了一种自适应方法,在非稳态环境下提供正式质量保证的弱监督学习,通过使用提供每个数据点的正确分类的独立嘈杂信号的弱监督学习源来推断一系列数据的未知标签,并针对准确性可能随时间漂移的非稳态情况进行了重点研究,该算法不需要先验假设并且基于输入 - 非平稳环境下的 MNL-Bandit
本文研究在非稳态环境下的 MNL-Bandit 问题,提出一种算法,其最坏动态遗憾为 $\tilde {O}(\min \left\{ \sqrt {NTL}\;;\; N^{\frac {1}{3}}(\Delta_{\infty}^{K - EMNLP野外文本分类中的标签模块提示学习
提出了一种面向文本分类的挑战性但实用的任务:在野外进行文本分类,介绍了不同的非稳态训练 / 测试阶段,提出了一种基于标签模块化提示调整文本分类任务的框架(MODULARPROMPT),并在两种最难的情况下展示出比相关基线的性能显著提高的强大 - ICLR无限非平稳聚类的流式推断
本文提出了一种新的聚类算法,利用动态中餐馆过程(Dynamical CRP)来处理非平稳的流数据,并展示了在多样化数据集中实施的实验结果。
- ICML恢复奖励下的离线规划和在线学习
本文提出了一类非平稳多臂赌博问题,并设计了基于 “纯周期策略” 的算法来最大化预期累积奖励,该策略在离线和在线问题中都被证明具有高效性和近似优势,可为具有非平稳和恢复奖励的离线规划和在线学习应用提供方法参考。
- ICLR无监督时间序列表示学习与时空邻域编码
本文提出了一种自监督学习框架 (Temporal Neighborhood Coding),用于学习非平稳时间序列的可泛化表示,通过利用信号生成过程的局部平滑性定义时间上具有稳定性的邻域,使用无偏差对比目标,通过确保在编码空间中,邻域内的信 - 非平稳环境下的组合半赌博算法
该研究探讨了非静态组合半强盗问题,研究了在动态和切换的情况下,算法所能达到的最佳后悔上限以及需要提前了解的参数,并提供了无需先知参数的算法。
- 非固定奖励分布和延迟反馈过程的多臂赌博策略
本文研究了多臂赌博策略在非静态随机回报函数和延迟反馈的情况下的性能,并针对非静态回报函数和延迟反馈的情况提出了一种自适应技术(AG1),在在线电子商务平台上进行了多臂赌博模拟。结果表明,相对于传统的多臂赌博策略,在后悔最小化的情况下,自适应 - 高效应对分段稳定赌博机的变点检测
GLR-klUCB 是一种结合了 kl-UCB 算法和 Bernoulli 广义似然比检验的高效参数无关变点检测的算法,可以在非平稳的打赌问题中获得较小的后悔。
- 对抗扩张驱动的非稳态纹理合成
本文介绍了一种基于生成对抗网络的例子合成方法,用于处理包括空间非同变、不均质等非稳态纹理,实现了大尺度结构的捕捉,其简单的概念性方法极有效,成为解决有挑战性的纹理的无其他现有方法可处理。
- 关于突发性和缓慢变化的多臂赌博问题
LM-DSEE 与 SW-UCB# 两种算法解决了非稳态随机多臂赌博问题,在突变和缓慢变化的环境下,这些算法在时间上的预期总遗憾被控制在时间的子线性函数上。
- 非平稳环境下高效应对背景干扰的 Bandit 算法
本研究开发了多种高效的上下文推断算法,为非平稳环境提供了有效的解决方案,具有动态适应分布变化的能力,同时通过对各种标准回归进行分析,证明了在时间和空间成本上都能达到最优的效果。
- 潜在高斯过程回归
介绍了一种名为潜在高斯过程回归的方法,可以扩展输入空间,使用潜在变量来调制协方差函数以处理多模态和非平稳过程的回归问题,并在合成数据和实际应用中进行了验证。
- 使用哈密顿蒙特卡洛法进行非平稳高斯过程回归
本文介绍一种新的方法,使用全非定常高斯过程回归,在该方法中,三个关键参数 —— 噪声方差、信号方差和长度尺度 —— 均可以同时受输入影响。我们采用基于梯度的推理方法,学习未知函数和非定常模型参数,无需任何模型近似。我们提出使用哈密尔顿蒙特卡