本文提出一种考虑了副观测数据的随机赌博机模型,并基于上界置信度 (UCBs) 提供了高效的算法,用于在社交网络中推荐内容,实现了比传统算法更好的效果。
Oct, 2012
通过模拟比较四种标准赌博算法,同时结合分析性保证,我们对多源系统中的调度问题进行了研究,并对任何策略能够达到的累计遗憾下限进行了界定。
Oct, 2023
对于具有部分可观察和时变动力学的大规模无线网络,本文研究了一种面向广义干扰约束的无线网络的高效调度算法,其中平均到达率和平均服务率是未知的和非平稳的。我们提出了一种新颖的算法 MW-UCB 用于广义无线网络调度,它基于最大权重策略,并利用滑动窗口上限置信界来学习通道在非平稳情况下的统计特性。在平均服务率的可变性方面满足较弱的假设条件下,MW-UCB 在吞吐量上是最优的。具体而言,只要平均服务率在任何时间段内的总变化量在时间上增长的次线性,我们表明 MW-UCB 可以实现稳定区域任意靠近拥有完全通道统计信息的策略类的稳定区域。大量模拟验证了我们的理论结果,并展示了 MW-UCB 的良好性能。
Aug, 2023
本文探讨了一种对抗性在线学习情境,其中决策者可以在每个阶段选择一个行动,并观察到给定行动的奖励,同时还能获取有关选择其他行动所获得的奖励的信息。研究者们开发出具有可证明的后悔保证的实用算法,这些算法依赖于非平凡的图论信息反馈结构特性。
Jun, 2011
本文中我们提出了一种使用机器学习方法预测适当调制编码方案 (MCS) 等级的方法,并结合不同算法对具有最高数据传输率的 MCS 等级进行定位预测,并在此基础上,显示出相较于传统方法选择 MCS 等级的显著改进。然而,使用机器学习方法需要比目前公开的研究数据集更大的真实世界数据集。因此,本文介绍了在广泛的行驶测试中获取的数据集,并将其公开可用。
Sep, 2023
探讨传统的两臂赌博问题的扩展,其中决策者在选择拉动哪个手臂之前可以访问一些信息,在不同的设置中找到能够达到可接受水平的规则和构造渐近最优自适应方案以实现这些规则。
Jan, 2005
本文介绍了如何利用 “side information” 来提高学习到的函数模型的泛化能力,其中 “side information” 包括多任务学习、多视角学习和特权信息学习等方法。此外,本文还提出了与这些方法相连通的新的视角,并给出了这些方法在两个监督学习任务中的实验验证。
Nov, 2015
本文提出了一种框架,通过控制学习模型的结构以反映特征之间的相似性,并利用特征旁路信息来提高模型预测性能,实验证明该方法在多个基准数据集上均获得了显著的预测性能提升。
Mar, 2017
本文系统评估现有的信道状态信息 (CSI) 结构的开发利用,进而寻找更深层次的结构,开发适合于 CSI 数据的深度神经网络 (DNN) 设计,为未来性能提升提供了巨大潜力。
Dec, 2018
该研究提出了一种利用边缘信息来提高推荐系统性能的新框架,并通过实验证明,该推荐系统在准确率和收敛速度上优于其他最先进的模型。此外,该研究还探讨了关注机制的新型正则化损失,并提出了进一步改进的一些见解。
Jun, 2024