资源约束下的相关过程在线建模与监控
本文提出了一种使用强化学习方法和符合预测技术的过程监控方法,以考虑干预决策基于预测的不确定性和资源利用级别的不确定性来避免资源浪费和提高干预效果。
Jul, 2023
本文提出了一种基于逆累积分布的在线异常检测算法,用于现有实时基础设施中低延迟检测,适用于不可预测的数据模式,并在两个实际微电网操作数据案例中展示了易于使用、快速计算和可部署的优势。
Jan, 2023
我们在本文中解决了一种带有任务转移的在线网络资源分配问题,提出了基于指数加权方法的随机在线算法,证明了该算法具有次线性时间后悔,通过对人工数据进行性能测试并与强化学习方法进行比较表明我们的方法优于后者。
Nov, 2023
本文研究了一个在线资源预订问题,通过一个由两个计算节点组成的通信网络,在有限时间内最小化整体预订成本,并且保持累计违规与运输成本在一定预算限制下的在线重复博弈,提出了一个在线鞍点算法来解决该问题。
May, 2023
本文介绍了一种图嵌入式的编码器 - 解码器框架,以实现在流处理中分配资源任务,同时确保工作负载平衡和通信最小化。采用深度强化学习方法,有效地学习和求解未知图的最优解,并在测试中表现优于 METIS 算法和基于 LSTM 的编码器 - 解码器模型约 70%。
Nov, 2019
在给定人工学习者的情景下,通过优化性能的综合指标并在培训资源有限的情况下进行约束,研究人际教育系统中的同伴学习。我们通过研究人工学习者之间相互作用网络中的自然知识传播过程来讨论问题。我们实证表明这类过程确实有效利用培训资源,并使得能够进行模块化的神经模型的设计,能够在不易受到噪声标签过度拟合的情况下进行泛化。
Dec, 2023
在资源受限的计算系统中,序列预测模型必须在严格约束下运行。我们提出了一种理论和相关的实证方法,探索一种特定类型机器学习模型(如深度神经网络)的成本与预测质量之间的权衡空间,以增加对资源受限任务模型的理论和实践限制的认识。
Oct, 2023
通过将多任务学习应用于机器学习算法中,结合 Elastic Weight Consolidation 和 Gradient Episodic Memory 的方法,并与增强训练数据分布的现有技术进行比较,本研究证明多任务方法对处理医疗领域等特殊需求的稀有重大事件有很高的效果。
Apr, 2023
我们探索了一种用于动态公平资源分配问题的主动学习方法,该方法假设在在线资源分配过程的每个时期,仅从选择的代理人子集中获取反馈。尽管存在这种限制,我们提出的算法在包括资源分配问题中常用的公平度量和匹配机制中的稳定性考虑等各种度量中,提供了与时间周期数次线性相关的后悔界限。我们算法的关键洞察在于通过利用对决性的上限和下限置信区间来自适应地识别最具信息量的反馈。通过这种策略,我们证明高效的决策不需要大量的反馈,并为各种问题类别产生高效的结果。
Jun, 2024