基于强化学习方法的近似计算技术的设计空间探索
使用数据分析驱动的数学规划方法,合成 FPGA 的近似运算器,实现在嵌入式系统中机器学习推理的联合优化,取得了高达 21% 的超体积改进。
Sep, 2023
本文介绍了一种可扩展的通用增强学习代理的设计方法,该方法基于对 AIXI 的直接逼近,利用 Monte Carlo Tree Search 算法和 Context Tree Weighting 算法的代理特定扩展得以实现,实验表明该算法在多个随机、未知和部分可观察的领域中表现良好。
Jul, 2010
本文提出了使用 Multi-Agent RL 来应对硬件体系结构搜索中领域特定定制的挑战,此方法相对于单一智能体,其可扩展性更高且运行更高效。该方法已在设计领域特定 DRAM 内存控制器上得到验证,并表现出在低功耗和延迟等不同目标方面显著优于单一代理强化学习算法,如 Proximal Policy Optimization 和 Soft Actor-Critic。
Nov, 2022
近十年来,近似计算作为一种新兴解决方案,在设计系统时调整结果质量以提高能源效率和 / 或性能的范式转变引起了学术界和工业界的关注。本研究通过两部分调研,覆盖了近似计算的关键方面(如术语和应用)以及从传统计算堆栈的各个层次(从系统到集成电路)的最新近似技术。在调研的第二部分中,我们对应用特定和架构近似技术进行了分类和详细介绍,这两者都旨在设计资源高效的处理器 / 加速器和系统。此外,我们还详细分析了近似计算的应用领域,并讨论了未来的挑战和发展方向。
Jul, 2023
当 Exascale 计算成为现实时,云数据中心的计算节点能源需求将继续增长。在系统其他方面经历瓶颈时,降低硬件组件的功耗是减少能源需求的常见方法之一。然而,设计一个能够实时检测和限制功耗的资源控制器是一个复杂的问题,可能会对应用性能产生不利影响。本文中,我们探索使用强化学习(RL)设计云计算节点上的功耗限制策略,利用当前功耗和瞬时应用性能(心跳)的观测。通过将 Argo Node Resource Management(NRM)软件堆栈与 Intel Running Average Power Limit(RAPL)硬件控制机制相结合,设计一个代理程序来控制处理器的最大供电功率,而不会影响应用性能。利用 Proximal Policy Optimization(PPO)代理程序在计算节点的数学模型上学习最优策略,我们使用 STREAM 基准测试演示和评估了在实际硬件上运行的经过训练的代理程序如何通过平衡功耗和应用性能来采取行动。
Aug, 2023
本文提出了一个基于 FPGA 的 DNN 加速器设计框架 DeepAxe, 考虑了准确性、可靠性和硬件性能之间的平衡,通过功能逼近来减少硬件平台的计算负担,为目标资源利用要求提供了一组 Pareto 最优的 DNN 实现设计空间点。
Mar, 2023
该论文提出了一种通过利用机器学习技术加速计算机体系结构模拟的方法,该方法利用应用特征和微架构特征的组合来预测应用程序的性能,通过构建和评估一个机器学习模型展示了在体系结构探索方面的显著加速能力。
Feb, 2024
利用机器学习与强化学习相结合的创新方法解决基于计算图的调度优化问题,提供优化性和确定性保证,同时保持启发式方法的运行时成本。
Aug, 2023
在解决复杂优化问题方面,探索式组合优化(ECO-DQN)通过连续改进解决方案,从而有效地学习有效的启发式方法来解决图上的组合优化问题,并在最大割问题上展示了最先进的强化学习性能。
Sep, 2019