AxOCS: 使用配置超采样扩展 FPGA 上的近似算子
使用数据分析驱动的数学规划方法,合成 FPGA 的近似运算器,实现在嵌入式系统中机器学习推理的联合优化,取得了高达 21% 的超体积改进。
Sep, 2023
本文提出了一种基于强化学习的多目标设计空间探索策略,以找到在准确度下降和功耗 / 计算时间减少之间取得平衡的应用的近似版本。实验结果表明,在某些基准测试中,在准确度下降和功耗 / 计算时间减少之间存在良好的平衡。
Dec, 2023
本文介绍了一种基于 S-AC 的偏置可扩展的模拟计算电路,其可以用于多种不同功耗和性能需求的机器学习(ML)应用,并且可以在 180nm 的 CMOS 工艺下实现近存储计算、非线性激活、内积计算、数模混合压缩存储等多个功能,同时也证明了电路模块的鲁棒性以及计算精度的影响效果。
Feb, 2022
近十年来,近似计算作为一种新兴解决方案,在设计系统时调整结果质量以提高能源效率和 / 或性能的范式转变引起了学术界和工业界的关注。本研究通过两部分调研,覆盖了近似计算的关键方面(如术语和应用)以及从传统计算堆栈的各个层次(从系统到集成电路)的最新近似技术。在调研的第二部分中,我们对应用特定和架构近似技术进行了分类和详细介绍,这两者都旨在设计资源高效的处理器 / 加速器和系统。此外,我们还详细分析了近似计算的应用领域,并讨论了未来的挑战和发展方向。
Jul, 2023
我们提出了一种基于近似计算的 OTA-FL 框架,通过优化量化性能平衡、开发异构梯度分辨率 OTA-FL 调制方案,实现了异构边缘计算环境中的 OTA-FL,并能够以 50% 更快和更平滑的服务器收敛速度和性能增强方式,比同质化精度方法更好地满足最低精度客户的要求。
Jun, 2024
该论文提出了一种新的用于综合近似电路的技术,采用布尔矩阵分解对电路子电路的真值表进行逼近,以获取更低复杂度的子电路,实验表明此方法可在不影响准确度的情况下,节约高达 63% 的功耗。
May, 2018
本文介绍了 Quantum Alternating Operator Ansatz,该算法能够更高效地实现混合算子,从而扩展了量子计算应用的广度。
Sep, 2017
通过一个名为 COSMA 的优化框架,我们能够在专用硬件加速器上为 DNNs 找到最佳的操作调度、内存分配和张量替换方式,从而最小化额外数据访问,同时通过分而治之的启发式方法可以将复杂 DNNs 的数据访问降低 85% 以上。
Nov, 2023
通过对张量运算(矩阵乘法和卷积)应用基于样本的近似,提出了一种用于深度神经网络加速训练的新技术。应用到 MLP 和 CNN 网络的 MNIST,CIFAR-10 和 ImageNet 数据集的训练实验结果表明,该方法可以大幅度减少计算量和通讯量,并以不会对最终测试准确率产生可感知影响的方式提升训练速度。
May, 2018