AxOCS: 使用配置超采样扩展 FPGA 上的近似算子

Sep, 2023

AxOCS: 使用配置超采样扩展 FPGA 上的近似算子

AxOCS: Scaling FPGA-based Approximate Operators using Configuration Supersampling

Siva Satyendra Sahoo, Salim Ullah, Soumyo Bhattacharjee, Akash Kumar

TL;DR通过提出 AxOCS 方法，利用 AI 和 ML 进行超采样，以生成较大的位宽算子，显著改善多目标优化结果的超体积。

Abstract

The rising usage of ai and ml-based processing across application domains has exacerbated the need for low-cost ML implementation, specifically for resource-constrained embedded systems. To this end,

ai ml-based processing approximate computing embedded machine learning ml-based design space exploration

发现论文，激发创造

AxOMaP: 设计基于 FPGA 的近似算术运算器使用数学规划

使用数据分析驱动的数学规划方法，合成 FPGA 的近似运算器，实现在嵌入式系统中机器学习推理的联合优化，取得了高达 21% 的超体积改进。

Sep, 2023

基于强化学习方法的近似计算技术的设计空间探索

本文提出了一种基于强化学习的多目标设计空间探索策略，以找到在准确度下降和功耗 / 计算时间减少之间取得平衡的应用的近似版本。实验结果表明，在某些基准测试中，在准确度下降和功耗 / 计算时间减少之间存在良好的平衡。

Dec, 2023

面向机器学习的扩展性偏差近存储 CMOS 模拟处理器

本文介绍了一种基于 S-AC 的偏置可扩展的模拟计算电路，其可以用于多种不同功耗和性能需求的机器学习（ML）应用，并且可以在 180nm 的 CMOS 工艺下实现近存储计算、非线性激活、内积计算、数模混合压缩存储等多个功能，同时也证明了电路模块的鲁棒性以及计算精度的影响效果。

Feb, 2022

近似计算调查，第二部分：特定应用和架构近似技术和应用

近十年来，近似计算作为一种新兴解决方案，在设计系统时调整结果质量以提高能源效率和 / 或性能的范式转变引起了学术界和工业界的关注。本研究通过两部分调研，覆盖了近似计算的关键方面（如术语和应用）以及从传统计算堆栈的各个层次（从系统到集成电路）的最新近似技术。在调研的第二部分中，我们对应用特定和架构近似技术进行了分类和详细介绍，这两者都旨在设计资源高效的处理器 / 加速器和系统。此外，我们还详细分析了近似计算的应用领域，并讨论了未来的挑战和发展方向。

Jul, 2023

通过近似计算的混合精度无线联邦学习

我们提出了一种基于近似计算的 OTA-FL 框架，通过优化量化性能平衡、开发异构梯度分辨率 OTA-FL 调制方案，实现了异构边缘计算环境中的 OTA-FL，并能够以 50% 更快和更平滑的服务器收敛速度和性能增强方式，比同质化精度方法更好地满足最低精度客户的要求。

Jun, 2024

BLASYS：使用布尔矩阵分解的近似逻辑综合

该论文提出了一种新的用于综合近似电路的技术，采用布尔矩阵分解对电路子电路的真值表进行逼近，以获取更低复杂度的子电路，实验表明此方法可在不影响准确度的情况下，节约高达 63% 的功耗。

May, 2018

从量子近似优化算法到量子交替算符近似

本文介绍了 Quantum Alternating Operator Ansatz，该算法能够更高效地实现混合算子，从而扩展了量子计算应用的广度。

Sep, 2017

为减少 DNN 加速器的片外数据访问而结合调度、内存分配和张量替换

通过一个名为 COSMA 的优化框架，我们能够在专用硬件加速器上为 DNNs 找到最佳的操作调度、内存分配和张量替换方式，从而最小化额外数据访问，同时通过分而治之的启发式方法可以将复杂 DNNs 的数据访问降低 85% 以上。

Nov, 2023

使用近似张量运算加速神经网络训练

通过对张量运算（矩阵乘法和卷积）应用基于样本的近似，提出了一种用于深度神经网络加速训练的新技术。应用到 MLP 和 CNN 网络的 MNIST，CIFAR-10 和 ImageNet 数据集的训练实验结果表明，该方法可以大幅度减少计算量和通讯量，并以不会对最终测试准确率产生可感知影响的方式提升训练速度。

May, 2018

模拟电路验证的自适应规划搜索算法

为了确保电路芯片的正常运行，该论文提出了一种基于机器学习的方法，利用高斯过程代理模型来训练操作条件配置，并在合成和实际电路中展示了更好的估计结果。

Jun, 2023