- 通过近似计算的混合精度无线联邦学习
我们提出了一种基于近似计算的 OTA-FL 框架,通过优化量化性能平衡、开发异构梯度分辨率 OTA-FL 调制方案,实现了异构边缘计算环境中的 OTA-FL,并能够以 50% 更快和更平滑的服务器收敛速度和性能增强方式,比同质化精度方法更好 - 近似乘法器的可微分神经架构搜索:ApproxDARTS
将近似计算的原则融入到硬件感知的深度神经网络(DNN)的设计中,利用名为 DARTS 的可微分神经架构搜索方法,我们提供了一种名为 ApproxDARTS 的神经架构搜索方法,能够利用近似乘法器降低生成的神经网络的能耗。
- TransAxx: 高效逼近计算的 Transformer
本研究使用 Vision Transformer 模型结合近似计算方法分析了在低功耗设备上实现 Transformer 模型的计算要求和性能之间的折衷,并提出了使用蒙特卡洛树搜索算法生成 Vision Transformer 模型的近似加速 - 利用离散基因训练实现打印 MLP 网络的嵌入式硬件逼近
利用近似计算并将硬件近似集成到多层感知器(MLP)的训练过程中,为 Printed Electronics(PE)设计了一种基于遗传算法的硬件感知训练方法,实现了超过 5 倍的面积和功耗降低,同时优于最先进的近似和随机打印 MLPs。
- 基于强化学习方法的近似计算技术的设计空间探索
本文提出了一种基于强化学习的多目标设计空间探索策略,以找到在准确度下降和功耗 / 计算时间减少之间取得平衡的应用的近似版本。实验结果表明,在某些基准测试中,在准确度下降和功耗 / 计算时间减少之间存在良好的平衡。
- 面向印刷多层感知机的乘积累加和激活的定制逼近
本文提出了一种基于印刷电子技术的自动设计框架,通过引入近似计算和定制设计的原则,克服了印刷电子技术中复杂电路实现的限制,实现了超低功耗的多层感知器分类器,使得即使在最复杂的结构下,也能实现电池供电操作且显著超越目前的技术水平。
- AxOMaP: 设计基于 FPGA 的近似算术运算器使用数学规划
使用数据分析驱动的数学规划方法,合成 FPGA 的近似运算器,实现在嵌入式系统中机器学习推理的联合优化,取得了高达 21% 的超体积改进。
- AxOCS: 使用配置超采样扩展 FPGA 上的近似算子
通过提出 AxOCS 方法,利用 AI 和 ML 进行超采样,以生成较大的位宽算子,显著改善多目标优化结果的超体积。
- 近似计算调查,第二部分:特定应用和架构近似技术和应用
近十年来,近似计算作为一种新兴解决方案,在设计系统时调整结果质量以提高能源效率和 / 或性能的范式转变引起了学术界和工业界的关注。本研究通过两部分调研,覆盖了近似计算的关键方面(如术语和应用)以及从传统计算堆栈的各个层次(从系统到集成电路) - 使用逼近误差的 DNN 故障韧性分析的评估器
本文提出了一种名为 APPRAISER 的新型弹性评估方法,旨在通过采用近似计算错误的概念,为保障安全性的深度神经网络(DNN)体系结构而设计,以解决现有方法中时间、设计和控制复杂性的各种问题,它可以在评估过程中提供数千倍的加速,并保持高准 - 训练神经网络以在近似硬件上执行
研究表明,近似计算方法在深度学习中具有巨大潜力,尤其适用于受电源预算限制的便携设备的推理任务,但由于缺乏针对近似计算的训练方法,其潜力尚未得到充分发挥。本文提出了近似硬件训练的方法,并演示了这些方法如何专门针对近似硬件进行训练,并提出了加速 - MM防御性近似计算:使用近似计算保护卷积神经网络
使用硬件支持的近似计算来提高机器学习分类器的鲁棒性,在黑箱、灰箱和白箱攻击场景中,实现了成功的防御,并减少了资源利用和能量消耗。
- BLASYS:使用布尔矩阵分解的近似逻辑综合
该论文提出了一种新的用于综合近似电路的技术,采用布尔矩阵分解对电路子电路的真值表进行逼近,以获取更低复杂度的子电路,实验表明此方法可在不影响准确度的情况下,节约高达 63% 的功耗。
- ApproxDBN:用于鉴别式深度置信网络的近似计算
通过有限精度变量、关键性分析、贪婪策略等技术实现近似深置信网络 (ApproxDBNs),在保证目标准确率的前提下,最大化降低硬件实现的能耗。实验结果表明,通过限制准确度损失,能够显著降低硬件的处理精度。