用于实时神经科学实验的 LFADS 的 FPGA 部署

Feb, 2024

用于实时神经科学实验的 LFADS 的 FPGA 部署

FPGA Deployment of LFADS for Real-time Neuroscience Experiments

Xiaohan Liu, ChiJui Chen, YanLun Huang, LingChi Yang, Elham E Khoda...

TL;DR使用 LFADS 模型和 FPGA 实现的高效实时数据处理方法，能够从高维度的神经尖峰数据中推断出潜在的动态，为研究神经人群动力学和提高计算算法的实时处理能力提供了新的机会。

Abstract

Large-scale recordings of neural activity are providing new opportunities to study neural population dynamics. A powerful method for analyzing such high-dimensional measurements is to deploy an algorithm to learn the low-dimensional →

neural population dynamics latent dynamics lfads high-dimensional neural spiking data real-time processing

发现论文，激发创造

通过动态系统进行潜在因素分析的 LFADS

LFADS 是一种基于变分自编码器的时序模型，在神经科学中应用广泛，能够通过推断出潜在动力学，对同时记录的高维神经放电数据进行低维度因子分析。

Aug, 2016

lfads-torch：一种通过动力系统进行潜在因子分析的模块化和可扩展实现

基于动力系统的潜在因素分析（LFADS）是一种基于 RNN 的变分时序自编码器，可在科学和工程领域中实现去噪高维神经活动的最先进性能。lfads-torch 是 LFADS 的一个新开源实现，利用动态计算图、简化配置文件和大规模训练，统一了现有的变体，并旨在更易理解、配置和扩展。

Sep, 2023

非线性嵌入线性动力神经群体模型

提出了一种非线性生成模型 fLDS，并使用变分推断技术来拟合该模型，并在两种神经数据集上应用，与最先进的神经人口模型相比，fLDS 可用较少的潜在维度捕捉更多的神经变异，提供更好的预测性能和可解释性

May, 2016

在 FPGAs 中部署 AI 推理引擎的框架实现

本文介绍了用于解决 SLAC 数据实验的高速探测器的存储问题的解决方案 —— 用机器学习技术在边缘计算设备上实现实时数据处理的 SLAC 神经网络库框架，该框架采用基于 FPGA 的加速器来实现 ML 解决方案，并且支持所有权重的 RTL 重训练和恢复。

May, 2023

基于 FPGA 的深度神经网络在粒子物理中的快速推断

介绍了基于 FPGA 进行神经网络推理的案例研究，其使用高级综合技术（HLS）构建机器学习模型，旨在为粒子物理学的高速实时事件处理提供支持，适用于很多场合，如寻找新的暗扇区粒子和测量希格斯玻色子等。

Apr, 2018

隐空间动态网络 (LDNets): 学习时空过程内在的动力学

对于展现时空动态响应的系统的演化进行预测是促进科学创新的关键技术，传统基于方程的方法需要大规模并行计算平台和大量的计算成本。相比之下，我们提出了一种名为 Latent Dynamics Network 的新型架构，该架构使用降维和深度学习算法来描述系统演化的低维潜在空间，从而预测空间依赖场对外部输入的时间演化，并在几个测试案例上验证了该方法的高效性和精确性。

Apr, 2023

一种包含自适应数据容错恢复调整的随机梯度下降算法用于隐因子分析

本文提出了一种 ADRC 结合 SGD 算法来快速且准确地分析高维不完整矩阵的潜在因子，并在两个高维不完整数据集上的实证研究中表明，该模型在计算效率和准确性方面优于现有的 LFA 模型。

Jan, 2024

DLAU：一种在 FPGA 上可扩展的深度学习加速器单元

本文提出了一种可扩展的加速器体系结构 DLAU，通过在 FPGA 上实现，使用三个流水线处理单元来提高吞吐量并利用瓦片技术探索深度学习应用程序的局部性来提高性能和维护低功耗，实验结果表明 DLAU 加速器与 Intel Core2 处理器相比，速度提高了 36.1 倍，功耗为 234mW。

May, 2016

面向高效图像识别的低延迟统一动态网络

动态计算已成为提高深度网络推理效率的一种有前途的方法，我们提出了一个名为 “LAUDNet” 的框架，它集成了三个主要的动态范例，以缩短模型的延迟，通过算法设计与调度优化相结合，准确衡量动态操作延迟的潜在预测器指导。我们在多个视觉任务上测试了 LAUDNet，其在 V100、RTX3090 和 TX2 GPU 上能够显著降低 ResNet-101 等模型的延迟超过 50％，而且在准确性和效率之间取得良好的平衡。

Aug, 2023

智能制造的特征异常检测系统 (FADS)

本研究提出了一种新的基于预训练卷积神经网络的特征异常检测算法（FADS），它无需调整 CNN 权重就能表现出优秀的性能，能够准确地检测工业自动化和零部件质量保证中的异常情况，同时可以用于增材制造和过程参数变化检测。

Apr, 2022