- 低延迟语音匿名化端到端流模型
提出了一种流式模型来实现低延迟的说话人匿名化,通过使用轻量级内容编码器、预训练的说话人编码器和变化编码器,将语音信息解耦为语音内容、说话人身份和音调能量信息,并通过解码器重新合成语音信号,该模型实现了 230ms 的延迟,并在自然性、可理解 - 自动驾驶中基于事件的深度目标检测:综述
事件相机在自动驾驶中利用事件数据进行目标检测具有竞争优势。该论文提供了事件相机在自动驾驶中目标检测的概述,强调了事件相机的低延迟和轻量级架构的竞争性优势。
- 钻柱声学通信的端到端自编码器
通过深度学习自编码器 (AE) 设计的端到端通信系统可实现低延迟、高吞吐量和可靠性的钻杆通信,与基准的非连续 OFDM 系统相比,具有更低的误码率和峰均功率比操作时延。
- CVPR以低延迟、高质量和多样化提示的方式重新思考交互式图像分割
SegNext 是下一代交互式分割方法,具有低延迟、高质量和多样化的支持,通过引入密集设计,细化各种视觉提示的表示,提高了综合型模型的分割质量,在 HQSeg-44K 和 DAVIS 上表现出色。
- 增量式 FastPitch:基于分块的高质量文本语音合成
提出了增量 FastPitch,这是一种使用块基 FFT 块、受限的块注意力蒙版进行训练和固定尺寸过去模型状态进行推理的 FastPitch 变体,可以产生与并行 FastPitch 相当的语音质量,并且具有更低的延迟,适用于实时语音应用。
- 通过分组相关数据对象和计算实现低延迟机器学习推断
我们提出了一种新颖的相关性分组机制,使开发人员能够表达特定应用程序的数据访问相关性,以实现对托管流推断任务的服务器集群中的数据对象的协调管理,从而取得显著更低且更一致的延迟,提高节点利用率,并且只需要对应用程序的编码进行少量修改。
- 基于 FPGA 的粒子轨迹跟踪的低延迟边缘分类 GNN
本文提出了一种基于 FPGA 的资源高效的 GNN 架构,用于低延迟的粒子轨迹重建,该架构在 Xilinx UltraScale + VU9P 上的结果表明,相比于 CPU 和 GPU,性能提高了 1625X 和 1574X。
- 资源受限无人机群的低延迟、高可靠卷积神经网络分布式推理
该研究提出了一种将实时请求划分为子任务,并基于可用资源在无人机群中分配的系统模型,以最小化传输延迟和提高可靠性。研究使用三个子问题来优化传输功率、无人机位置和 CNN 层数的放置,并通过模拟结果表明,该模型表现出比竞争模型更好的性能。
- 脉冲神经网络的时间对比学习
本研究提出了一种时域监督对比学习的方法,可以使神经网络在处理时间序列信息时具备低延迟和高性能,取得了 CIFAR-10、CIFAR-100 和 DVS-CIFAR10 等数据集的最新性能水平。
- 语音处理低延迟 transformers
本文介绍了新型神经网络的构建块 ——transformer,在音频数据应用中倾向于限制其在离线任务的应用。为此,我们提出了 Streaming Attention(SA)和 Low Latency Streaming Attention(L - 空气计算:6G 无线网络中新一代计算范式的调查
提出了一种新的、下一代的范式,称为 Air Computing,它使用 3D 网络结构,包括低空平台、高空平台和低地球轨道,以与城市和农村区域的动态环境要求相适应,并使用 6G 无线网络作为基础通信系统,为所有应用程序提供动态、响应和高分辨 - EfficientFormer:在 MobileNet 速度下的视觉 Transformer
本文介绍了一种高效的纯 Transformer 设计方法 EfficientFormer,用于实现与 MobileNet 相当的性能且具有极低的推理延迟,它通过解决 ViT 中的存储器冗余问题来达到这一目的。
- CVPR基于脉冲表示的微分训练高性能低延迟脉冲神经网络
本文提出了一种 Differentiation on Spike Representation (DSR) 方法,利用加权频率编码将射击轨迹编码为射击表示,然后通过对子可微映射的梯度进行 SNN 训练,避免了 SNN 训练中常见的非可微性问 - AAAI低延迟脉冲神经网络的优化电位初始化
通过优化初始膜电位实现高精度 ANN-to-SNN 转换,使得 SNN 在低延迟下达到了与最优性能相当的准确率,并在 CIFAR-10、CIFAR-100 和 ImageNet 数据集上取得了最新的结果。
- 低延迟无 ASR 端到端口语理解系统
本文提出了一种语音理解系统,可以将一个波形分类为结构化数据 (如意图和槽) 而不需要先将其转录为文本,同时系统具有足够小的占用空间可以运行在微型控制器和嵌入式系统上,并且具有最小延迟以逐段处理输入音频数据,并得到了优秀的性能表现 (比其他类 - 深度脉冲神经网络模式识别的渐进串联学习
本文提出了一种称为渐进串联深度 SNN 的 ANN 到 SNN 的转换和分层学习框架,该框架利用脉冲计数以逼近模拟神经元的激活值,以及一种适应性训练调度器细化网络权重,其在大规模物体识别、图像重建和语音分离任务中能够展示出出色的分类和回归能 - ACLSTACL: 前缀到前缀框架的隐含预测与可控延迟的同时翻译
该研究提出了一种基于前缀的预测模型,采用 wait-k 策略来实现当前缀的翻译,并在中英文和德英文四个方向上实现了较低的延迟和合理的质量。
- MM在嵌入式 FPGA 中加速混合极低位宽神经网络的设计流程
在嵌入式 FPGA 中,通过混合量化方案加速极低比特宽度神经网络(ELB-NN),提出了一种设计流程,既涵盖了网络的训练,也包含了基于 FPGA 的网络部署,从而方便设计者探索设计空间,简化网络精度和计算效率之间的权衡,巧妙地在资源和功耗限 - MM超可靠低延迟通信的短分组长度编码
本文对超可靠低时延通信(URLLC)的现代信道编码技术进行了综述,讨论了其中遇到的挑战,并提出了针对短块长度的不同编码技术在性能和复杂度方面的比较,同时指出了该领域未来的研究方向和可能的解决方案。