- MobileDiffusion:移动设备上的次秒级文本到图像生成
通过在架构和采样技术上进行广泛优化,我们提出了一种高效的 MobileDiffusion 文本到图像扩散模型,它在移动设备上实现了显著的亚秒级图像生成推断速度,创立了新的技术水平。
- 使用分散聚合进行具有差分隐私的联邦学习
移动设备、隐私、实用性、联邦学习和差分隐私是该研究的主要关键词,研究通过在联邦学习中采用差分隐私的实验环境并使用基准数据集来探讨隐私与实用性之间的平衡问题。
- LightSpeed:移动设备上轻量快速的神经光场
在移动设备上实时进行新视角图像合成由于有限的计算能力和存储而受到限制。体积渲染方法(如 NeRF 及其衍生方法)在移动设备上使用不适宜,因为其计算成本高。然而,神经光场表示方法的最新进展在移动设备上展示了有希望的实时视角合成结果。我们发现使 - MM多样化和征服:强盗和多样性提升电子商务主页体验
移动电子商务平台中,提供精准的商品推荐至关重要。通过将可视控件放置在界面顶部,以便在有限的屏幕空间内显示给用户,可以有效吸引用户的注意力和提高用户投射率。 这项工作提出了一个基于上下文多臂赌博问题和多样性层次相结合的两阶段排序框架,用于对垂 - ShaDocFormer:具有级联融合细化器的文档阴影去除的阴影注意力阈值检测器
提出了一种基于 Transformer 的体系结构 ShaDocFormer,通过整合传统方法和深度学习技术解决了文档阴影消除问题,通过阴影 - 注意阈值检测器(STD)和级联融合细化器(CFR)两个组件,能够精确检测和捕捉阴影和照明的变化 - 面向低功耗计算机视觉的即时深度神经网络优化控制
移动设备上处理视觉数据具有多种应用,但现有的计算机视觉技术通常过于耗电无法部署在资源受限的边缘设备上。本文提出一种新技术,通过引入超参数来动态调整深度神经网络的精确度和能源消耗,无需重新训练即可适应不同边缘应用的硬件约束与精确度要求。该技术 - MONDEO:多阶段僵尸网络检测
手机设备、僵尸网络恶意软件、FluBot、基于 DNS 的僵尸网络和 MONDEO 是该研究论文的关键词。MONDEO 是一个多阶段的机制,具有灵活的设计,用于检测基于 DNS 的僵尸网络恶意软件,通过黑名单 / 白名单、查询速率分析、异域 - 跨移动设备进行百亿规模语言模型的联邦微调
FwdLLM 是一种创新的 FL 协议,通过无需执行误差反向传播训练方法的方式,在手机设备上实现了更好的内存效率和时间效率,具有比传统方法更快的收敛速度和更小的内存占用。
- MovePose: 移动和边缘设备上的高性能人体姿势估计算法
MovePose 是一种为 CPU-based 移动设备上的实时人体姿势估计而设计的优化轻量级卷积神经网络,具有高精度和实时性能。
- PGT-Net:小面积湿指纹去噪与识别的渐进引导多任务神经网络
本研究提出了一种面向移动设备的端到端可训练的渐进式引导多任务神经网络(PGT-Net),通过清理小区域湿指纹图像以改善识别性能,将二进制信息作为输出增强的指导,结合了脊和谷细节。实验证明 PGT-Net 在湿指纹去噪和指纹识别率(FRR)方 - MM通过面部微表情识别捕捉难以捉摸的抑郁症
通过使用面部微表情(FMEs)来识别与检测潜在真实情绪,我们提出了一种基于面部特征点的感兴趣区域(ROI)方法,用于诊断掩盖性抑郁症,并描述了一种低成本和隐私保护的解决方案,使得在个人环境(如家中)能够使用便携式移动设备进行自诊断。我们展示 - 移动设备上的实时神经视频恢复与增强
移动设备上的视频流媒体体验优化是一个挑战,本文提出了一种基于深度学习的实时增强方法,包括视频帧恢复、超分辨率算法和接收端增强感知的视频比特率自适应算法,评估结果显示该方法能够提高视频流媒体系统的实时增强效果,并显著提高 24% 至 82% - 绿色移动计算中人工智能的二重性:文献综述
人工智能在移动设备领域带来了越来越多的新功能,但其操作也消耗了大量能源。本文回顾了过去十年在绿色移动计算领域中使用人工智能的文献,并总结了 13 个主要课题。研究结果表明,该领域近年来有所增长,但对于基于人工智能的移动系统能源消耗的研究相对 - SqueezerFaceNet:通过过滤器修剪进一步减少小型人脸识别 CNN
移动设备的广泛使用为可靠的实时人脸识别验证提供了需求,本研究介绍了一种轻量级的人脸识别网络 SqueezerFaceNet,通过基于 Taylor 分数的网络剪枝方法将网络大小进一步减小,并且在不显著损失性能的情况下证明了其有效性。
- RepViT:从 ViT 的视角重新审视移动 CNN
轻量级视觉变换器(ViTs)相较于资源受限的移动设备上的轻量级卷积神经网络(CNNs),通过多头自注意模块获得更高的性能和更低的延迟。本研究回顾了轻量级 CNNs 的高效设计,强调其在移动设备上的潜力,并通过整合轻量级 ViTs 的高效架构 - MOBIO 数据库上的面部标志点检测评估
MOBIO 是一个双模态数据库,主要用于研究在移动设备上部署生物特征识别技术。本研究首次在 MOBIO 数据库上对面部标记检测进行评估,结果表明该数据库对于面部标记检测是具有挑战性的。
- FedHIL:面向移动设备的弹性异构联合学习,用于室内定位的鲁棒性增强
本文提出了一种融合室内定位和联邦学习技术的新型嵌入式机器学习框架 FedHIL,以提高设备异构环境下室内定位的准确性,同时保护用户数据隐私,在现实世界的不同室内环境和异构移动设备中进行的实验证明,FedHIL 表现优于现有最先进的 FL 和 - 移动云协同智能推理
在移动设备上,利用深度学习模型进行 AI 应用程序时,采用共享的移动 - 云推理方法可以降低推理的延迟、能源消耗和网络带宽使用,同时提供隐私保护措施。
- 面向带宽和资源受限的物联网系统的灵活分割 DNN 的精简编码器
在边缘计算和分布式计算的背景下,通过使用基于可改变编码器的分层执行,我们提出了一种创新的拆分计算方法,该方法可以实时适应计算负载和传输的数据大小,而不会对移动设备造成太大的计算负荷,从而提高了压缩效率和执行时间。
- NILUT: 条件神经隐式 3D 查找表用于图像增强
这项工作提出了一种神经隐式 LUT(NILUT),作为相机渲染管道的一部分,用于快速而低成本地进行多种图片风格的连续 3D 颜色转换,较传统的 3D LUT 方法更具有内存效率。