- 探索变形金刚模型在移动设备上用于自然语言处理的性能和效率
本研究旨在通过研究 Transformers 当前的设备执行状态,构建代表性模型基准,并彻底评估它们在具有不同计算能力的移动设备上的性能,实验结果表明 Transformers 不利于加速器,并指出需要软件和硬件优化才能实现高效部署。
- ACLMobileNMT:使 15MB 和 30ms 内进行翻译成为可能
本文提出 MobileNMT,这是一个可以在移动设备上进行翻译的系统,该系统通过一系列的模型压缩原则与量化相结合来实现,与现有系统相比,其速度提高了 47 倍,节省了 99.5% 的内存,只损失了 11.6% 的 BLEU。
- DeepStay: 利用弱监督从位置轨迹中提取停留区域
本文介绍了一种基于深度学习的弱监督和自监督的 Transformer 模型,称为 DeepStay,用于从位置轨迹中提取停留区域,同时在交通方式检测任务中取得显著的成绩。
- 扩散模型的时态动态量化
介绍了一种新的量化方法用于扩散模型,通过动态调整量化间隔来改善输出质量,并提出该方法在推理时没有计算开销和两种量化方法兼容,通过多种数据集的广泛实验证明了量化扩散模型在输出质量方面的显着改进。
- SnapFusion:移动设备上的文本到图像扩散模型,两秒钟内完成
该研究通过引入高效网络架构和步骤蒸馏等技术,提出了一种通用的方法,首次实现在移动设备上以不到 2 秒的速度运行文本到图像扩散模型。该模型可以使用户自己创作图像,而不需要高端 GPU 或云端推理,这将在内容创作方面具有重要作用。
- 移动应用的视觉 Transformer:简要概述
本文研究提出了一些专门为移动设备设计的 ViT 架构,分析了移动应用场景下 ViT 网络所面临的挑战,旨在为未来的研究方向提供基础,并选择最佳的 ViT 视觉架构以适用于移动设备。
- 二值光谱压缩成像
本文提出了一种适用于资源有限的移动设备的高效 HSI 修复方法 —— 二值化光谱重分布网络(BiSRNet),其通过将基础模型二值化并使用可缩放的双曲正切函数来逼近符号函数的方式来重新分配 HSI 表现,并使用四个二值卷积模块来解决尺寸不匹 - 在移动设备上监控和调整机器学习模型
Nazar 是第一个端到端移动设备监控和自适应机制的系统,它能够检测和修复由于特定根本原因导致的模型准确度下降,改进了现有方法在计算机视觉数据集上的 15% 的表现。
- 您的身份是您的行为 -- 基于机器学习和触摸动态的连续用户认证
本研究旨在探讨利用神经网络、极端梯度提升和支持向量机三种不同算法在移动触摸动力学方面实现连续认证的可行性,研究结果表明,移动触摸动力学在连续认证方面有很大的潜力用于增强安全性和减少未经授权的使用个人设备的风险,并且使用不同的算法可以在不同的 - 在移动设备上探索快速准确的语义分割模型 ——PP-MobileSeg
提出了 PP-MobileSeg,一种在移动设备上实现了最先进性能的语义分割模型,包括 StrideFormer 骨干卷积神经网络、聚合注意力模块和有效插值模块,并且与其他方法相比,该模型在准确性、模型大小和延迟之间取得了优越的平衡。
- ICLR移动设备实时图像去莫尔滤波演示
采用动态加速方法 (DDA) 和新设计的 moire prior 对漫反射现象进行实时检测和优化,以在移动设备上实现拍照质量的提高,并通过 Snapdragon 8 Gen 1 芯片在 Vivo X80 Pro 智能手机上验证了其在推理时间 - AAAI面向边缘设备的高效图像字幕生成
提出了一种基于 CLIP 模型的轻量级图像字幕生成器 LightCap,可以在资源有限的设备上使用,仅包含 40M 参数,比现有技术方法的模型大小减少了超过 75%,与仅使用单个 CPU 的手机的推理速度为 188ms 每张图像,并在著名数 - 基于人工智能的移动应用程序:一项探索性研究
本文通过数据集分析、关键问题定位和用户反馈与隐私保护等多方面对 56682 款 AI 应用进行了研究,揭示了其中的不足之处,如模型保护不足,用户隐私数据泄露等,还提供了数据集以供未来研究引用。
- 推荐系统中基于标签纠正的设备端模型微调
本研究针对推荐系统中的 CTR 预测任务,研究了如何在移动设备上有效地进行本地微调,提出了一种新的标签修正方法,并通过离线评估和在线 A/B 测试证明了它的必要性和优越性。
- COLING移动界面实现更优语义理解
通过对 RICO 数据集进行标注并使用多模态输入,该论文提出可提高移动设备的可访问性和自动化功能以便于使用的方法,使用户能够更好地了解 UI 元素的功能,并提出了一些创新性的功能,如通过标签引用 UI 元素,提高图标的语义等,以使 UI 对 - 轻量级变形金刚在移动设备上的人体活动识别
本文介绍了人体活动识别用于移动设备的轻量模型 HART,通过 IMUs 数据并使用 Transformer architecture 实现,相比于传统模型在减少资源消耗的同时具有更好的识别效果。
- 基于能量感知的 JPEG 图像压缩:多目标方法
本文研究了移动设备中图像对能源消耗的影响,并提出了一种基于 JPEG 图像压缩量化表的多目标策略来提高图像质量和减少图像文件大小。在实验研究中表明,该策略嵌入到元启发式算法中可以提高基线算法的性能。
- 实时高效图像超分辨率的快速最近卷积
本文提出了一种简单的卷积神经网络与快速最近卷积模块(NCNet)的方法,并使用 8 位量化在移动设备上进行可靠的实时超分辨率,以实现更高效的超分辨率方法。
- 高精度空中计算的能量和频谱高效联邦学习
本文提出了基于 M-AirComp 的联邦学习多位计算方法及移动设备的能量高效设计,旨在解决联邦学习在移动设备上更新梯度导致的频繁无线更新和能量消耗问题。经过大量仿真实验,相比之前的方法,我们的方案在频谱利用,能量效率和学习准确率方面优于现 - 建议列表与连续生成:基于生成模型的移动设备写作交互设计对文本长度、措辞和感知作者身份的影响
本文探讨了人工智能在移动设备上写作的两种用户界面设计,通过一个被监督的在线研究得出,无论是使用连续生成文本的方式还是建议写作的方式人工智能在撰写过程中都会影响文本创作,但两种设计存在差异,需要在用户体验和用户输出方面做出不同的选择。