移动设备上实时深度头发抠图

Dec, 2017

Real-time deep hair matting on mobile devices

Alex Levinshtein, Cheng Chang, Edmund Phung, Irina Kezele, Wenzhangzhi Guo...

TL;DR该研究使用改进的 MobileNet CNN 技术，以快速准确的方式对头发进行分割，实现了在美容行业中实时增强发色的目标。

Abstract

augmented reality is an emerging technology in many application domains. Among them is the beauty industry, where live virtual try-on of beauty products is of great importance. In this paper, we address the probl

augmented reality beauty industry hair segmentation mobilenet cnn real-time

发现论文，激发创造

移动 GPU 实时头发分割与重新上色

提出了一种针对实时移动应用的基于神经网络的头发分割新方法，其相对较小的神经网络可在移动 GPU 上实现实时推理速度（视设备而定的 30-100+ FPS），同时保证高精度，并提出了一种高度逼真的头发重染方案，已在主要 AR 应用程序中部署并被数百万用户使用。

Jul, 2019

移动电话上人像动画快速深度抠图

本文提出了一种基于深度学习的、适用于移动设备上实时进行图像抠图的方法，包括使用二元掩膜和边缘保留技术来实现精确抠取肖像图像。实验结果表明，该算法在跟踪最新的抠图算法的同时，实现了 15 帧每秒的实时性能。

Jul, 2017

面向移动设备的实时自动人像抠图

通过使用基于多分支扩张卷积的线性瓶颈块的模型 MMNet，我们解决了移动设备上自动人像抠图的问题，实现了实时推断，而且性能下降很小，比现有技术更快。

Apr, 2019

指甲油试穿：本地和浏览器智能手机 AR 应用的小物体实时语义分割

本文提供了一个小物体的语义分割系统，使指甲油试色 AR 应用程序可以在本地和 web 手机应用程序中实时运行。通过调整输入分辨率和神经网络深度，我们的模型设计实现了性能和运行时间的平滑折衷，最高性能设置在 iPad Pro 上的本地应用程序中以 29.8 毫秒的运行时间实现了 94.5 mIoU。我们还提供了一个指甲油试色的后处理和渲染算法，该算法与我们的语义分割和指甲基部 - 顶部方向预测相结合。

Jun, 2019

使用移动 GPU 从单目视频实时获取面部表面几何信息

本文提出了一种基于神经网络的端到端模型，从单个摄像头输入中推断出人脸的近似 3D 网格表示，适用于 AR 应用程序。该模型具有相对密集的 468 个顶点网格模型，非常适合基于人脸的 AR 效果。该模型在移动 GPU 上具有超级实时推断速度（100-1000+FPS，取决于设备和模型变体），并且预测质量与同一图像的手动注释的变化相当。

Jul, 2019

通过图像和深度反向图形学实现的发色数字化

本文提出了一种新的方法用于抓取毛发实例的颜色外观，基于自监督机器学习的逆向图形模型，此方法结合了可控成像设备、光线追踪渲染器和逆向图形模型，并不需要使用可微分渲染进行训练，在真实和合成的图像上均能正确地捕捉和呈现毛发颜色。

Feb, 2022

在沉浸式可穿戴设备上部署基于卷积神经网络的计算机视觉模型的方法论

该论文介绍了一种方法，通过在计算机上训练 CNN 模型并将优化的权重矩阵传输到 AR 头戴设备，以在 AR 头戴设备上部署 CNN 模型。该方法将图像数据和 CNN 层转换为适合 AR 平台的一维格式，在 HoloLens AR 头戴设备上使用 PyTorch 训练 LeNet-5 CNN 模型并部署，结果表明模型的准确率约为 98%，与在计算机上的表现相似。这种 CNN 和 AR 的结合使得 AR 头戴设备能够实时进行图像处理，实现了人工智能模型与人的交互。

Jun, 2024

LookinGood: 实时神经再渲染技术提升表现捕捉

该论文介绍了一种基于神经渲染的深层结构，可以在实时中进行补全、超分辨率、去噪，取得高质量图像，适用于虚拟和增强现实头盔，大大改善了用户的使用体验。

Nov, 2018

移动设备上的实时神经视频恢复与增强

移动设备上的视频流媒体体验优化是一个挑战，本文提出了一种基于深度学习的实时增强方法，包括视频帧恢复、超分辨率算法和接收端增强感知的视频比特率自适应算法，评估结果显示该方法能够提高视频流媒体系统的实时增强效果，并显著提高 24% 至 82% 的视频体验质量。

Jul, 2023

基于 RGB 输入的实时面部分割和表现捕捉

通过显式的语义分割技术，利用深度学习网络在实时的不受限制的图像中进行面部追踪，进而应用于虚拟化妆和面部替换任务。

Apr, 2016