本论文使用多模态卷积神经网络在远程摄像机中完成了独立于人物和头部姿态的三维凝视估计。通过将人脸,眼睛区域和面部标志作为神经网络中的单个流来估计静态图像中的凝视。随后,利用凝视的动态特性,将所有帧的学习特征馈送到多到一循环模块,以预测最后一帧的三维凝视向量,其在多种头部姿态和凝视方向上获得了显著的改进。
May, 2018
本文提出了一种新颖的生成模型,能够在控制眼睛注视和头部方向角度方面达到细粒度控制,并通过在自学习中学习发现、解缠和编码这些外部变化来分离众多与外貌相关的因素,进而优化了准确性和数据下游任务,从而提高了端到端交叉数据集准确性的能力。
Oct, 2020
通过深度学习的多任务方法,提出了一种可以同时处理头部姿势、人脸对准和可见性的网络结构,相比现有技术,在头部姿势和可见性方面均取得了最佳表现,在人脸对准方面也达到了和现有技术同等的状态。
Feb, 2022
使用人工神经网络建立了一个模块化系统,通过对分别裁剪的眼睛进行估计,利用人脸检测和头部姿势估计组件,无需特殊硬件或红外滤光片,仅使用内置 RGB 相机进行人眼注视估计,通过包含大量合成数据集在训练模型中,达到了比相关方法更高的准确度。
Nov, 2023
该研究提出了一种不需要注释的低维注视表示学习方法,在少于 100 个标注样本的情况下,实现了有竞争力的 few-shot 注视估计结果,并且可以应用于不同的实验数据集和注视网络预训练等方向。
Nov, 2019
本文提出了一种新的 CNN 层,称为可视化层,能够与不同损失函数联合优化,减小了训练时间并提高了面部对齐的准确性。
Jul, 2017
提出实时框架及卷积神经网络用于分类人眼凝视方向和评估眼部访问线索,并使用改进的 Viola-Jones 算法检测人脸,通过几何关系和面部特征点得到眼部区域,并进行逐帧测试以获得平均帧速率 24fps,结果显示其优于现有方法。
May, 2016
介绍了一种专门设计用于单眼输入的注视估计任务的新型深度神经网络架构,通过回归中间图像表示来简化三维注视方向估计任务,定量和定性结果表明该方法比现有技术实现了更高的精度,且对视线、头部姿势和图像质量的变化具有鲁棒性。
Jul, 2018
通过采用扩张卷积来提取高分辨率特征,以改善眼睛图像在显著变化下的精确度,我们提出了 Dilated-Net 模型,它在两个 Gaze 估计数据集上都取得了最先进的结果,相比不使用扩张卷积的类似网络获得了显著提高(高达 20.8%)。
Mar, 2019
本研究利用全局 CNN 模型和成对 CNN 模型来检测自然场景下的人头部位,通过引入新的数据集进行测试,结果显著提高了人头部位检测的准确性,并优化了检测速度。
Nov, 2015