DVGaze:双视图注视预测
本文介绍了一种基于差分方法的凝视估计技术,使用差分卷积神经网络直接预测同一受试者的两个眼睛输入图像之间的凝视差异,然后利用推断出的差异来预测新眼睛样本的凝视方向。实验结果表明,该方法即使只使用一个校准样本或在后续使用受试者特定的凝视适应方法时,也始终优于现有的方法。
Apr, 2019
该研究使用 IVGaze 数据集,提出了一种车内注视估计方法并引入了新的注视金字塔变换器和双流注视金字塔变换器,展示了目前最先进的表现,并探索了注视区域分类的新策略。
Mar, 2024
通过采用扩张卷积来提取高分辨率特征,以改善眼睛图像在显著变化下的精确度,我们提出了 Dilated-Net 模型,它在两个 Gaze 估计数据集上都取得了最先进的结果,相比不使用扩张卷积的类似网络获得了显著提高(高达 20.8%)。
Mar, 2019
本研究提出一种新的单阶段端到端注视估计方法,可同时预测图像中多个面孔(>10)的注视方向,并使用 MPSGaze 数据集验证了该方法的有效性和易用性,为实时应用提供支持。
Apr, 2022
本研究提出一种基于深度残差网络和新的损失函数的差分残差模型,通过使用两个眼睛信息中的差异信息作为辅助信息解决了目光校准问题,并通过在两个公共数据集上的实验表明在眼部特征方面,该模型的性能优于现有的方法,同时对于含噪声的图像也表现出极强的鲁棒性。
Aug, 2022
本论文使用多模态卷积神经网络在远程摄像机中完成了独立于人物和头部姿态的三维凝视估计。通过将人脸,眼睛区域和面部标志作为神经网络中的单个流来估计静态图像中的凝视。随后,利用凝视的动态特性,将所有帧的学习特征馈送到多到一循环模块,以预测最后一帧的三维凝视向量,其在多种头部姿态和凝视方向上获得了显著的改进。
May, 2018
本文提出了一种基于面部和眼睛图像的凝视估计方法,利用粗 - 细策略从面部图像中估计基本凝视方向,通过相应的眼部图像预测残差进行细化,引入 bi-gram 模型和注意力组件来适应性地获取细粒度特征,实现了 MPIIGaze 和 EyeDiap 数据集上的最优表现。
Jan, 2020
提出实时框架及卷积神经网络用于分类人眼凝视方向和评估眼部访问线索,并使用改进的 Viola-Jones 算法检测人脸,通过几何关系和面部特征点得到眼部区域,并进行逐帧测试以获得平均帧速率 24fps,结果显示其优于现有方法。
May, 2016