EFE: 端到端的帧到凝视估计

May, 2023

EFE: End-to-end Frame-to-Gaze Estimation

Haldun Balim, Seonwook Park, Xi Wang, Xucong Zhang, Otmar Hilliges

TL;DR该论文提出了一种基于帧的直接预测 3D 注视原点和 3D 注视方向的网络，在三个公共焦点数据集上实现了可比较的结果。

Abstract

Despite the recent development of learning-based gaze estimation methods, most methods require one or more eye or face region crops as inputs and produce a gaze direction vector as output. Cropping results in a h

gaze estimation learning-based frame-to-gaze network 3d gaze origin 3d gaze direction

发现论文，激发创造

一种适用于外观基准凝视估计的粗到细自适应网络

本文提出了一种基于面部和眼睛图像的凝视估计方法，利用粗 - 细策略从面部图像中估计基本凝视方向，通过相应的眼部图像预测残差进行细化，引入 bi-gram 模型和注意力组件来适应性地获取细粒度特征，实现了 MPIIGaze 和 EyeDiap 数据集上的最优表现。

Jan, 2020

深度图像注视估计

介绍了一种专门设计用于单眼输入的注视估计任务的新型深度神经网络架构，通过回归中间图像表示来简化三维注视方向估计任务，定量和定性结果表明该方法比现有技术实现了更高的精度，且对视线、头部姿势和图像质量的变化具有鲁棒性。

Jul, 2018

面部表情全貌外观定位注视估计

提出了一种全称人脸输入的外观识别方法，使用卷积神经网络对面部图像进行编码，应用于 2D 和 3D 注视估计中实现了重大的性能提升，对于极端头部姿势尤其明显。

Nov, 2016

注视估计的微分方法

本文介绍了一种基于差分方法的凝视估计技术，使用差分卷积神经网络直接预测同一受试者的两个眼睛输入图像之间的凝视差异，然后利用推断出的差异来预测新眼睛样本的凝视方向。实验结果表明，该方法即使只使用一个校准样本或在后续使用受试者特定的凝视适应方法时，也始终优于现有的方法。

Apr, 2019

利用外貌和形状线索的 3D 凝视估计的循环卷积神经网络

本论文使用多模态卷积神经网络在远程摄像机中完成了独立于人物和头部姿态的三维凝视估计。通过将人脸，眼睛区域和面部标志作为神经网络中的单个流来估计静态图像中的凝视。随后，利用凝视的动态特性，将所有帧的学习特征馈送到多到一循环模块，以预测最后一帧的三维凝视向量，其在多种头部姿态和凝视方向上获得了显著的改进。

May, 2018

信不信由你，我们知道你在看什么！

本文提出了一种基于人类凝视追踪思路的两阶段解决方案，集成了神经网络和数据集，有效地预测并追踪目标人物的目光方向，且经过大量实验证明，该方案相对于现有解决方案有明显优势。

Jul, 2019

使用卷积神经网络进行实时眼球注视方向分类

提出实时框架及卷积神经网络用于分类人眼凝视方向和评估眼部访问线索，并使用改进的 Viola-Jones 算法检测人脸，通过几何关系和面部特征点得到眼部区域，并进行逐帧测试以获得平均帧速率 24fps，结果显示其优于现有方法。

May, 2016

基于外观的注视估计，使用深度神经网络增强的合成图像

使用人工神经网络建立了一个模块化系统，通过对分别裁剪的眼睛进行估计，利用人脸检测和头部姿势估计组件，无需特殊硬件或红外滤光片，仅使用内置 RGB 相机进行人眼注视估计，通过包含大量合成数据集在训练模型中，达到了比相关方法更高的准确度。

Nov, 2023

非监督式注视点估计的表征学习

该研究提出了一种不需要注释的低维注视表示学习方法，在少于 100 个标注样本的情况下，实现了有竞争力的 few-shot 注视估计结果，并且可以应用于不同的实验数据集和注视网络预训练等方向。

Nov, 2019

半监督对比回归用于眼球注视估计

通过使用半监督对比学习框架，本文提出了一种新的对比损失范式，从而实现了基于注视方向的估计，该框架在使用少量带有标签的注视数据集时，可以找到泛化解决方案，即使对于未见过的人脸图像也能有良好的性能表现，与其他用于注视估计的最先进对比学习技术相比，我们的对比回归框架表现良好。

Aug, 2023