人类扫描路径预测的最新技术

Feb, 2021

State-of-the-Art in Human Scanpath Prediction

Matthias Kümmerer, Matthias Bethge

TL;DR评估人类扫视路径预测模型的学术论文，引入新的评估指标方法并详细比较了现有模型的性能，提出了以往指标所忽略的问题点。论文最终提出了 MIT/Tuebingen Saliency Benchmark 数据集作为基准，供研究人员参考，评价其模型预测的准确性。

Abstract

The last years have seen a surge in models predicting the scanpaths of fixations made by humans when viewing images. However, the field is lacking a principled comparison of those models with respect to their predictive power. In the past, models have usually been evaluated based on comparing human scanpaths to scanpaths generated from the model. Here, inste

scanpath prediction model evaluation saliency metrics benchmarking mit/tuebingen saliency benchmark

发现论文，激发创造

统一动态扫视路径预测器优于单独训练模型

通过深度学习的社交线索整合模型，我们开发了一个视频中注视预测的模型，通过递归地整合注视历史和社交线索来学习注视路径，以填补以往只关注群体模型而忽视了个体差异的研究空白。我们观察到这种单一统一的模型通过整合普遍关注和个体化注意力行为的方式在注视数据集上表现出色，优于个别训练的模型。

May, 2024

简化显著性基准测试：分离模型、显著图和度量

通过贝叶斯决策理论，将视觉显著性模型、显著性地图和评价指标分离，提出了一种基于概率模型的注视密度预测方法，并通过计算这些最优显著性地图来解决了显著性模型评估中不一致的指标问题。

Apr, 2017

利用合成扫视路径增强的预训练语言模型用于自然语言理解

整合了合成扫视路径生成和扫视路径增强的语言模型，消除了对人类注视数据的需求，并具有与真实数据增强的语言模型相媲美的性能。

Oct, 2023

对比语言图像预训练模型作为零样本人类扫视路径预测器

介绍了 CapMIT1003 数据集和 NevaClip 预测视觉扫描路径的方法，后者结合了对比语言 - 图像预训练模型和仿生神经视觉注意力算法，结合任务相关的指导信息，提高了视觉注意力的模拟准确性。

May, 2023

超越平均：个体化视觉扫视路径预测

通过个体化的扫视预测方法，本研究旨在准确预测不同个体在多样化的视觉任务中如何转移注意力，以弥补现有的视觉扫视模型忽视个体差异的不足。通过提出一个包含三个创新技术部分的个体化扫视预测方法，即观察者编码器、以观察者为中心的特征整合方法以及自适应注视优先机制，我们的方法能够有效处理不同观察者之间的注意力变化，成为将一般的扫视模型转变为个体化模型的综合工具。以基于价值和基于排名的指标进行的综合评估验证了方法的有效性和普适性。

Apr, 2024

Eyettention: 一种基于注意力的双序列模型，用于预测阅读过程中人类扫视路径

本文提出了一种名为 Eyettention 的双序列模型，它可以同时处理词序列和注视序列，通过交叉序列注意机制实现了两个序列的对齐，并在不同的语言数据集上进行了广泛评估和深入分析。结果显示，Eyettention 在预测扫描路径方面表现优于现有模型。

Apr, 2023

一种基于 LSTM 的显著性关注模型用于预测人眼注视点

提出了一种基于卷积 LSTM 的新型模型，结合神经注意机制，可预测准确的显著图，并学习一组使用高斯函数生成的先验图，这种模型在公共显著性预测数据集上表现优于现有技术，可以克服人眼注视典型的中心偏差，并且对于不同的情境展现了关键组件各自的贡献。

Nov, 2016

多模态学习与放射学认知过程：胸部 X 光扫描路径预测的 MedGaze

利用计算机视觉预测医学图像中的人眼注视路径，通过大型数据库生成热度图和眼动视频以协助综合分析，并与最先进的方法相比较其性能和普适性。

Jun, 2024

利用计算注意力预测人类注意力

本研究提出了人类注意力变压器（HAT），它是一种单一模型，预测两种形式的注意力控制，并通过使用一种新颖的基于转换器的架构和一种简化的凹面视网膜，实现了类似于人类动态视觉工作记忆的时空意识，同时避免了离散化固定目光。HAT 在计算注意力方面设定了新方向，并在各种注意力需求场景中更好地预测人类行为，具有广泛的适用性。

Mar, 2023

为改善 NLP 表现合成人类凝视反馈

本文提出了一种基于 ScanTextGAN 的人类注视路径生成模型，通过集成生成的注视路径数据来提高自然语言处理领域中多个任务的性能表现。

Feb, 2023