一种面向地理空间探索的视觉主动搜索框架

Nov, 2022

一种面向地理空间探索的视觉主动搜索框架

A Visual Active Search Framework for Geospatial Exploration

Anindya Sarkar, Michael Lanier, Scott Alfeld, Roman Garnett, Nathan Jacobs...

TL;DR通过建立视觉主动搜索框架，结合强化学习技术和领域自适应方法，该研究提出了一种针对航拍图像的地理空间搜索模型，有效地提高了目标物体识别的准确率。

Abstract

Many problems can be viewed as forms of geospatial search aided by aerial imagery, with examples ranging from detecting poaching activity to human trafficking. We model this class of problems in a visual active search

geospatial search visual active search reinforcement learning domain adaptation satellite imagery

发现论文，激发创造

一种基于部分监督的视觉主动搜索强化学习框架

将视觉主动搜索与深度强化学习、监督信息和元学习相结合的方法在几个问题领域中显著优于现有的视觉主动搜索模型。

Oct, 2023

面向语义分割的视觉活动学习

本文研究了具体化视觉主动学习任务，该任务通过选择性的视野请求注释来探索三维环境，以获取场景理解，我们通过开发一系列智能体来研究具体化视觉主动学习，其中智能体配备语义分割网络，并使用深度强化学习以及奖励函数平衡任务性能和必要注释数据请求，得到了可靠的结果。

Dec, 2020

基于语义的人形机器视觉任务的主动感知技术与视点焦点传感器

通过使用语义信息，可以在场景探索和视觉搜索任务中有效地完成视觉任务，从而证明了语义模型在视觉任务中的优越性。

Apr, 2024

基于在线语义重构的主动场景理解

提出一种基于 RGBD 重建和语义分割的机器人操作主动理解未知室内场景的新方法，利用离线估计的离散视野分数场来驱动机器人的勘探扫描，结合基于体素的实时语义标注，优化遍历路径和相机轨迹，从而实现高效准确的在线场景解析。

Jun, 2019

AVA：通过视觉感知驱动的决策使成为自主可视化代理

我们的研究探索多模式基础模型在可视化中的应用，利用多模式大语言模型 (LMM) 的视觉感知能力来开发自主可视化代理人 (AVAs)，它们可以通过自然语言解释和实现用户定义的可视化目标。我们提出了 AVAs 设计的第一个框架，并展示了几种使用场景，以展示该提议范例的普适性。这些 AVAs 作为虚拟可视化助手可以协助领域专家完成可视化输出的参数选择，即使他们缺乏调整可视化输出的知识或专业技能。我们的初步探索和概念验证代理人表明，这种方法在需要解释以往可视化输出以选择适当的可视化参数时可广泛应用。我们与人工智能研究、医学可视化和放射学等领域的专家进行了非结构化访谈，并结合了他们的反馈，突出了 AVAs 的实用性和潜力。我们的研究表明，AVAs 代表了一种设计智能化可视化系统的通用范式，可实现高级可视化目标，为未来发展专家级可视化代理人铺平了道路。

Dec, 2023

基于图的 SAR 数据半监督分类主动学习

使用基于图的学习和神经网络方法的结合体进行 SAR 数据分类，该方法可以在无需标记数据的情况下实现费用效益高的主动学习，并在需要 ATR 的应用中显示良好的推广性能。

Mar, 2022

STAIR：语义目标驱动的主动隐式重建

我们提出了一个新的框架，利用姿态化的 RGB-D 测量和 2D 语义标签作为输入，进行语义目标的主动重建，实现对感兴趣目标的自适应视角规划，从而在网格和新视角渲染质量方面实现更好的重建性能，超过不考虑语义的隐式重建基线和基于显式地图的最先进的语义目标主动重建流水线。

Mar, 2024

VSA4VQA: 将矢量符号体系扩展到自然图像的视觉问答中

提出了一种名为 VSA4VQA 的新型 VSAs 的实施，它是第一个将 VSA 扩展到复杂空间查询的模型，并通过引入学习的空间查询掩模和预训练的视觉 - 语言模型来解决视觉问题回答任务，评估结果表明它能够有效地编码自然图像，并取得与最先进的深度学习方法竞争性的性能。

May, 2024

面向主动视觉的预测机器学习

该论文提出了基于主动推理框架的机器学习技术，提出了基于编码自动化和受生物启发的认知结构，并通过计算机模拟证明了该方法的有效性，同时分析了其局限性和优点。

Oct, 2017

面向可视化的大型数据库采样

提出了可视化感知采样（VAS）方法，通过优化可视化启发式损失函数，从而在保证可视化质量的基础上，实现对大规模数据集的快速采样。实验表明，VAS 相比现有的方法具有更高的成功率和更快的速度，尤其在回归、密度估计和聚类等场景下。

Oct, 2015