- ICLR一种简洁的平铺策略用于保留地球观测图像中的空间上下文
我们提出了一种新的平铺策略,Flip-n-Slide,该策略在处理大型地球观测卫星图像时,当感兴趣对象(OoI)的位置未知且空间上下文对于类别消歧有必要时,提供了一种简洁而简化的方法,允许 OoI 在多个平铺位置和方向上表示。通过为每个平铺 - 基于高效注意力的特征增强场景解析
本文提出了一种新颖的特征增强网络,通过从多个特征提取级别收集空间上下文,并计算每个表示级别的注意力权重以生成最终的类别标签。该模型还学习了低分辨率下的空间上下文信息以保留场景元素之间的抽象空间关系并降低计算成本,最终的特征集合中融合了空间注 - 深度空间上下文:当注意力模型遇见空间回归
这篇研究提出了 “深度空间背景”(DSCon)方法,它利用空间背景的概念来研究基于注意力的视觉模型,在组织病理学家的启发下,该方法可以应用于各种领域。DSCon 通过将空间回归集成到流程中来定量衡量空间背景在特征、目标值(注意力得分)或残差 - 一个带有上下文的单一 2D 姿势对于 3D 人体姿势估计价值百倍
使用现有的 2D 姿态检测器产生的中间可视化表示,从而获得姿态的空间上下文信息。通过设计一个名为 Context-Aware PoseFormer 的简单基线方法来展示其有效性,该方法在速度和精度方面明显优于其他使用数百个视频帧的最先进方法 - 评估去噪扩散概率模型在重现空间上下文方面的能力
通过使用随机上下文模型(SCMs)产生训练数据,首次对 Denoising Diffusion Probabilistic Models(DDPMs)在医学成像领域相关信息学习能力进行了系统评估,结果表明 DDPMs 在生成具有空间上下文的 - CaSAR:接触感知骨骼动作识别
以供应资源有限的 AR/VR 眼镜界面和人机交互等应用为背景下,从第一人称视角进行骨架动作识别具有重要意义。本篇研究论文引入了一种称为 CaSAR(接触感知骨架动作识别)的新框架,它采用了手 - 物体交互的新表示形式来捕捉空间信息,并通过学 - AAAI自适应动态滤波网络用于图像去噪
本研究提出了一种用于改善高频和多尺度特征学习的动态卷积算法,其中采用了增强空间上下文信息的核生成模块 (SEKG) 以及动态卷积块 (DCB) 和多尺度动态卷积块 (MDCB)。此外,还提出了多维特征集成 (MFI) 机制,旨在融合多尺度特 - EMNLPSpaBERT:来自地理数据的预先训练语言模型用于地理实体表示
本文提出了一种新颖的 SpaBERT 空间语言模型,使用邻近地理实体建立一种通用的地理实体表示,同时扩展了基于 Bert 模型的句子表示方法以及加入一个空间坐标嵌入机制,用于保留二维空间中实体之间的空间关系,结果表明 SpaBERT 在 g - BeeTS: 基于蓝牙和 IP 广播的智能分布式传感器元组空间与代理相结合
通过 Bluetooth 广播技术与 Tuple Space 服务建立的 BeeTS 服务,实现了物联网智能设备的短距离、低能耗、面向时空的无连接与自组织通信。
- MTLDesc: 扩大视野,提升描述能力
通过采用上下文增强和空间注意机制,本文提出了一种可获得非局部感知的本地描述符方法,并在诸如 HPatches,Aachen Day-Night 定位和 InLoc 室内定位基准测试中,显著超越了先前的最先进本地描述符。
- 使用空间上下文表示进行多类细胞检测
本文介绍了一种新方法在数字病理学中自动检测和分类不同类型的细胞,包括肿瘤细胞,淋巴细胞或基质细胞,该方法通过使用空间统计功能来描述局部密度和深度聚类技术来学习高级细胞表征,特别关注空间上下文,该方法在不同的基准测试中表现出更好的性能,尤其是 - KDD全卷积网络中边界条件对时空动态学习的影响
研究了在完全卷积神经网络中引入空间上下文和物理边界的几种策略,并在两个时空演化问题上进行了评估,揭示了边界实现对于精度和稳定性的高度敏感性。
- CVPR物体检测中空间上下文对对抗鲁棒性的作用
本文主要研究利用空间上下文的快速目标检测算法,存在针对其进行针对性攻击的问题,并提出了限制空间上下文训练的解决方案。
- 视频拼图:用于视频动作识别的时空上下文的无监督学习
提出了一种自我监督的学习方法,可以联合推理视频的空间和时间上下文,利用拼图游戏方式进行视频片段的训练。
- AAAI基于自上而下反馈的人群计数卷积神经网络
本研究提出了一种基于 CNN 回归器和自上而下反馈的人群计数方法,通过利用空间上下文和场景语义来解决人群计数过程中由于外观的大量变异性和场景噪声而导致的假预测问题。
- ECCV基于卷积部位热图回归的人体姿态估计
本研究利用卷积神经网络进行人体姿态估计,通过利用关系和空间上下文,提出了一种特殊的 CNN 级联架构,并能够在部分遮挡的情况下,鲁棒地推断姿势,该级联架构能够指导网络集中精力在图像的哪个位置,并明确编码部分限制和上下文约束,并能够应对遮挡。 - ICCV无监督视觉表示学习:基于上下文预测
该研究探讨了利用空间上下文作为丰富的视觉表征的监督信号的方法。通过从每个图像中提取随机配对的路径来训练卷积神经网络,用于预测第二个路径相对于第一个路径的位置,从而实现对目标的识别,并证明该方法在性能上优于其他算法。
- Twitter 中的地理位置和语言识别
本文研究了三种自动语言识别方法与 Twitter 用户界面语言设置和语言人工编码之间的可靠性,比较了用户输入的个人资料位置与实际发推地点之间的不同,证明了用户生成的资料位置无法用作推特信息发布的有用代理。