- 基于视觉的神经外科导航:无监督定位和相机姿态预测
基于解剖识别的深度学习方法,通过无监督学习从手术视频中构建手术路径,从而解决内窥镜手术中由于缺乏可区分的纹理和地标以及内窥镜设备的局限性(如有限的视野和光照条件)所带来的定位问题。
- 一种分层特征重构的自编码器用于无监督异常检测
无需任何手动注释和先前知识的异常检测和定位是一项具有挑战性的任务,本文提出了一个简单而有效的架构,在异常检测中取得了更准确和鲁棒的定位结果。
- 全球尺度自监督传感器融合通道图
本文提出了一种新颖的信道绘图技术,通过利用周围传输接收点(TRPs)的到达时间测量和它们的位置,并在算法的训练阶段利用激光扫描仪数据,在信道绘图中融合传感器数据,以减小与 6G 设想数字之间的差距。仿真结果表明,我们的算法在 90% 的时间 - DBDH: 一种用于隐形嵌入区域定位的双支路双头神经网络
本文提出了一种基于 Dual-Branch Dual-Head(DBDH)神经网络的不可见嵌入区域精确定位技术,利用低级纹理分支和高级上下文分支来捕捉高频信号以及提取嵌入和正常区域的区分特征,通过检测头直接检测嵌入区域的四个顶点,并引入额外 - 利用现成的扩散模型进行医学术语定位
使用潜在扩散模型在零样本的情况下,通过选择特征和后处理进行文本引导的医学扫描的定位,相比于显式对齐图像与文本的联合嵌入空间的最新方法表现出竞争力并在多种病理类型上优于它们。
- 应用自适应主动曝光控制技术改善现场视觉基准标志的感知
准确的本地化对于自主水下载具(AUVs)进行精确任务非常重要,而对于水下恶劣的照明条件,使用基于视觉标记的基于图像梯度的主动摄像机曝光控制方法可以显著提高机器人定位的准确性。
- 纹理的盲定位和异常聚类
我们提出了一种新的方法来在纹理图像中盲目聚类异常,通过高精度地识别异常区域并使用对比学习增加不同异常类型的可分离性和降低类内变异,我们的实验表明所提出的解决方案相比以往工作有了显著的改进,树立了新的技术水平。
- 运用边缘检测和神经网络来改善无人机定位
该论文提出了一种新的方法,用于在缺乏全球导航卫星系统(GNSS)的环境中对无人机进行地理定位。通过预处理图像以提取边缘信息,可以显著提高 UAV 地理定位方法的性能,并增强对方向和高度不准确性的鲁棒性。此外,引入了一种用于本地化的置信度标准 - 心电图异常检测:通过自监督学习推进临床诊断
通过利用正常心电图数据集进行自我监督的异常检测,该研究提出了一种新的心电图异常检测方法,结合遮蔽和恢复技术以及多尺度交叉注意模块,实现了对心脏异常的精确检测和定位,从而显著提高了现有模型的性能。
- MM-Gaussian:基于高斯函数的三维多模态融合在无界场景中的定位和重建
在无界场景中进行定位和制图的 MM-Gaussian 多模态融合系统利用 LiDAR 和相机提供的几何结构信息解决了仅依靠视觉解决方案时遇到的深度不准确性问题,并利用 3D 高斯点云实现逼真的渲染效果。
- Detect2Interact: 图像问答中物体关键字段的定位与交互
本研究提出了一种名为 “Detect2Interact” 的高级方法,通过细粒度的物体可视关键领域检测来解决传统系统在图像内准确映射物体以生成细致和准确空间感知响应方面面临的挑战。使用段落任意模型 (SAM) 生成图像中物体的详细空间地图, - 面对它们自己:基于 LLM 的两阶段策略通过日志定位配置错误
可配置软件系统中利用日志定位配置错误的方法,基于大型语言模型和日志进行了实证研究和验证,提出了一种基于日志的两阶段策略,设计了相应的工具进行辅助定位和分析,通过在 Hadoop 上的评估验证了方法的效率和准确性,并通过实际案例研究验证了方法 - SceneGraphLoc: 跨模态粗略基于 3D 场景图的视觉定位
这篇论文介绍了一个新问题,即在由 3D 场景图数据库表示的多模式参考地图中定位输入图像。通过学习场景图中每个节点的固定大小嵌入,该方法提供了一种轻量级且高效的替代方法,以有效地匹配输入查询图像中可见的对象实例,实现了超出其他跨模态方法的性能 - CVPR全几何全景定位
介绍了一种利用 2D-3D 线条几何的轻量级而准确的定位方法,通过全景视图来定位,避免了训练或手工制作视觉描述符,提取线条关系中的主导方向和非平行线条的交点等以表达独特而紧凑的空间上下文,其结果表示与传统视觉描述符方法相比,处理时间和内存上 - 融合对象掩码引导的图像伪造分析的融合 Transformer
OMG-Fuser 是一种基于融合变压器网络的图像伪造检测和定位方法,它可以从不同的法证信号中提取信息,并利用目标信息进行分析,相比以往的方法,它可以操作任意数量的法证信号并考虑图像语义关系。
- 声音事件检测和定位与距离估计
本文提出了一种新方法,即将声音事件检测与定位拓展到包含距离估计的三维声音事件检测、定位,并通过多任务和单任务两种方法研究了在 AM 型和双耳型 STARSS23 背景下的实现方案,并探究了与距离估计相关的损失函数,实验结果表明,在不降低声音 - CVPRDiaLoc:一个迭代式的具身对话定位方法
DiaLoc 是一种新的基于对话的定位框架,通过迭代细化位置预测来可视化每次对话后的当前姿态,有效地利用多模态数据进行分步定位。DiaLoc 在单次拍摄(ValUnseen 准确率 + 7.08%)和多次拍摄(ValUnseen 准确率 + - CVPRWWW: 通过神经元概念的解释统一框架解释神经网络的什么、在哪里和为什么
利用自适应选择概念发现,结合神经元激活图和 Shapley 值生成定位概念图和热图,并利用热图相似性估计预测不确定性,提供了统一的解决方案,以更好解释神经网络的决策。
- 多旋翼飞行器定位的主动推进噪声整形
通过主动控制和塑造由旋翼产生的飞行器推进噪声,该论文提出了基于自噪声的已知环境中的定位的神经网络体系结构,通过与学习时间变化的旋翼相位调制相结合的训练,实现了准确和稳健的定位。
- DAGnosis: 使用结构局部识别数据不一致
使用有向无环图 (DAGs) 编码训练集的特征概率分布和独立性的方法 (DAGnosis) 能识别和处理数据在部署时的不一致性问题,并解决了数据中心方法在特征具有统计独立性的情况下的子优化问题,同时定位了为何样本会因不一致性而被标记的原因,