- 利用质心三元损失学习嵌入向量进行机器抓取中的物体识别
基于基础模型的对象识别模型训练中,采用质心三元组损失的方法,实现了高准确率和灵活的输入尺寸,同时在需要细粒度检测的 HOPE 数据集上表现优于相关方法。
- CIGMO: 在深度生成框架中的分类不变表示
本文提出了一种名为 CIGMO 的新型深度生成模型,可以从图像数据中学习表示类别、形状和视图等因素。通过实验证明,该模型可以有效地发现物体形状的类别,即使视角差异很大,并且比以前的方法更好地完成了诸如单次物体识别和形状 - 视图解缠的任务。
- MM利用软计算方法进行多光谱卫星数据分类
该研究提出了基于格子密度的聚类技术和规则归纳机器学习算法,应用于卫星图像的目标识别和分类,经过多个合成和基准数据集验证。
- Stubborn: 室内物体导航的强基线
论文提出了一种在室内环境中导航至目标物体的驱动方式,克服了在先前状态下最先进的主要失败模式:探索不足,物体识别不准确和由于制图不精确而使代理程序被困。该方法在探索策略、物体识别和障碍物识别方面提出了三个解决方案。
- 半监督学习在自动驾驶中的重要目标识别
本文提出了一种基于二元分类、关系推理和半监督学习的重要物体识别方法,可用于智能车辆在复杂动态环境下的安全导航,并在公开数据集上得到验证。
- 从零开始的可解释代理通信(伴随着一种通用的视觉处理器的出现)
该研究证实了深度神经网络在自我训练过程中的无监督紧急通讯协议在真实情况下是可行的,能够顺利地识别对象,而且还能作为通用视觉特征。
- MM在边缘协作的跨相机视频分析
本文介绍了基于 CONVINCE 的视频监控系统,该系统通过视觉数据间的协同分析来减少计算成本、可视化带宽并提高目标识别的准确性,实现了约 91%的准确性,仅传输了大约 25%的所有记录帧。
- 基于数据的暗场景恢复闪光摄影
本研究使用消费级相机,通过结合传统几何理解和数据驱动技术,提出一种新的方法,实现了在拐角处定位和识别目标物体;该方法还能够用于在新视点生成被遮挡的场景,并能够通过分析信息分布,精确定位和识别超出拐角范围的物体。
- 通过中间奖励实现目标导向的视觉问题生成:问那些难答的问题
本文提出一种深度增强学习框架,通过三种新的中间奖励来鼓励产生精简的问题,旨在解决图像问题中提出智能、目标导向的问题的挑战,同时在 GuessWhat?! 数据集上评估了该模型,结果显示相应的问题有助于在图片中识别特定的物体,并提高了成功率。
- 基于搜索的多目标感知与定位
本文介绍了一种名为 PERCH 的算法,它通过产生可能性场景,寻找最佳的传感器数据解释,解决了多物体识别和定位任务中常见的遮挡问题,并在实际 RGB-D 测试数据上验证了其优越性。