- CVPR复杂道路场景的参数化俯视图表示
本文提出了一种基于顶视图表示的路面布局参数化模型,通过构建此模型及使用深度神经网络、模拟数据等方法,可以有效地推断路面场景并实现定量分析。
- NIPS使用 3D 卷积神经网络和后验 CRF 在医学图像中进行语义分割的端到端方法
本文提出一种名为后验概率 CRF 的全新的端到端训练方法,该方法将 3D 全连接 CRF 应用于 CNN 的后验概率中,并一起优化 CNN 和 CRF,实验结果表明我们的方法在白质高信号区分割上表现优于 CNN,后处理 CRF 和不同的端到 - 面向多标签分类的上下文感知胶囊网络
我们提出了一种改进的胶囊网络架构,包括新的路由权重初始化技术、利用条件随机场利用主要胶囊激活之间的语义关系的改进 CapsNet 设计和基于 Cholesky 变换的相关模块,为多标签分类任务提供了更好的可扩展性。
- MM使用任务特定嵌入的社区问答联合多任务学习
本研究使用深度神经网络 (DNNs) 对社区问答中的问题进行语义表示,并将其与条件随机场 (CRF) 模型相结合,以实现多任务联合学习,包括查找相关问题和相关回答,最终实现在问题 - 评论线程中查找良好回答的目标。该方法显著提高了评估指标, - ECCV多样化上色的结构一致性与可控性
该研究开发了一种基于条件随机场的变分自编码器公式,能够在考虑结构一致性的同时实现多样性,并引入可控机制来融合来自各种来源的外部约束,从而在 LFW、LSUN-Church 和 ILSVRC-2015 数据集上获得更多多样化和全局一致性的着色 - 逐步擦除、逐一收集:一种弱监督的时间动作检测器
本文提出一种基于分类器的弱监督时间行为检测方法,使用条件随机场对时序定位输出进行精细化处理,并在 THUMOS'14 和 ActivityNet 数据集上取得了较好的检测效果。
- COLING使用条件随机场(CRFs)进行乌尔都语词语分割
本文研究提出了一种基于条件随机场序列建模器的乌尔都语词分割系统,使用正字法、语言学和形态学特征,该模型能够自动学习预测单词边界和子单词边界,在手动注释的语料库上实现了 0.97 的单词边界识别 F1 分数和 0.85 的子单词边界识别 F1 - 即时重建:使用单视图深度预测器作为先验信息为稀疏地图进行修补
该研究介绍了一种实时图像引导的 inpainting 方法,以有任意尺度和稀疏度的地图作为输入,使用单视角深度预测网络作为虚拟深度传感器生成一个完全密集的深度图像。
- 室内场景实时渐进式 3D 语义分割
本文提出了一种高效而健壮的技术,实现了 3D 室内场景的即时密集语义分割和重建,该方法基于高效的超体素聚类方法和来自结构和对象线索的高阶约束的条件随机场,无需预先计算即可进行渐进式密集语义分割。通过对 SceneNN 和 ScanNet 数 - AAAI基于生成对抗网络和概率图模型的高光谱图像分类
本文介绍了一种使用生成式对抗网络与概率图模型相集成的方法来进行高光谱图像分类,试图提高分类精度并在数据利用率上更有效地使用大量未标注数据,实验结果表明,这种方法在使用少量数据进行训练时,获得了令人鼓舞的分类准确度。
- 基于 CRF-Attentive 结构网络的对话行为识别
本研究提出了一种使用丰富的条件随机场 (CRF) 结构依赖性、采用分层语义推理和记忆机制的话语行为识别方法,并使用扩展的结构化注意力网络考虑上下文的话语和相应的对话行为,实验结果显示该方法表现优于其他最先进的解决方案。
- SqueezeSeg: 3D LiDAR 点云实时道路物体分割的卷积神经网络与循环条件随机场
本论文针对 3D 激光雷达点云的道路物体语义分割问题,提出了一种基于 CNN 和 CRF 的端到端方法 SqueezeSeg,通过将经过转换处理的点云作为输入,直接输出一个点输出标签图,并通过 CRF 进行细化,最后通过聚类算法得到实例级别 - 使用带 CRF 的分层编码器进行对话行为序列标注
本文提出了一种基于 Hierarchical RNN、双向 LSTM 和 CRF 的层次化的对话行为(Dialogue Act)识别模型,该模型将每个话语按其对应的 Dialogue Act 进行分类,并在 Switchboard 和 Me - ICCV纹理和结构集成的 ScatterNet 混合深度学习网络 (TS-SHDL) 用于脑物质分割
本文提出了一种基于纹理和血管特征的混合深度学习网络(TS-SHDL),用于从 MR 影像中自动分割脑物质,并通过条件随机场(CRF)实现所需的分割。在合成的 McGill Brain Web 和真实的 3D MRI 扫描的 MRBrainS - CVPR多人姿态估计与语义部位分割
该研究提出了一种基于全卷积神经网络和条件随机场的联合框架,旨在同步解决人体姿态估计和语义部位分割问题,并在 PASCAL VOC 数据集上进行了广泛实验,显示该算法在这两个任务上均优于竞争方法。
- ICCV视觉问答的结构型注意力
本文提出通过构建基于网格结构条件随机场上的多变量分布的视觉注意力模型来有效地编码复杂的跨区域关系,并将迭代推理算法转换成端到端的神经网络层,该模型在 3 个数据集上的实验评估结果表明,它超过了新发布的 CLEVR 数据集的最佳基线模型 9. - 使用时空深度特征的视频显着性目标检测
本文提出了一种在视频中探测显著对象的方法,该方法利用局部和全局上下文,采用了一些新的特征以及方法来计算焦点,并在公开数据集上取得了显著的效果,同时也应用于视频实体分割任务中,表现出了优异的性能。
- 人脸聚类:表征与成对约束
该研究提出了一种基于 ResNet 的面部表示方法,并利用 Conditional Pairwise Clustering(ConPaC),将面部图像聚类,得出的实验结果表明 ConPaC 的性能优异,可以自动选择聚类数量,并保留面部图像之 - 面部动作单元强度估计的深度结构化学习
本文提出一种基于条件随机场的 Copula CNN 深度学习方法,用于模型化面部表情中的多变量有序变量的结构,并从中提取出复杂的特征表达。通过在新引进的均衡批量迭代训练算法和深度 CNN 特征编码层中联合优化这些 CLIQUES,显著提高了 - 基于卷积神经网络和条件随机场的时空面部表情识别
本文提出了一种基于深度卷积神经网络和条件随机场模型的视频面部表情识别方法,该模型从面部图像中提取空间信息和视频帧之间的时间关系,并在三个公共数据库上进行了实验证明,该模型在跨数据库实验中表现出色,并在主体独立实验中获得与现有模型相当的成果。