- 学习面向位置的隐含神经网络用于真实世界人脸修复
提出了一种名为 IN²(Implicit Neural Inpainting Network)的方法,通过显式建模位置信息来处理现实世界场景中的任意形状人脸图像,包括降采样编码器、邻居混合注意力块和隐式神经金字塔解码器,实验证明该方法在现实 - FlowDA: 无监督领域自适应光流估计框架
该研究引入 FlowDA,一个用于光流估计的无监督域自适应框架,结合了无监督光流估计的概念和技术,提出了基于课程学习的自适应课程权重模块,实验证明 FlowDA 在真实场景下优于现有方法,为光流估计性能的提升提供了新的见解。
- 基于证据的可解释开放领域事实核查与大型语言模型
开放领域可解释性事实核查系统在真实世界场景中验证索赔并为核查决策生成因果解释,表现出色的可靠结果及稳定准确的判决,并提供简洁令人信服的实时解释。
- LocoMuJoCo:一个用于运动仿真学习的全面基准测试
为了推进仿真学习(IL)在运动中的研究,我们提出了一个新的基准,旨在促进 IL 算法的严格评估和比较,包括四足动物、两足动物和肌肉骨骼人类模型等多个环境,提供全面的数据集以进行困难程度的评估, 并为每个任务提供手工指标和最新算法。
- 基于条件扩散模型的高质量 HDR 去鬼影
从低动态范围(LDR)图像中恢复高动态范围(HDR)图像是通过现有的深度神经网络(DNN)技术实现的。但是,基于 DNN 的方法在 LDR 图像存在饱和度和大动作时仍然会生成虚影伪影,这限制了其在真实世界场景中的应用潜力。为了解决这个挑战, - 表征准确性和公平性权衡帕累托边界的理论方法
理论分析中,通过确定所有不可被其他分类器支配的最优 Pareto 分类器集合来确定准确性 - 公平性权衡帕累托前沿的形状,该研究旨在解决准确性 - 公平性权衡的长期挑战,并提供一个理论框架。
- 朝向真实世界的测试期适应:带有平衡归一化的三网络自训练
通过在测试阶段将源域模型适应到测试数据,测试时间适应旨在应对未见过的损坏并证明其成功。然而,在更具挑战性的真实场景下,这些尝试可能会失败。现有的作品主要考虑了非独立同分布的真实世界测试时间适应和持续的域漂移。在这项工作中,我们首先用全局类别 - 一次对话胜过千言万语的推荐:综合对话推荐系统调查
综述了以结构化方式总结的综合对话推荐系统方法,并对真实应用场景中的对话推荐系统数据集和评估方法进行了详细分析,提出了目前综合对话推荐系统所面临的挑战和可能的未来趋势。
- ICCV重访场景文本识别:基于数据的视角
本文从数据导向的角度重新评估场景文字识别(STR)。作者重新审视了 STR 中六个常用基准,并观察到性能饱和的趋势,通过 13 个代表性模型,只有 2.91%的基准图像不能被准确识别。然而,作者认为这主要是由于常见基准的挑战程度较低,从而掩 - DeSRA:检测和删除基于 GAN 的真实世界超分辨率模型的伪影
本文通过分析 GAN 生成的超分辨率图像在测试数据中产生的众多不良伪影和失真的原因和特征,设计了一种新方法 DeSRA 来检测和消除这些不良伪影和失真,提高了超分辨率模型在实际应用中的表现。
- 高保真模拟开放世界中的新颖性适应多智能体规划
本文旨在探索如何让自主智能系统在真实世界的环境中适应、解决并执行计划,针对其中出现的未知问题和新的情况需要进行建模和检测。
- ACL在真实环境下评估 ASTE 模型:一个多领域多样化方面情感三元组抽取数据集
本文介绍了一个命名为 DMASTE 的数据集,该数据集被手动注释以更好地适应真实世界的情况,并包括比现有数据集更多的方面类型和领域。 我们对 DMASTE 进行了大量实验,结果表明 DMASTE 是一个更具挑战性的 ASTE 数据集。
- CN-Celeb-AV:一个用于人物识别的多类型音视频数据集
本文介绍了一种名为 CN-Celeb-AV 的多类型音视频人物识别数据集,其中包含了超过 420K 个视频片段,比起传统数据集更符合真实世界场景,适用于 AVPR 领域的研究。
- 基于优化的人脸图像质量评估技术的改进
该研究旨在提高现有面部图像质量评估(FIQA)技术的性能与稳定性以适用于真实世界场景。采用基于监督质量标签优化的方法,结合特定的面部识别模型(ArcFace,ElasticFace,CurricularFace),在五个常用基准测试数据集上 - aUToLights:一种稳健的多摄像机交通信号灯检测与跟踪系统
本文介绍了多摄像头的交通信号灯感知管道,使用 YOLOv5 探测器进行边界框回归和交通信号灯分类,并融合高清语义地图信息和隐马尔可夫模型的状态过滤来提高鲁棒性,在现实世界的复杂场景下实现了优异的表现。
- IJCAI在全景野外场景下的视频对象分割
本文提出了半监督视频对象分割的概念,给出了 Panoptic Wild Scenes 的大型基准和基线方法,建立了 VIPOSeg 数据集,提出了基于当下流行的 Transformer 的网格架构的强基线方法 PAOT,在 VIPOSeg - 异构知识图谱上基于 GNN 的实体对齐:新数据集和新方法的反思
本论文通过构建与真实场景相似的高度异质化知识图谱 (HHKG),并对现有的图神经网络 (GNNs) 实体对齐方法进行实验,发现 GNNs 不能充分利用 HKKG 的结构信息,导致性能不佳。最后,介绍一种简单有效的方法 (Simple-HHE - FedBEVT: 道路交通系统中的联邦学习鸟瞰感知变换器
本文提出了一种用于自动驾驶的联邦变压器学习方法 FedBEVT,其使用多视角相机数据来学习模型,并解决了数据异构问题,如多传感器姿态和感知系统中不同的传感器数量。在实际场景中的性能优于基线方案,展示了该方法在提高鸟瞰图感知中的潜力。
- 利用不完美因果结构模型实现反事实公正
本研究提出一种新的极小极大博弈论模型,可以在不强制使用结构因果模型的情况下,实现准确的结果和实现反事实公正的决策,以此减轻模型预测与实际世界(观测数据)以及反事实世界(即如果个体属于其他敏感群体)中的歧视,并且我们还在多个实际数据集上进行实 - 等变 MuZero
本文提出一种改进 MuZero 强化学习算法的方法,通过将环境的对称性显式地纳入其世界模型架构,既提高了数据效率,又提高了泛化能力,并在 MiniPacman 和 Chaser 上进行测试。