- ECCV鲁棒性非刚性形状匹配的隐式场监督
本文提出了一种基于自编码器框架的方法,学习固定模板上的连续形状变形场,通过表面内和表面外的点监督变形场,并通过一种新的有符号距离正则化方法,实现了非刚性形状对齐,在清洁水密网格上训练,在面临噪声,异常值和自遮挡等挑战时表现出色,为现实世界数 - CVPR基于类别感知对比半监督学习
提出了一种名为 CCSSL 的半监督学习方法,采用类别聚类和图像对比改善模型的伪标签质量和在真实世界中的鲁棒性,并通过目标重新加权实现了干净标签学习和减少噪声标签学习。实验表明其在多个数据集上均取得了显著的性能提升。
- ACL真实数据上的无字幕语音翻译
我们提出了一种无需文本数据即可构建的无文本语音到语音翻译系统,采用了自监督单元级别的语音标准化技术来优化多说话者语音的模型,仅使用了 10 分钟的数据训练该技术,可在 VoxPopuli S2ST 数据集上实现平均 3.2 BLEU 分数的 - AAAI人工智能交互在选择性预测中的作用
研究了选择性预测系统中人机交互的影响,通过不同类型的信息传递比较两种消息传递的组合方式对人类判断准确率的影响,发现必须仔细考虑如何将推迟决策传达给人类才能更好地设计选择性预测系统,同时使用人机交互框架仔细评估人工智能团队的总体准确性。
- ICLR强化学习中的在线策略模型误差
本文提出了一种结合模型和真实数据的方法来弥补模型误差和偏差所带来的不足,通过将真实数据作为时间相关的学习模型的修正项以维持数据生成能力并减少预测误差,从而改进了现有的基于模型的方法。在 MuJoCo 和 PyBullet 基准测试上的实验结 - 通过基于试验评分的数据自适应加权结合现实世界和随机对照试验数据
通过控制混合对照组干扰和第一类错误,我们提出了一种新的临床试验分析方法,使用所选的真实世界病人,加权来自电子健康记录的治疗组病人,以增加试验效力。
- ICLR利用极端事件条件生成时空天气模式
本文提出了一种基于 GAN 的方法,可以在检测到极端天气事件的条件下生成时空气象模式。该模型可以与自定义 GAN 架构相结合,并在真实的表面辐射和纬向风数据的实验中得到应用。
- CVPRS2R-DepthNet: 学习可迁移的深度特定结构表示
通过对人类推断场景三维几何形状的能力及其空间结构在理解场景深度中的关键作用的研究,我们提出了第一种探索深度特定的结构表示学习的方法,其能够捕捉深度预测的基本特征并忽略无关的风格信息。我们的 S2R-DepthNet 可以在没有预先训练的真实 - ICML深度不平衡回归研究
文章提出了一种新的方法 Deep Imbalanced Regression(DIR)来处理实际中连续性 target 的不均衡数据分布问题,通过分布平滑技术,使用已有数据来校准标签和学习特征的分布,同时构建了大规模的实际任务实验数据集,并 - 野外三维车辆重建的神经隐式建模修复
本文提出了一种基于神经隐式模型的 3D 物体重建方法,通过深度编码器作为初始形状潜码的鲁棒优化器,利用规则化测试时间优化潜码,深度鉴别器作为高维形状先验,并使用新颖的课程学习策略,从而更好地捕捉全局细节,在模糊的基准数据集上表现出色,展示了 - DenoiSpeech:基于帧级噪声建模的去噪语音合成
本研究提出了 DenoiSpeech 系统,它可以处理具有高噪声变异的实际世界噪声,使用细粒度的帧级噪声建模噪声条件模块与 TTS 模型共同训练,实验结果表明,DenoiSpeech 在真实环境数据上的性能要优于之前提出的两种方法 0.31 - 重新思考 ASR 中的评估:我们的模型足够健壮吗?
研究探讨了在自动语音识别中单一基准测试数据的数字推动是否具有价值,发现噪声增强有助于提高模型的泛化性能,并且使用大量的基准测试数据可以良好地代表真实世界中的性能表现,最终得出在广泛使用的数据集上训练单一声学模型可达到竞争性的研究和现实世界基 - MEANTIME:用多时间戳嵌入混合注意机制进行顺序推荐
提出 MEANTIME,采用多种类型的时间嵌入和完全利用多样性的注意力结构,超越了当前最先进的连续推荐方法,通过广泛的消融研究来分析模型如何从多样的位置信息中获益。
- ICMLAI 驾驶奥林匹克赛事中以模仿学习方法训练真实世界和仿真数据相结合
本文描述了赢得 AI 驾驶奥林匹克比赛车道追踪挑战的方法,该方法通过混合模拟和真实数据上的模仿学习实现。
- CVPR利用高斯过程进行图像去雨的 Syn2Real 迁移学习
本文介绍了一种基于高斯过程的半监督学习框架,可使用综合数据集进行学习并利用未标记的现实世界图像实现更好的泛化结果,证明了该方法的有效性。
- 随机试验与实际数据的弹性整合分析用于治疗多样性估计
我们提出了一种基于测试的弹性综合分析方法,用于随机试验和真实世界数据的估计治疗效果的异质性。
- CVPR闭环问题:用双回归网络实现单幅图像超分辨率
该研究提出了一种双重回归方案,通过从低分辨率图像到高分辨率图像的映射和从低分辨率图像估计唯一的下采样核并重建低分辨率图像的过程来降低可能函数的空间,从而提高图像超分辨率任务中的性能。
- 变点检测算法评估
本文介绍了一个用于评估现有的变点检测算法在现实世界数据上表现的数据集,并提出了应用于多个基础真实数据的基准研究,旨在成为新变点检测算法的试验场。
- KDDSAFE: 相似度感知的多模式假新闻检测
本文提出一种基于多模态信息和神经网络的相似性感知的假新闻检测方法(SAFE),通过提取新闻的文本和视觉特征以及对其之间的关系进行联合学习和预测,有效识别假新闻。实验结果证明了该方法在大规模实际数据集上的有效性。
- ICCVSENSE: 一种用于场景流估计的共享编码器网络
介绍了一种名为 SENSE 的全局场景流的紧凑网络,通过共享编码器特征在光流、立体视角差、遮挡与语义分割四个紧密相关任务中进行估计,并利用多任务学习得到更好的特征表示,可处理部分标记数据。该模型在多个光流基准测试上取得了最先进的结果,并且具