- 强化学习对决策者的支持性研究:整合评估模型的初步研究
利用现代强化学习探索综合评估模型 (IAM) 可以更加原则地探究解决方案,为政策制定和对其后果和局限性的理解提供有效的探索。
- TMT-VIS: 视频实例分割的层级感知多数据集联合训练
通过提供额外的分类信息,我们提出了一种名为 TMT-VIS 的模型,用于视频实例分割的多数据集联合训练,该模型在四个流行且具有挑战性的基准测试中均显著改善了基线解决方案,并创下了新的最先进记录。
- MVHumanNet: 一个大规模的多视图日常穿着人类捕捉数据集
该研究论文介绍了一个名为 MVHumanNet 的大规模 3D 人体数据集,其中包含 4500 个人的多视角行动序列,以及 9000 个日常服装、60000 个运动序列和 6.45 亿帧的详细注释,通过该数据集的使用,进行了多个 2D 和 - 结构化、复杂且时间完整的时态事件预测
基于新的结果模型,该研究提出了 SCTc-TE 的简单且全自动的构建方法,并在此基础上开发了一种名为 LoGo 的新型模型,用于 SCTc-TE 的预测,通过构建两个大规模数据集以及广泛的评估实验证明了其优越性。
- SynFundus:生成数百万样本和多种疾病标注的合成眼底图像数据集
在医学影像领域,由于隐私限制导致大规模数据集的稀缺性成为开发大型医学模型的重要障碍。为解决这个问题,我们引入了 SynFundus-1M,这是一个高质量的合成数据集,包含超过 100 万张视网膜底部图像以及详尽的疾病和病理学注释。SynFu - 大数据时代的数据集精炼
使用课程数据增强方法,在大规模的 ImageNet-1K 和 ImageNet-21K 数据集上实现了最佳准确度,并在准确度上超越了目前的最先进模型。
- 基于概率的语音驱动三维面部动作合成:新的基准、方法和应用
从语音信号中为 3D 面部几何动画创建概率模型的研究,通过大规模数据集和合适的评估指标,展示了多样性和准确性,可生成适应未知说话者风格的 3D 面部运动,并改进下游的视听模型表现。
- 基于最优传输引导的条件评分扩散模型
提出一种基于最优传输引导的条件得分扩散模型 (OTCS),该模型可以处理局部配对或甚至没有配对的数据集,通过设计一种 “兼容性重新采样” 策略,选择与高兼容性的样本数据作为指导,有效地训练条件得分模型,从而在无配对和部分配对设置中实现了出色 - 通过与平滑高质量专家轨迹的对齐实现高效的数据集精炼
本文提出了一种数据集蒸馏的方法,通过集成剪断损失和梯度惩罚来调整专家轨迹参数的变化速率,并提出代表性初始化、均衡内环损失和权重摄动等增强策略,以解决现有方法在训练大型机器学习模型时存在的问题。实验结果表明,该方法在各种规模、大小和分辨率的数 - 大规模数据的高效、有效的多视角子空间聚类
在大规模多视角数据集中,我们提出了一种高效有效的多视角子空间聚类深度框架 (E$^2$LMVSC),通过提取统一的表示来增强聚类性能。
- NuTime: 大规模时间序列预训练的数值多尺度嵌入
这篇论文介绍了一种基于时间序列的自监督模型,通过采用 Transformer 架构和多尺度嵌入模块,在大规模数据集上取得了显著的改进,建立了新的最优实验结果。
- ICCV基于公式驱动的监督学习的语义分割
我们提出了 SegRCDB,这是一种新型的用于语义分割的预训练数据集,它基于公式驱动的监督学习,在没有真实图像或手动语义标签的情况下实现了语义分割的预训练,为大规模数据集的创建和调查提供了可能性。
- 从医学视频中回答与健康相关的问题:数据集与方法
通过使用大规模数据集和视觉答案,本文聚焦于使用医疗视频为公众提供有关健康的视觉答案,并分析了数据集对模型训练和可视特征在提高单模态和多模态方法性能方面的影响。
- A-Eval: 胸腔多器官分割跨数据集评估基准
通过对深度学习在腹部多器官分割中的应用进行研究,本文提出了 A-Eval 方法,利用四个大型公共数据集和一个 BTCV 数据集构建了 A-Eval 基准测试。通过对各种不同数据使用场景进行评估,我们强调了有效数据使用对提高模型泛化能力的重要 - ICCVEgoPCA:一种新的用于理解视觉主观性手 - 物体交互的框架
通过探测、策划和适应(EgoPCA)的方式,该论文重新思考并提出了一种新的基础框架,旨在推动主体与物体间的自我互动识别;论文提供了全面的预训练集、平衡测试集和新的基准,并通过训练微调的策略实现了与 Ego-HOI 基准的最新性能,同时构建了 - 数据集量化
用于训练任何神经网络架构的新的数据集压缩方法 (DQ) 能够通过压缩大规模数据集生成精简小数据集,实现了无损模型训练的最新压缩比,可用于视觉任务和语言任务。
- RPG-Palm:掌纹识别的逼真伪数据生成
该论文提出了一种新的逼真伪掌纹生成(RPG)模型,用来合成具有大量身份特征的掌纹,进而提升掌纹识别的性能,并且证明其在真实数据不充足时仍然优于当前最先进的方法。
- SCA-PVNet:自我与交叉注意力的点云和多视图聚合用于 3D 对象检索
我们提出了基于点云和多视角图像的自我和交叉注意力聚合方法 (SCA-PVNet) 来进行三维目标检索,通过设计两种特征聚合模块(即 In-Modality Aggregation Module (IMAM) 和 Cross-Modality - 基于多尺度时空骨架匹配的一次性动作识别
本文提出一种新的一次性骨架动作识别技术,通过多尺度空间和时间特征匹配处理骨架动作识别,实现了优秀、卓越的一次性骨架动作识别,并在诸多大规模数据集上,持续超越当前最先进的方法。
- 用于离线组合强化学习的机器人操作数据集
本研究提供了四个来自 CompoSuite 的离线强化学习数据集,用于解决机器人操作的组合任务,评估表明组合方法比非组合方法优越,但当前方法仍无法提取任务的组合结构以推广到看不见的任务,需要进一步研究。