- 探索数据集偏差对数据集提炼的影响
利用数据集正规化技术 (Dataset Distillation, DD) 生成小规模的合成数据集,探究数据集偏倚对 DD 性能的影响并提出应对方法,实验证明原始数据集中的偏倚显著影响合成数据集的性能,突出了在 DD 过程中识别和减轻偏倚的 - DragAPart: 学习用于关节物体的部分级动作先验
DragAPart 是一种基于图像和一组拖动操作输入的方法,可以生成一个物体在新状态下的新图像,与拖动操作相匹配。与以前侧重于重新定位物体的工作不同,DragAPart 预测部分级别的互动,例如打开和关闭抽屉。通过将预训练的图像生成器用新的 - WHAC: 世界凝视的人类与摄像机
利用摄像头视频准确地估计人体和摄像头在世界坐标系中的轨迹是一个既希望实现又具有挑战性和没有确切解的问题。该研究旨在通过充分利用世界、人体和摄像头之间的协同作用,共同恢复富有表现力的参数化人体模型(即 SMPL-X)和相应的摄像头姿势,基于两 - 改进数据集精炼的跨架构泛化
使用模型池方法进行数据蒸馏,结合知识蒸馏技术进行测试,从而创造出小规模合成数据集,在性能上表现优于现有方法。
- 基于生物力学模型和合成训练数据的视频中的三维运动学估计
提出了一种基于生物力学的新型网络,利用两个输入视图直接输出三维运动学,通过合成数据集 ODAH 进行训练,实验证明该方法在多个数据集上超过了现有先进方法,为提升基于视频的人体动作捕捉提供了有前景的方向。
- ALLaVA: 利用 GPT4V 合成的数据为轻量级视觉 - 语言模型开发
利用 GPT-4V 生成图像的详细标题、复杂的推理指令和详细答案,通过合成数据集,我们训练了 ALLaVA 模型,该模型在 12 个基准测试中取得了竞争性的性能,展示了在构建更高效的 LVLMs 中采用高质量数据的可行性。
- InstaGen: 通过合成数据集训练以增强目标检测
通过在扩展类别或提高检测性能方面训练基于扩散模型生成的合成数据集,我们在本文中引入了一种新的范例来增强目标检测器的能力。具体而言,我们将实例级别的定位引导器集成到预训练的生成扩散模型中,使其具备定位生成图像中的任意实例的能力。该定位引导器通 - 组分布稳健数据集蒸馏及风险最小化
通过结合聚类和风险度量的最小化算法,实现数据集精炼,具备对子群体的有效泛化和稳健性,为解决合成数据集在面对低人口密度地区样本时表现优秀的问题提供了理论依据和数值实验验证。
- ACL对话人工智能中克服单调常识推理的 ConvoSense
通过使用 GPT 编译了一个新的合成数据集 ConvoSense,在对话语境中进行常识推理,具有更大的上下文新颖性、更多的推理数量和推理所传达的详细信息丰富,使得针对对话的生成式常识模型在产生合理且具有高新颖性推理时优于之前的数据集训练的模 - 无关深度的单幅图像去雾
提出了一种基于合成数据集和全局洗牌策略的解决方案,用于改进单图像去雾问题的深度学习训练方法,并介绍了一个基于卷积跳跃连接模块的改进网络结构,该模块能够以较低的计算成本实现更好的性能。
- 关于图神经网络和特征增强策略在社交网络分类中的能力
本研究对四种图神经网络架构及五种节点人工特征进行分析,应用于分类任务,并比较它们在不同隐藏层维度下的性能。结果表明,高计算能力的 GNN 架构与信息丰富的人工特征对于性能表现起到平衡重要作用。
- 身份证和旅行文件的合成数据集
本研究提出了一个新的合成身份证和旅行证件数据集(SIDTD),该数据集旨在帮助培训和评估伪造身份证件检测系统。通过在该数据集上训练先进模型并与较大但私有的数据集进行比较,有助于推动身份证件验证任务在图像分析领域取得进展。
- 推广单视角三维形状检索方法解决遮挡和未见物体问题
该研究使用单视角三维形状检索,通过系统性评估考察了目标 3D 形状数据库中的物体遮挡、未见过的 3D 形状数据以及输入图像中的未见过的物体对性能的影响,并提出了合成数据集生成流程。实验结果表明,通过在具有遮挡的合成数据集上进行预训练,然后在 - 无人机深度和障碍物分割数据集 DDOS
为了解决真实世界航空数据集的稀缺性问题,以及针对薄物体在航空视图中的检测和分割带来的关键问题,我们提出了一个新颖的合成数据集,专为航空视图中的深度和语义分割任务而设计。利用照片逼真的渲染技术,我们的数据集为使用合成监督训练方案训练模型提供了 - SkyScenes: 用于航空场景理解的合成数据集
使用从无人机 (UAV) 角度捕获的繁密注释的航拍图像,我们创建了一个综合性的合成数据集 SkyScenes,以全面展示在不同布局(城市和农村地图)、天气条件、时间、俯仰角和海拔高度上的多样性,具有相应的语义、实例和深度注释。通过我们在 S - SimMining-3D:基于高度感知的复杂矿山环境中的三维物体检测:新颖数据集和基于 ROS 的自动标注管道
这篇论文介绍了一种用于挖掘行业中 3D 目标检测的合成数据集,该数据集通过 ROS 接口实现自动注释,通过高度和高度变化增强来提高准确性和可靠性。
- HumanReg: 人体点云的自监督非刚性配准
该研究提出了一种新的注册框架 HumanReg,通过学习两个人体点云之间的非刚性变换,引入了身体先验来有效处理这种类型的点云。与大多数现有的需要昂贵的点对点流注释的监督注册技术不同,HumanReg 可以以自我监督的方式进行训练,借助一组新 - 扩散反射图:光照和反射的单图像随机逆渲染
本研究利用 Diffusion Reflectance Map Network (DRMNet) 方法,从单张图片中恢复出物体的反射频谱和全频谱的光照频谱,通过学习逆向图像形成的扩散模型,展现了在合成数据集上具有最先进准确度的同时,也能在真 - 为云光学厚度估计创建和基准测试一个合成数据集
通过在 Earth observation(EO)环境中使用机器学习(ML)方法,并提出一种新的合成数据集,该研究旨在改善遥感领域中云光学厚度(COT)估计的可靠性。
- 基于频域的数据集精炼
本文提出了一种新颖的参数化方法,利用频域对大型原始数据集进行数据集提炼,通过频谱变换优化数据实例的频率表示,以在有限的预算内操作并更好地保留原始数据集的信息。此外,通过与现有方法的正交兼容性,验证了该方法在不同基准数据集的评估场景中持续改善