- DroBoost: 一种智能评分和模型增强方法用于无人机检测
无人机检测是一项具有挑战性的物体检测任务,其可见性条件和图像质量可能不利,由于复杂背景、小的可见物体和难以区分的物体而使检测变得困难。该研究提出了一种基于 YOLOv5 的无人机检测方法,利用实际和合成数据以及基于卡尔曼滤波的追踪器跟踪检测 - 从人工针到真实大量数据集:通过在合成数据上进行微调来改进 LLMs 的检索能力
利用合成数据集对大型语言模型进行微调,显著提高了其在长上下文环境下的信息检索和推理能力。
- CVPR基于主成分聚类的合成数据生成中的语义分割
使用潜在扩散模型生成合成数据集的方法,通过自我关注来实现基于头部信息的语义信息提取,从稳定扩散潜变量中直接获取类别无关的图像分割,并利用文本到像素的交叉关注进行先前生成掩膜的分类,最后通过仅使用稳定扩散输出图像进行掩膜精化步骤的提出。
- 组织病理学中的安全数据共享图像提炼
通过使用深度学习技术和数据集蒸馏方法,我们构建了一个小型合成数据集,其中包含最具信息量的人可读的合成图像,用于进行下游分类模型训练,并获得适用于实际应用的性能表现。
- 基于 SSI 深度的尺度不变单目深度估计
借助 SSI 输入来增强 SI 深度估计的新方法,通过引入一个新的稀疏排序损失,实现 SSI MDE 中高分辨率细节的生成,同时在计算摄影应用中展示了其生成高度详细的 SI 深度图并在多种情境中实现了泛化。
- ACLUICoder: 通过自动反馈对大型语言模型进行微调以生成用户界面代码
通过使用自动生成的合成数据集和自动化工具,我们改进了现有的大型语言模型(LLMs),使其能够生成高质量的用户界面(UI)代码,并通过与其他基准模型的比较证明了我们的方法的有效性。
- UEMM-Air: 无人机目标检测的综合多模态数据集
提出了一种基于 Unreal Engine(UE)的多模态无人机目标检测数据集 UEMM-Air,通过模拟不同无人机飞行场景和目标类型,自动收集来自不同角度、高度的数据,并使用新颖的启发式自动注释算法生成准确的目标检测标签。该数据集包含 2 - SUMIE: 增量实体摘要的合成基准
SUMIE 是一个完全合成的数据集,用于暴露现实世界的增量实体摘要挑战,验证了生成的摘要与段落之间的高质量一致性,该数据集难度高,先进的语言模型在更新摘要时的 F1 得分超过 80.4%。
- ACL利用自动回复分割从无标记文档中合成对话
通过学习对话任务数据的分割而不是使用句子边界的分割方法,我们提出了一种强大的对话合成方法,通过该方法生成的合成数据集在机器和人员评估中表现出优越的质量,同时在 ConvQA 检索系统预训练中使用我们的填充数据,观察到 OR-QuAC 基准测 - AAAI大场景中的多视角人体检测:基于有监督的视角贡献加权
该论文通过开发一种监督式逐视图贡献加权方法改进多视角人员检测,并采用大型合成数据集增强模型的泛化能力,进而通过简单的领域自适应技术进一步提升模型在新的测试场景中的性能,实验证明该方法在跨场景多视角人员检测方面取得了有希望的成果。
- ICMLSelMatch: 通过选择基础初始化和轨迹匹配的部分更新有效扩展数据集蒸馏
SelMatch 是一种新颖的数据集精简方法,通过选择性初始化和轨迹匹配的部分更新,适应不同规模的 IPC,并在 CIFAR-10/100 和 TinyImageNet 数据集上从 5% 到 30% 的子集比率中始终胜过其他选择性筛选和仅精 - 多样化的合成数据中的人体姿态对于航空视角人体检测的作用
我们提出了一个用于多样化合成数据集中人体姿势的框架,该框架利用姿势生成器构造一组新颖的姿势,并使用图像翻译器改变现有合成数据集中的图像以呈现新颖的姿势,同时保持原始风格。通过实验证明,无论合成数据如何被用于训练,以及数据规模如何,利用多样化 - 离线基于模型优化的设计编辑
离线基于模型的优化(MBO)旨在最大化黑箱目标函数,仅使用设计和分数的离线数据集。我们引入一种名为离线模型优化设计编辑(DEMO)的新方法,通过在离线数据集上应用训练好的代理模型的梯度上升来产生一个合成数据集,用于训练条件扩散模型以生成高分 - 通过合成数据生成与机器学习应用推进脑功能近红外光谱成像技术
通过合成数据和应用机器学习模型,本研究提出了一种整合方法,用于推进功能性近红外光谱(fNIRS)神经影像学。通过解决高质量神经影像数据的匮乏问题,该研究利用蒙特卡洛模拟和参数头部模型生成了一个全面的合成数据集,反映了各种条件。我们开发了一个 - ONOT:一个高质量的符合 ICAO 标准的合成头像数据集
现在,最先进的基于人工智能的生成模型是解决收集个人信息(例如面部)数据集中的隐私问题和偏见的可行解决方案。本文介绍了 ONOT,一种专门用于生成符合国际民航组织(ICAO)指南规定的面部图像的高质量合成数据集,具有严格控制和多样性的照片图像 - 建筑构件数据标注的可扩展性:通过合成数据提升立面材料分类
利用在 Google 街景图像上训练的计算机视觉模型可以创建物质登记簿。本文针对手动注释的数据集难以获得且存在类别不平衡的问题,使用 DALL-E 生成的合成数据集对 Swin Transformer 模型进行了微调,并与类似的手动注释数据 - 激励公共大型语言模型为私人设备应用合成数据
通过在公共数据上进行预训练可以改善差分隐私联合学习 (FL) 的性能。本文研究了如何利用在公共数据上训练的大规模语言模型 (LLMs) 来改善与 DP 和 FL 一起训练的设备上语言模型的预训练数据的质量。我们精心设计了 LLM 提示来过滤 - 小语言模型通过医学教科书学习提升的推理能力
Meerkat-7B 是一个具有 70 亿参数的新型医疗人工智能系统,通过使用来自 18 本医学教科书的高品质推理路径和多样的指令跟随数据集进行训练,成功地在七个医学基准测试中取得了出色的准确性,在超过 GPT-3.5 13.1%的同时,还 - GTA-HDR:大规模合成数据集用于 HDR 图像重建
本文介绍了 GTA-HDR,一个大规模的合成高动态范围图像数据集,旨在解决从低动态范围图像准确重建出视觉逼真的 HDR 图像的问题,并证明了该数据集在 HDR 图像重建方法和其他计算机视觉任务上的有效性。
- 探索数据集偏差对数据集提炼的影响
利用数据集正规化技术 (Dataset Distillation, DD) 生成小规模的合成数据集,探究数据集偏倚对 DD 性能的影响并提出应对方法,实验证明原始数据集中的偏倚显著影响合成数据集的性能,突出了在 DD 过程中识别和减轻偏倚的