- Hi5:零人工标注的 2D 手部姿态估计
提出一种新的大规模合成手部姿态估计数据集 Hi5 以及一种新的廉价方法来收集高质量合成数据,无需人工注释或验证。在计算机图形学的最新进展下,利用具有多样性性别、肤色和动态环境和摄像机移动的高保真度 3D 手部模型,我们的数据合成流程可以精确 - SubjectDrive:通过主体控制在自动驾驶中扩大生成数据规模
自动驾驶进展依赖于大规模标注数据集。本研究探索生成模型在自动驾驶应用中产生大量自由标注数据的潜力,并提出了 SubjectDrive,这是第一个已证实能够持续改进自动驾驶应用的规模化生成数据生产模型。我们研究了扩大生成数据量对下游感知模型性 - 文本到图像生成中现象空间的倾斜阻碍了泛化
文献对文本到图像生成的研究存在实体与关系合成的问题,缺乏对有效学习实体关系组合的形式理解,以及缺乏明确定义有意义反映问题结构的现象空间,导致对大规模预训练数据期望的泛化。我们假设现象学概括的覆盖范围没有成比例地增加,导致呈现现象的偏斜对泛化 - 联邦数据模型
利用 Federated Data Model (FDM) 方法开发了一种能够在不同地点之间训练准确且注重隐私的人工智能模型的方法,通过扩散模型学习一处地点的数据特征,并生成可用于其他地点的合成数据,成功地应用于医学图像分割任务。
- Swin3D++:3D 室内场景理解的有效多源预训练
在本研究中,我们发现了 3D 室内场景数据集之间的领域差异的主要来源,并提出了基于 Swin3D 的增强架构 Swin3D++,用于对多源 3D 点云进行高效预训练。Swin3D++ 引入了领域特定机制来解决领域差异,并增强了在多源预训练中 - 踩脚自校准:通过自启动扩展 LLM 的尺度自对准
自校准是降低人工标注成本并确保模型能力的有效方法。本文探讨了多次引导自校准对大型语言模型的影响,发现多次引导自校准明显优于单轮引导,通过在上下文学习中保证数据多样性。基于这些发现,提出了 Step-On-Feet Tuning(SOFT)用 - 关于样本高效的离线强化学习:数据多样性,后验采样和更多
我们提出了一个新颖的基于后验采样的离线 RL 算法,该算法在样本效率方面表现出与基于版本空间和经验正则化的算法可比拟的性能,并且具有频率主义的亚优性界限。
- SA-Attack: 通过自我增强改善视觉语言预训练模型的对抗可转移性
通过总结和分析现有研究,我们确定了可以影响 Visual-Language Pre-training 模型上的转移攻击效果的两个因素:跨模态交互和数据多样性。基于这些观察,我们提出了一种新的基于自我增强的转移攻击方法,称为 SA-Attac - NutritionVerse-Real:一项用于饮食摄入估计的开放获取的手工精选 2D 食物场景数据集
营养素摄入估计的重要性和面向机器学习的营养感知的开放倡议在这篇论文中介绍了 NutritionVerse-Real 数据集的创建、分析和可用性。
- AART:多元数据生成的 AI 辅助红队技术用于新 LLM 技术应用
通过自动生成敌对评估数据集,提供了一种新的方法,用于测试大型语言模型在新的下游应用中生成结果的安全性,为了减少人工工作量并能够更早地集成敌对测试,使用 AI 辅助的可重复和可定制的数据生成和增强流程,生成具有高内容特征多样性的评估数据集,结 - D2 剪枝:数据剪枝中的信息传递平衡多样性和难度
通过使用 D2 修剪算法,将数据集表示为无向图,并进行前向和反向消息传递,综合考虑数据的多样性和难度评分来选择 Coreset,该方法在多个视觉和语言数据集上超越了现有最先进方法的 Coreset 选择效果,对于剪枝率高达 70%,使用 D - EMNLP论跨领域数据对德语语言模型的影响
通过使用不同领域的语料库和不同质量的数据,我们训练了一系列的大语言模型,在多个下游任务中,跨领域数据集训练的模型表现优于仅使用高质量数据训练的模型,前者的性能提升高达 4.45%。
- 把握差距:联邦学习拓宽诊断 AI 模型的领域泛化
通过评估训练策略、网络架构、泛化性能、图像发现、数据集大小和数据集多样性对 610,000 例胸部 X 光片的诊断表现进行了评估,并发现在培训数据量方面,本地训练具有更高的域内性能,而合作培训在域外任务方面更具优势。因此,联邦学习可以增强人 - PoSynDA: 多假设姿态合成域适应用于稳健的三维人体姿态估计
通过多假设姿势合成领域适应(PoSynDA)框架,本研究克服了当前 3D 人体姿势估计器在适应新数据集方面的挑战,而无需繁琐的目标域注释。利用扩散中心结构,PoSynDA 模拟了目标域中的 3D 姿势分布,填补了数据多样性缺口。通过结合多假 - 通过联邦学习聚合内在信息以提升脑机接口性能
通过使用分层个性化的联邦学习框架,本研究提出了一种解决脑机接口领域缺乏多样数据的问题的综合方法,能够提升脑电图(EEG)解码的分类性能并充分利用来自不同设备的数据集之间的知识共享,为解决该问题提供了全新的端到端解决方案。
- 重新思考有丝分裂检测:朝着多元化的数据和特征表示
本文提出了一种新的可泛化框架 MitDet,其中考虑了数据和特征多样性的平衡,并使用样本平衡和特征多样性模块以及染色增强模块来实现更好的可泛化性能,进而在多个流行的有限注释数据集中实现了优越的性能。
- 自动扩展扩散的视觉数据集
本研究介绍了一种基于自然语言描述的图像增广方法(ALIA),通过大规模视觉模型与语言模型的结合,自动生成域名描述,实现对样本数据的增广。该算法有效提高了训练数据的多样性,经过测试在细粒度和复杂分类中表现良好。
- 使用 Co-ML 协作式机器学习模型构建家庭
本文介绍了一种基于平板电脑的应用程序 Co-ML,它是一种用于促进学习者之间协作构建机器学习模型的工具。通过这种分布式协作过程,学习者可以共同解决之前工作中忽视的数据设计问题,如数据多样性、类别不平衡和数据质量等。
- 在医学图像分析中提高私有联邦模型的性能
本研究探讨联邦学习在医疗应用中的优势,分析其如何能够解决医疗数据隐私、安全及所有权等挑战,讨论如何通过本地步骤和沟通轮数的调整来进一步提高模型的性能,并提供了理论证明和实验评估的支持。
- ACL为什么话语分析无法概括?关于数据多样性影响的彻底调查
在研究中,我们证明了高资源语言(如英语)在 RST 解析方面的性能并没有变得可靠,而我们使用两个最大的英语 RST 语料库在新闻领域中研究了数据多样性对解析稳定性的影响,结果表明异构训练是获得稳定且可推广模型的关键。同时,我们还提供了模型输