- IJCAIPommerman 多智能体训练:课程学习与基于人口自我对弈的方法
该研究介绍了一个使用课程学习和基于群体的自我对弈相结合的系统,用于训练多智能体系统玩 Pommerman,并解决了稀疏奖励和合适匹配机制的两个挑战性问题。实验结果表明,我们训练的智能体可以在不需要盟友间通信的情况下胜过顶尖的学习智能体。
- AAAI精确至关重要:精确感知的弱监督语义分割集成
ORANDNet 是一种针对弱监督语义分割的新型集成方法,利用两个不同分类器的类激活图和课程学习,提高了伪掩模的精确性并减轻了噪声,从而显著提高了分割性能。基于此方法的扩展同样适用于其他高级弱监督语义分割模型,表明 ORANDNet 具有作 - 基于质量驱动数据选择的课程学习
通过利用图像文字相互关系和模型困惑度评估选择数据的品质,本研究提出了一种利用两个属性在二维空间选择数据的数据选择方法。研究结果表明,相比于使用完整数据集,在五种常见能力上得到了显著提升,可以构建不同品质的多阶段子集以促进课程学习。
- 利用课程学习增强时空分位数预测:经验教训
使用创新的课程学习范式,从空间、时间和分位数角度分别针对性地处理三种形式的课程学习,并结合堆叠融合模块,提高了复杂时空问题的性能和学习效率。通过广泛的实证评估,展示了该框架的有效性,并通过详尽的剖析研究探讨了课程学习对提高时空数据学习效率的 - ICML在神经网络中倾斜彩票的机会:过参数化和课程表的相互作用
通过分析,我们研究了课程学习和超参数化在在线学习环境中的相互作用,结果显示,过度参数化可以简化问题,但可能限制了课程学习的效果,从而为深度学习中课程学习的无效性提供了理论解释。
- 课程定向优化策略:扩散和一致性模型
该论文介绍了一种基于课程学习的新颖增强版 Direct Preference Optimization(DPO)方法,用于文本到图像生成,在三个基准测试中胜过了其他方法,包括文本对齐、美学和人类首选项等方面。
- ICCVEfficientTrain++:高效视觉主干训练的广义课程学习
通过使用更简单的数据对形成更难样式的模型进行培训,我们将课程学习的思想进行了一般化。我们通过引入傅立叶光谱的裁剪操作和数据增强的强度调制,设计出一种简单而高效的培训方法 EfficientTrain++,它减少了各种流行模型在 ImageN - SpeechVerse: 一个大规模可推广的音频语言模型
通过 SpeechVerse 多任务训练和课程学习框架,将预训练的语音和文本基础模型结合,使用连续潜在表示对模型进行指令微调,实现在各种自然语言指令下在多样的语音处理任务上实现最优的零样本性能。经过广泛的基准测试,我们的 SpeechVer - 战略数据排序:通过课程学习提升大型语言模型性能
通过课程学习的数据中心培训策略,根据数据的不同指标进行排序可以提高大型语言模型的性能,而无需增加模型大小或数据集容量,从而解决大型语言模型培训中的可扩展性挑战。
- AdaKD:使用自适应损失加权的 ASR 模型动态知识蒸馏
本文提出了一种自适应知识蒸馏技术,通过课程学习的启发,以实例级别自适应地加权损失,并实验证明该方法优于传统的知识蒸馏方法和现有的实例级别损失函数。
- 具有损失递减感知的异构图神经网络的课程学习
在处理异构信息网络方面,异构图神经网络(HGNN)通过课程学习策略和基于相对损失的训练进程趋势来提高学习效率与泛化能力,并通过采样策略解决训练不平衡问题。
- 通过逻辑感知的课程调优改进知识图谱上的复杂推理
在本文中,我们提出了一个基于大型语言模型(LLMs)的知识图谱上的复杂逻辑推理模式,包括一个基于课程的逻辑感知调优框架,名为 LACT。通过二叉树分解来增强 LLMs 的推理能力,并设计了一个简单而灵活的逻辑感知课程学习框架,以解决不同类型 - CVPR弱监督参照图像分割的课程点提示
通过引用图像分割技术(RIS),本文提出了一种创新框架 Point PrompTing(PPT),并结合了多源课程学习策略来解决以往弱监督技术中面临的噪声和过度关注问题,实验证明 PPT 在 RefCOCO、RefCOCO + 和 G-Re - 深度学习方法在噪声医学视频数据处理中的应用
细胞计数在细胞在连续流动且边界难以进行视觉检测时成为一个具有挑战性的问题。为了解决这个问题,我们使用课程学习和多视角预测技术分别修改了训练和决策过程。
- ObjBlur:一种具有渐进式目标级模糊的课程学习方法,用于改进布局到图像生成
ObjBlur 是一种新的课程学习方法,用于改善布局到图像生成模型,通过渐进式目标级模糊使训练稳定且提高生成图像的质量,在多个运行中显示出显著的性能改进、稳定的训练、平稳收敛和减少的差异方面具有新的最先进结果。
- CrimeAlarm:面向细粒度犯罪预测的密集意图动态
本文提出了一种细粒度的顺序犯罪预测框架 CrimeAlarm,该框架采用了一种受课程学习启发的新型互相蒸馏策略,旨在捕捉全面的犯罪意图,通过训练模型以提高犯罪事件预测的精度和准确性。
- 从图像集合中学习具有状态、姿势和视点变化的物体不变表示
在学习物体的识别和检索的对象表示中,我们将更常用的其他不变性增加了一个不变性 - 状态不变性 - 通过状态不变性,我们的目标是设计一个具有类似能力的神经架构,以捕捉到物体形状结构变化时的鲁棒性。为了实现这一目标,我们提出了一个新颖的数据集, - 使用课程学习和奖励工程的近端策略优化解决实际优化问题
我们通过课程学习原则和细致的奖励工程,使用近端策略优化(PPO)智能体对一个现实世界中的高吞吐量垃圾分类设施进行训练,以达到优化操作安全、优化处理量和最小化资源使用的竞争目标,并将其逐渐应用于更加复杂的环境动力学中,同时完善奖励机制,从而提 - WavLLM:面向健壮和适应性语音大语言模型的研究
WavLLM 是一种鲁棒且自适应的具有双编码器和提示感知的语音大型语言模型,通过两阶段课程学习方法来优化,以在各种语境下进行听觉任务的泛化和执行复杂任务。
- ICLR多彩剪纸:用课程学习增强图像数据增强
本文研究了数据增强方法在深度学习模型训练中的应用,提出了基于课程学习的图像数据增强方法 colorful cutout,并通过实验结果展示了其在图像数据增强中的效果,为了提高研究的可复现性,我们公开发布了源代码。