- 面向经直肠超声诊断中临床重要前列腺癌分类的多模态融合与基于原型的特征细化
提出了一个新颖的学习框架,利用多模态经直肠超声引导前列腺癌临床显著性分类,使用两个独立的 3D ResNet-50 从 B 模式和切变波弹性成像 (SWE) 中提取独特特征,同时加入注意模块以精确优化 B 模式特征并聚合两种模态提取的特征。 - SysCaps:复杂系统仿真代理的语言接口
用于仿真建模的学习框架中,使用语言作为接口与底层系统相互联系。我们称系统的语言描述为 “System Caption” 或 “SysCap”。通过使用大型语言模型 (LLMs) 来合成高质量的描述,我们解决了自然语言 SysCaps 与仿真 - 频谱精化:精调用于湍流流动的准确时空神经算子
在这篇论文中,我们提出了一种新的空时傅里叶神经算子 (Spatiotemporal Fourier Neural Operator, SFNO),它学习了 Bochner 空间之间的映射,并引入了一个新的学习框架来解决神经网络训练方面的问题 - CVPRMS-MANO:基于生物力学约束的手势跟踪技术
该研究提出了一种新颖的学习框架,用于视觉手部动力学分析,考虑了手部运动的生理方面。通过将肌肉骨骼系统与可学习的参数手部模型(MANO)集成起来,创建了一种新的模型 MS-MANO,模拟肌肉和肌腱的动力学驱动骨骼系统,对产生的扭矩轨迹施加了生 - CVPR魔法令牌:多模物体重新识别中的选择多样性令牌
通过 EDITOR 框架中的多模态对象 ReID 方法实现对背景的抑制、特征重提取、空间频率令牌选择和特征细化,以产生更具辨别性的特征,从而提高在复杂视觉场景中的对象再识别效果。
- 自然 VLM:利用细粒度自然语言进行支配引导的视觉操作
通过提出一个包含 15 个不同操纵任务的综合基准测试,该论文引入了一个以人类语言指令为基础的家庭助理机器人感知和操作多种 3D 物体的重大挑战,并通过建立一个新的学习框架逐步完成操纵任务。
- 离线逆强化学习:新的解决方案概念和可证明高效算法
逆强化学习(IRL)的目标是从行为示范中恢复专家智能体的奖励函数。本文介绍了一种新的可行奖励集概念,捕捉了离线设置的机会和限制,并分析了其估计的复杂性。通过引入针对该设置固有困难的原始学习框架,我们提出了两种计算和统计高效的算法,IRLO - ICLR无标签数据如何在区分分布之外的检测中发挥作用?
使用无标签数据来规范机器学习模型已经显示出改善检测超出分布数据的安全性和可靠性的潜力。一个新的学习框架 SAL(分割与学习)通过从无标签数据中分离候选离群值然后使用这些候选离群值和标记的正态数据训练离群值分类器,理论上证明了 SAL 能以较 - ACL关于问题重述系统对不同难度问题的鲁棒性研究
该研究论文研究了对话式问答(CQA)中问题重写(QR)的鲁棒性,通过自动分类问题并度量其重写难度,进行人工评估,最终提出一种学习框架以增强 QR 系统对不同难度问题的鲁棒性,并在实验中验证了该框架的性能优于基准模型。
- 神经打包:从视觉感知到强化学习
我们提出了一个新的学习框架来解决 3D 中的运输和装箱问题,其中的技术核心是使用强化学习训练的神经网络,通过 RGBD 感知和识别,机器人运动规划,来实现在目标容器中进行紧密的装箱。
- GROOT: 通过观看游戏视频学习遵循指令
通过引入视频作为指导说明,我们研究了在开放世界环境中构建能够跟随无限指令的控制器的问题,并提出了一种全新的学习框架,该框架能够从游戏视频中学习这种跟随指令的控制器,并生成一个诱导结构化目标空间的视频指令编码器。通过对提出的 Minecraf - KDD图神经网络中消息传递的学习
该研究论文研究了学习图神经网络(GNNs)的信息传播策略的问题。为了克服图神经网络面临的传播策略定义问题,研究人员提出了一种学习传播框架,可以明确学习不同节点和各种类型图的易于理解和个性化的传播策略。通过对多种图基准进行广泛实验,结果表明该 - 数据污染下无监督鲁棒异常检测的迭代方法
减小理论假设与实际训练数据之间的差距,并提出一个学习框架来改进正常性表示,通过识别样本的正常性,并在训练过程中迭代更新样本的重要性权重。还提出了终止条件,受到异常检测目标的启发。通过在多个受污染数据集上进行实验证明,该框架提高了三种典型异常 - 基于神经分类先验的基于物理的角色控制
提出了一种新的学习框架,利用离散信息瓶颈和强化学习来控制基于物理的角色,从而实现显著改善运动质量和多样性。
- 强化逻辑规则学习用于暂态点过程
我们提出了一个能够逐步扩展解释性时间逻辑规则集来解释时间事件发生的框架。利用时间点过程建模和学习框架,规则内容和权重将逐渐优化,直到观察的事件序列的似然性最佳。我们的算法通过在主问题中更新当前规则集的权重,并在子问题中搜索和包含新规则来增加 - MM如何和哪里:减轻神经辐射场中来自稀疏输入的混淆
通过解决 “WHERE” 和 “HOW” 这两个关键性问题,本文提出了一种名为 WaH-NeRF 的学习框架,该框架有效地缓解了由于稀疏输入产生的困惑现象,并通过引入新的采样策略和损失函数来改进以前的 NeRF-S 方法。
- ACL针对大型语言模型的时间推理能力的基准测试和改进
本文介绍了一个全面的测试数据 empreason 来评估大语言模型的时间推理能力,包括三个时间推理水平的问题,并提出了一种基于时间跨度提取和时间敏感的强化学习的新型学习框架来提高其时间推理能力,并证明了其有效性。
- ACL信息提取的易到难学习
本文针对信息提取系统在不同任务之间交互存在困难的问题,提出了一种易于模仿人类学习过程的三阶段联合学习框架,该框架可以使模型更好地学习不同任务之间的知识和提高其泛化能力, 在四项 IE 任务上进行的广泛实验表明了本框架的有效性。
- 不完美环境下的学习:长尾分布和部分标签的多标签分类
本文介绍了一种新颖的任务,即 Partial labeling and Long-Tailed Multi-Label Classification(PLT-MLC),并提出了一种端到端的学习框架 CO-MIC-Balance(Correc - RoSI:从少量关节图像中恢复三维形状内部
该研究提出了一种 RoSI 学习框架,通过多视角和多关节图像从外部恢复 3D 模型的内部结构,并在实验中证实了该方法的泛化能力。