- ACLFreeCtrl: 使用前馈层构建控制中心进行无学习的可控文本生成
提出了一个名为 FreeCtrl 的无需学习的方法,该方法通过动态调整选择的前馈神经网络向量的权重来控制大型语言模型的输出,实现对生成内容的属性关键词的输出概率的控制,从而解决了学习成本和模型性能之间的困境。
- UDUC: 基于不确定性驱动的学习鲁棒控制方法
通过引入基于不确定性驱动的鲁棒控制损失 (UDUC) 作为概率集合模型的替代目标,并受对比学习的启发,我们分析了 UDUC 损失的鲁棒性,并评估其在具有显著环境不匹配的挑战性实际强化学习基准 (RWRL) 上的性能。
- AAAISocialCVAE: 通过交互条件化潜变量预测行人轨迹
本文提出了一种应用社交条件变分自动编码器(SocialCVAE)来预测行人轨迹的方法,该方法利用条件变分自动编码器(CVAE)来探索人类运动决策中的行为不确定性,通过使用基于能量的相互作用模型生成交互能量图,提高了行人轨迹预测的准确性。
- JUMP: 一种用于神经影像的联合多模态注册流程的最小预处理方法
利用最少的预处理提供无偏差和稳健的多模式神经影像注册,通过单一结构化框架联合处理不同图像模式,使用先进的基于学习的技术实现快速推论,适用于大规模和 / 或多队列数据集,目前可处理结构 MRI、静息状态 fMRI 和淀粉样 PET 图像,通过 - OptFlow:无需监督的快速基于优化的场景流估计
OptFlow 是一种快速优化型场景流估计方法,不依赖学习或任何标注数据,可在流行的自动驾驶基准测试中实现场景流估计的最先进性能,同时提供最快的推理时间。
- 逆问题的学习重建方法:样本误差估计
在重建和正则化逆问题领域,学习驱动和数据驱动技术近来成为主要关注点。本研究描述了一个通用框架,使我们能够在统计学习的背景下解释许多这些技术,重点研究学习重建方法的泛化性质,并特别进行样本误差分析。
- MedPrompt:跨模态提示多任务医学影像翻译
跨模态医学图像翻译是合成临床诊断中缺失模态数据的必要任务。本研究提出了 MedPrompt,一种多任务框架,可以高效地翻译不同模态。通过引入自适应提示块、提示提取块和提示融合块,我们能够有效地编码跨模态提示。通过集成 Transformer - 一次性局部到局部配准的三维 - 三维对应关系学习
本文提出了一种基于 Optimal Transport layer 和 outlier bins 的 OPRNet 框架,能够以一次迭代的方式实现学习型 partial-to-partial registration,这可以在降低网络复杂度 - 学习三维形状的连续测地卷积
通过引入局部参考框架和连续卷积核,本文提出了一种神经网络框架,可以从原始网格中学习特征,并在非刚性形状匹配和人体部位分割两项任务中取得了优异的结果。
- 深度动态模型用于学习灵巧操作
本文介绍了一种在线规划深度动力学模型的方法,通过这种方法,使用少量真实世界的数据即可进行柔性接触的灵巧操作技能的有效学习,并成功应用于 24 个自由度类人手上。
- CVPR深入探究反向组合算法
该论文提出了一种现代化的密集图像对齐算法 —— 反向组合算法,通过结合数据驱动的先验知识,采用一种鲁棒的方式优化了来自多个元件的算法,并在多个 3D 刚性运动估计任务中取得了较好的表现。