- LLM 能更好地解决更长的数学应用题吗?
本研究探索了大型语言模型(LLMs)解决长篇数学问题的能力,引入了扩展的小学数学(E-GSM)问题集并提出了新的度量方法,旨在改善 LLMs 在解决这类问题上的表现。研究结果表明,所提出的方法不仅在 E-GSM 上取得了改善,还具有一定的推 - 多中心隐私保护模型训练用于深度学习脑转移自动分割
多中心数据异质性对深度学习脑转移瘤自动分割性能的影响以及渐进转移学习技术(即学习无遗忘)在改善模型的推广能力方面的有效性进行了探讨。
- 基于中心的放松学习对抗成员推断攻击
通过提出一种新的架构适应性训练范式(称为 CRL),我们在保持模型的成员一致性的同时,能够提供隐私保护,并且无需或仅需最小程度地损失模型的泛化能力,从而解决了现有防御方法和理想模型之间在性能和部署成本方面的差距。
- ICLR逻辑约束下的学习,但不满足快速通道
通过引入双变量来解决逻辑连接约束的快捷方式问题,将编码形式化为与模型的原始训练损失兼容的分布损失,实现学习逻辑约束的新框架在模型的普适性和约束满足方面表现出卓越的性能。
- PSC-CPI: 高效且可泛化的多尺度蛋白质序列 - 结构对比用于化合物 - 蛋白相互作用预测
提出了一种新颖的多尺度蛋白质序列 - 结构对比 (CPI) 预测框架 (PSC-CPI),通过在蛋白质序列和结构之间进行内部模态和交叉模态对比,从多个尺度捕捉了蛋白质序列和结构之间的依赖关系,并且具有良好的模型普适性。
- 对于 S 型分类模型的贝叶斯留一交叉验证的梯度流自适应重要性采样
通过梯度流引导的自适应重要性采样变换,稳定了贝叶斯分类模型点状留一个交叉验证(LOO)预测的蒙特卡罗近似,可以利用此方法评估模型的普及性。
- 使用紧凑的内部表示进行无监督领域适应
通过将源领域和目标领域的数据点映射到共享嵌入空间中,训练映射编码器使嵌入空间变得与领域无关,从而使在源领域上训练的分类器能够在目标领域上很好地泛化。为了进一步提高无监督领域适应 (UDA) 的性能,我们提出了一种降低源领域内部分布紧密度的技 - 基于解剖一致的伪模态元学习的领域泛化
深度模型在应用于未知领域时往往存在泛化能力有限的问题,特别是在视网膜血管分割任务中,我们提出了一种基于解剖一致伪模态的元学习方法(MAP),通过学习结构特征来提高模型的泛化能力。我们首先利用特征提取网络生成三个不同的伪模态,这些模态与原始图 - AnyDoor:零射门级目标图像定制
AnyDoor 是一种基于扩散的图像生成器,它能够以和谐的方式将目标对象传送到用户指定的位置。通过使用细节特征来补充身份特征,该模型能够在推理阶段对不同的对象 - 场景组合进行普适化。通过借鉴视频数据集的知识,该方法在现实世界的虚拟试穿和物 - ICCV相似性极值化:零样本昼夜领域自适应
低光条件下影响人类视觉体验并降低模型在下游视觉任务中的性能。本文挑战了更复杂的零样本白天 - 夜晚领域适应情景,通过图像级别和模型级别的相似性最大化、最小化来优化模型具有更好的泛化能力,显著提高了模型适应性。
- 通过数据增强提高图形异常检测模型的泛化能力
本文提出了一种基于数据增强的半监督学习方法 AugAN,用于解决现有半监督图异常检测方法的泛化问题,并进一步提高模型的泛化能力,从而有效检测训练和测试数据中存在的异常。
- 基于局部注意力机制的 SDF 扩散模型用于可控的三维形状生成
提出了一种基于扩散的 3D 形状生成框架,名为局部注意力 SDF 扩散,可通过 2D 草图图像输入建模可信的 3D 形状,实现局部控制性和模型普适性的提高。
- 更好的机器学习工程能力
本文介绍了基于能力的框架,旨在使用机器学习模型行为的细粒度规范来统一现有的机器学习工程支持,并通过初步实验展示了能力对于反映模型通用性的潜力以及将其整合到机器学习工程的挑战和机遇。
- 从表示学习中暂停:分子性质预测
本研究对比了随机森林、MolBERT 和 GROVER 三种基于 Extended-Connectivity Fingerprint、SMILES 字符串和分子图的分子表示学习模型,评估了其在 MoleculeNet 数据集和类阿片类物质数 - 通过数据增强提高图形异常检测模型的泛化性能
提出了用于解决图异常检测中普适性问题的数据增强方法,并验证了其提高 GAD 模型通用性的有效性。
- CXR-FL: 基于深度学习的胸部 X 射线图像分析使用联邦学习
本篇论文提出并评估了一个名为 CXR-FL 的基于深度学习的联邦学习方法,用于医学影像分析,证明了联邦学习有助于保持模型的泛化能力以及深度学习模型对于肺部分割数据更为敏感,且其在分类方面的性能对于联邦学习的参数选择有一定程度的依赖。
- Tailor: 利用语义控制生成和扰动文本
Tailor 是一个基于预训练的 seq2seq 模型和语义表示的、能够生成文本输出并且能够在特征属性控制下改变目标文本的生成系统。通过修改控制代码,该系统能够灵活地实现对数据增强的语义控制,能够有效的改善模型泛化能力,并在多个任务中展现优