- ACL不消除而是综合:对混合专家进行事后控制以应对自然语言理解中的快捷转移
通过对混合专家的悲观聚合,可以增强模型对快捷方式分布变化的鲁棒性。
- 反应性模型修正:通过条件偏差抑制缓解对任务相关特征的危害
深度神经网络在训练数据中容易学习和依赖偶然相关性,但是对高风险应用而言,这可能导致致命后果。我们提出了一种基于模型知识和可解释人工智能(XAI)的反应性方法来减少模型对有害特征的依赖。通过引入反应性,我们演示了在 P-ClArC(Proje - 通过特征解缠缚来缓解对抗鲁棒性中的特征差距
我们提出了一种基于潜在特征解缠的方法,以明确建模并进一步消除导致特征差异的潜在特征,从而提高深度神经网络对抗样本的鲁棒性。实证评估表明,我们的方法超越了现有的对抗微调方法和对抗训练基线。
- 基于深度学习分割网络复杂潜空间的鲁棒特征选择对托甲综合征的诊断
利用深度学习模型的潜在特征进行特征选择,对特定心脏病进行诊断,证明这种方法在 TTS 和 STEMI 的不同诊断上具有潜在独特性。
- 基于原则的分层深度学习方法用于联合图像压缩和分类
通过三步联合学习策略,将编码器引导为具有紧凑性、有辨识力的特征,以低频带宽要求传递高分类准确性的特征信息,并通过基于熵的量化和 / 或手动截断实现可调的比特率。
- 双潜在状态学习方法:利用区域网络相似性进行 QoS 预测
提出了一种新颖的深度学习框架 R2SL,通过提取两种不同的区域网络潜在状态 (城市网络潜在状态和自治系统网络潜在状态),利用共同区域的汇总数据而不是个体对象数据来预测网络服务质量 (QoS),并使用增强的 Huber 损失函数来解决常见的标 - 识别干预外推的表示
本文考虑识别性表示学习和干预外推任务,发现可识别表示能有效预测干预对结果的影响,即使干预呈非线性关系。通过结合干预外推任务和可识别表示学习,我们提出了一种新的方法 Rep4Ex,通过对观察特征进行非线性外推,成功预测未观察干预的效应。
- 神经网络潜在表征中的对抗性机器学习
通过信息论的背景将此问题转化为信息失真和鲁棒性的两个新度量,我们对分布式深度神经网络(DNNs)对抗行为的鲁棒性进行了严格分析,并通过考虑 6 种不同的 DNN 架构、6 种不同的分布式 DNN 方法和对 ImageNet-1K 数据集进行 - 语言模型作为反事实解释模块:ChatGPT 能否解释黑盒文本分类器?
使用大型语言模型作为反事实解释模块,通过提取潜在特征生成可解释黑盒文本分类器的决策的对策性解释。通过评估多个具体度的框架变体,显示了在不同设置下这些模型的性能差异,其中一种基于两步特征提取的变体在大多数情况下表现最好。该流程可用于自动解释系 - 编码摘要化:将文档汇总为连续向量空间,用于法律案例检索
我们通过引入深度神经网络的短语评分框架,将文档进行编码并汇总为连续向量空间的方法来解决法律案件检索任务,同时探索了词汇特征和神经网络生成的潜在特征的结合带来的好处。实验证明,词汇特征和神经网络生成的潜在特征相互补充,提高了检索系统的性能。此 - 基于潜在类别识别的长尾图像分类 LCReg
通过深度学习技术,本研究提出了一种新的长尾图像识别方法,通过学习共享的隐含特征来改进特征表征,并在这些特征上进行语义数据增强,以提高训练样本的多样性,显著改善了基线模型。
- 旅行之词:Transformer 的几何解释
通过引入新颖的几何视角,本文揭示了 Transformer 操作的内部机制,主要贡献在于说明层归一化将潜在特征限制在一个超球面上,从而使得注意力能够塑造单词在这个表面上的语义表示。通过对经过预训练的 124M 参数的 GPT-2 模型进行探 - INSURE:一种基于信息理论的解缠纠化域泛化模型
本文提出了一种基于信息论思想的 INSURE 模型,旨在通过对潜在特征进行明确解耦来获取足够和紧凑的类相关特征,以实现对未见目标域的泛化。该模型在四个广泛使用的 DG 基准数据集上的实验证明了其优越性,并且实证表明领域特定的类相关特征对于领 - 基于条件不变性的表示学习,解构细胞异质性
本文提出了一种新颖的方法,利用领域变化来学习表现出有条件对不想要的多变性或干扰的不变表示。
- 纯谱图嵌入:重新解释图卷积,用于 Top-N 推荐
本文探讨了使用图卷积在协作过滤领域中的优势,并介绍了利用特征向量进行推荐的方法,从而避免了传统梯度下降训练过程。在三个真实世界数据集上获得更高的性能。
- CVPR自适应图卷积子空间聚类
通过使用 AGCSC 方法,我们采用了图卷积技术来同时开发特征提取方法和系数矩阵限制,并且我们的算法中的图卷积算子是迭代和自适应更新的,聚合特征表示适用于子空间聚类,并且系数矩阵能更准确地揭示原始数据集的子空间结构。
- 解缠(非)可控特征
本文提出一种表示学习算法,该算法可以将隐含特征分解为可控和不可控两个部分,从而提高表示的可解释性并有效学习和规划。通过在三个不同的环境中展示该算法的分解性质,强调了该方法的优势。
- 基于物理嵌入的神经网络车辆模型及其在风险感知自动驾驶中的应用
本文使用全可微分物理模型与深度学习相结合,提出了一种汽车非完整动力学建模方法,相比于普通神经网络模型,本方法有更好的广义泛化性能,使用其提取出的潜在特征,可以准确地描述车胎侧向力,同时,在两个自动驾驶任务中,基于该潜在特征的风险感知模型预测 - GLANCE:全球到本地的、架构中立的基于概念的解释
本论文提出了一种新的双替代可解释性框架,用于解释任何基于 CNN 的图像分类器所做的决策,该框架不仅提取出潜在特征并把它们与已知 “上下文” 特征进行对齐,还形成了语义上有意义的概念,用于提取描述 “感知” 数据生成过程的因果图。
- KDD显著性正则化深度多任务学习
该论文提出了一种新的多任务学习框架,通过补充现有的浅层和深度多任务学习场景的优势,联合学习潜在特征和显式任务关系。同时,通过新的正则化器显式地学习任务关系。理论分析表明,该方法降低了泛化误差,实验表明该方法是有效的、高效的并且合理的。