- PostMark: 大型语言模型的稳健黑盒水印
我们开发了 PostMark,这是一种模块化的事后水印程序,可以在解码过程完成后将一组依赖于输入的词语插入到文本中,而无需访问对数。与现有的水印方法相比,PostMark 对释词攻击更加鲁棒,并通过自动和人工评估来评估其对文本质量的影响,突 - ACL基于标签同步的神经转录器的端到端同时语音翻译
LS-Transducer-SST 是一种用于实时语音转写和同时语音翻译的标签同步神经转导器,通过集成 - 发射机制实现了灵活决策翻译标记的时机,并且能在解码和训练时控制延迟与质量之间的权衡。实验结果表明,LS-Transducer-SST - DMOFC:判别度优化特征压缩
本文研究了特征压缩的亲测和亲特性之间的关系,分析了亲特性的磁盘度量的有效性,并揭示了亲磁度量和原始特征的可区分性之间存在着一种权衡关系。
- PraFFL: 公平联邦学习中的偏好感知方案
PraFFL 是一种 Preference-aware 方案,可以根据每个用户的需求自适应地调整模型以满足其偏好,实验证明 PraFFL 在适应不同用户偏好方面优于其他五个现有的公平联邦学习算法。
- 通过敏感信息中和实现图神经网络中的公平性
通过将公平性便利特性(F3)纳入节点特征或表示中,该研究提出了一种名为 FairSIN 的创新中立化范式,从而在保持高预测准确性的同时显著提高公平性指标。
- CVPR稳健过拟合问题的重要性:FGSM 测试时的敌对净化
我们提出了一种基于深度神经网络的测试时间像素级对抗净化(TPAP)方法,通过对训练和测试数据集上的快速梯度符号方法(FGSM)进行对抗净化,以提高 DNN 对各种未知对抗攻击的防御能力,实验证实我们的方法可以显著改善 DNN 的整体鲁棒泛化 - 数据受限二元分类中平衡公平性与准确性
在处理敏感信息的应用程序中,数据限制可能会对机器学习(ML)分类器的可用数据施加限制,本文提出了一个框架,模拟了在四种实际情景下准确性和公平性之间的折衷,以确定在各种数据限制情况下,贝叶斯分类器的准确性受到的影响是如何的。
- CVPR基于文本的图像编辑的双重可推理对策
我们通过反事实推理的单一图像的基于文本的图像编辑(TBIE)进行研究,因为它是一个精确解决要求的优雅表述:编辑后的图像应保留原始图像的保真度。通过这个表述,我们发现 TBIE 的症结在于现有技术很难在可编辑性和保真度之间取得良好的折衷,主要 - 重新思考对抗训练中的不变性正则化以改善鲁棒性与准确性权衡
通过非对比自监督学习的启发,我们提出了一种称为 AR-AT 的不对称表示正则化对抗训练方法,结合了梯度冲突解决和解决混合分布问题的方法,显著改善了鲁棒性 - 准确性的平衡,并讨论了这些发现与基于知识蒸馏的防御方法之间的相关性。
- 最低特权学习的基本限制
我们提供了机器学习中最小权限原则的第一个形式化定义,证明了在表示与任务之间存在着效用和信息泄露的根本权衡,无论采用何种技术和数据集学习特征映射,都无法同时实现对任务的高效用和避免泄露非任务标签属性的目标。
- 客户协作:具有保证效用 - 隐私权衡改进的灵活差分隐私联邦学习
我们介绍一种新颖的联邦学习框架 FedCEO,通过让客户端相互合作,在模型效用和用户隐私之间取得平衡,实现了严格的隐私保障。我们在服务器上对堆叠的本地模型参数进行高效的张量低秩近似优化,并使用光谱空间灵活截断高频分量,从而有效地恢复被破坏的 - 学会高效:在大型语言模型中构建结构化稀疏性
使用 Learn-To-be-Efficient 算法能够实现大型语言模型的效率提升,通过激活较少神经元来获得更好的稀疏性和性能平衡,取得了较好的结果。
- ACL研究基于知识的对话中的内容规划以导航权衡
通过分析规划内容对于满足特定性和归属性这两个目标之间的权衡,我们在知识驱动的对话生成中设计了一个名为 PLEDGE 的框架,并发现规划机制会对自动评估产生积极影响,但在人类判断方面表现较差,需要进一步研究与校准自动评估指标的关系。
- ICLR保守 - 更新 - 修订:通过对抗训练来解决泛化与稳健性的抉择
对神经网络在标准和对抗环境下学习能力的分层能力进行研究,提出了 CURE 训练框架,通过选择性保留、更新和修订权重来增强网络的学习能力,从而改善鲁棒性和泛化之间的权衡,并且有助于减轻过拟合问题和 “鲁棒过拟合”,为未来研究提供了有价值的见解 - RL-MPCA:一种基于强化学习的推荐系统多阶段计算分配方法
基于强化学习的多阶段计算分配 (RL-MPCA) 方法旨在在计算资源的限制下最大化总商业收益,通过将计算资源分配问题形式化为弱耦合的马尔可夫决策过程问题,并采用基于强化学习的方法解决。实验证明了该方法的有效性。
- 量子模拟随机过程中的准确性与内存优势
在研究中,我们探讨了经典和量子模拟器之间的直接映射,以及量子模型在准确性和存储需求之间的权衡,证明了量子模型可以以更小内存达到相同准确性,或者以相同内存实现更好的准确性,并讨论了该结果对学习任务的影响。
- 面向说话者验证的可扩展基于集成的抵抗对抗攻击方法
自动说话人验证(ASV)容易受到对抗性攻击的影响。为了减轻对抗性噪声的影响,通常采用净化模块作为预处理方法。然而,由于不同的实验设置,这些方法常常难以直接进行比较。本文在一个统一的框架中全面比较了主流的净化技术。我们发现这些方法常常在用户体 - 贝叶斯在线学习用于共识预测
通过在线分类中充分利用现有的分类器和人类专家,研究了模型预测方面不收费,但询问人类专家会产生一定成本的任务。鉴于无法获得准确的真实标签,我们将预测目标定义为所有专家共识投票。鉴于获得完整共识可能成本高,我们提出了一般的在线贝叶斯共识估计框架 - 批量贝叶斯优化用于可重复的实验设计
研究提出了 Batch Thompson Sampling for Replicable Experimental Design (BTS-RED) 框架,包含三个算法,用于解决实验设计中的多个条件同时评估和重复观测噪声大而异方差的问题。三 - MGAS:用于高效和有效的神经网络的多粒度架构搜索
多粒度架构搜索(MGAS)是一个统一框架,旨在全面且高效地探索多粒度搜索空间以发现既有效又高效的神经网络,并在模型性能和模型大小之间取得更好的平衡。