- 具分布鲁棒性的不精确神经网络统计验证
为高维自主系统提供行为保证是人工智能安全领域中的一个特别具有挑战性的问题。本文提出了一个基于主动学习、不确定性量化和神经网络验证的新方法,其中的核心是一种称为不精确神经网络的集成技术,它提供了用于引导主动学习的不确定性。通过在多个物理模拟器 - 基于物理驱动的光谱一致的掌纹验证的联邦学习
通过物理驱动的谱一致联邦学习方法,解决了手掌纹验证领域中不同波段验证的困难和数据隐私问题,并在有限的训练数据下展现出了强大的性能。
- 深度神经网络验证的认证证明检查器
本文介绍了一种基于 Imandra 的 DNN 验证证明检查器的新实现,该实现通过使用 Imandra 的两个关键功能:无限精度实数算术和形式化验证基础设施来提高数字稳定性和验证性能,并在实现验证正确性属性和性能优化方面继续开展工作。
- 可再生数据到文本生成:带验证和纠正提示
本文提出了一个多步骤方法,通过引入验证、纠错和生成阶段,超越传统的一次性生成方法,实现了从结构化输入生成文本描述,名为数据到文本生成。我们的方法使用一个验证步骤,将观察结果转换成特殊的错误指示提示,指导模型修复错误并改进输出,通过实验结果展 - 用 GPU 加速的机器学习模型验证在电力系统中的应用
本文介绍了用于检验大规模机器学习模型的计算工具,重点解决了其应用到电力系统问题时出现的困难;作者提出了一种方法可同时验证多个验证问题,并使用双重化程序将线性等式和不等式约束编码到检验问题中。
- 您的价值函数是控制障碍函数:使用控制理论验证学习策略
本篇研究提出了将控制理论中的验证方法应用于学习价值函数中的 RL 问题,由此得出关于安全维护的价值函数与控制障碍函数之间联系的原始定理,并提出用于安全控制任务验证价值函数的新指标和实用的实现细节。此外,该研究作品还利用控制理论中的验证方法实 - DelBugV: Delta-Debugging 神经网络验证器
DelBugV 是一种模块化和可扩展的新型工具,采用自动化的 Delta 调试技术来简化调试 DNN 验证器,从而极大地简化了修复故障验证器的任务。
- 使用策略蒸馏的深度强化学习模型反事实解释框架
该论文提出一种新颖的反事实解释框架,以解释黑盒 DRL 的决策,并在自动驾驶系统和 Atari Pong 游戏领域进行了多项实验。分析表明,所提出的框架为深层 DRL 的各种决策生成了可行且有意义的解释。
- 寻求可验证性:解释很少能够在 AI 辅助的决策判断中提供补充性的表现
本文聚焦 AI 辅助决策,在 AI 解释人类决策过程中频繁失败的背景下,提出了一个简单的理论,即解释只有在允许决策者验证其正确性时才有用,我们讨论了更有效的 AI 决策解释方法和人工智能 - 人类决策的协作。
- Vera: 通用常识语句可信度估计模型
本研究使用 Vera 模型对~7M 的通用常识语句进行训练,并结合三个训练目标,成功实现了通用常识判别。经验证,该模型可用于过滤 ChatGPT 等模型产生的错误常识语句,且具有较强的泛化能力。
- ACLQCRI 参加 SemEval-2023 任务 3:使用多语言模型检测新闻体裁、框架和说服技巧
此研究旨在解决在线新闻传播中存在的虚假信息扩散的问题,使用 SemEval-2023 Task 3 来分析和验证新闻文章中的写作技巧,以影响读者的观点,研究结果表明我们的系统在 27 个测试中位列前三。
- 评估自主系统的可信度
研究探讨了自主系统的信任度和相关标准,并提出了一个可用于自主系统的信任度评估框架的大纲。
- 神经网络的增量验证
该研究提出了一种基于新颖理论、数据结构和算法设计的增量和完全的 DNN 验证框架,旨在提高完全验证器在更新后的 DNN 上的验证效率。将其实现在名为 IVAN 的工具中,可以在 MNIST 和 CIFAR10 分类器上实现总体几何平均加速比 - 生物识别中的非定向近碰撞攻击
这篇论文研究了基于概率建模的生物识别技术中的安全问题,探讨了模板大小、数据库大小和阈值对识别精度的影响,揭示了生物识别技术的两种攻击方式,并提出了选择参数的建议。
- KDD深度神经网络上的模型无关可达性分析
本文提出一种模型无关的验证框架 DeepAgn,通过 reachability analysis,可以解决计算给定输入的最大安全半径和生成地面实际的例子等多个已知鲁棒性问题,尤其适用于处理包括 FNN 和 RNN 在内的复杂深层神经网络的验 - 神经网络验证的高效符号推理
本文提出一种新的神经网络可验证的符号推理框架,名为符号推理,其利用了符号域和二次关系来解决网络在面临不同情景下的可验证问题。该框架提供了一种新的可验证信号和视角,可为神经网络的验证问题带来新的理论启示和实用工具。
- WiCE:维基百科索赔的真实世界蕴含关系
提出了 WiCE 文本蕴涵数据集,该数据集围绕在文本中验证声明,建立在维基百科的现实声明和证据基础之上,并通过 GPT-3 将假设分解成子句单元,每个单元都与源文档中的证据句子的一个子集标记。通过这个数据集,我们展示了真实声明涉及具有挑战性 - AAAI神经网络控制系统可达性分析
该论文提出了一种基于 Lipschitzian 优化的 NNCS 验证框架,通过证明闭环 NNCS 的 Lipschitz 连续性并消除循环来实现,相比最先进的验证方法,DeepNNC 在各种 NNC 的效率和准确性方面表现更加优秀,并通过 - 神经网络验证的优化符号化区间传播
本文提出了一种新的基于符号区间传播和变量分裂的分支定界求解器 DPNeurifyFV,该方法采用新的启发式算法来选择区间变量,以改善变量相关性问题,在结合其他改进措施的情况下,可以显著提高深度学习神经网络验证的效率,并在空中碰撞避免网络 A - QEBVerif: 神经网络量化误差边界验证
本研究提出了一种深度神经网络的量化误差边界验证方法,其中包括了一个差分可达性分析和一个基于混合整数线性规划的验证方法。通过我们的实验,我们证明了该方法的有效性和高效性。