verification | BriefGPT - AI 论文速递

关键词verification

搜索结果 - 127

通过复用经验证的电路增强对语言模型的信任
使用数学和逻辑规范的框架构建的变压器模型经过全面验证，证明了通过插入已验证的任务模块可以提高使用语言模型的可验证性和可信度，减少复杂复合模型的验证工作量，并为语言模型的安全性迈出重要一步。
PDF5 months ago
贝叶斯神经网络中概率鲁棒性的严格验证
我们介绍了两种算法，用于计算贝叶斯神经网络（BNNs）的概率鲁棒性的严格保证。
PDF5 months ago
车辆：弥合神经符号程序验证中的嵌入差距
通过描述一种名为 Vehicle 的工具，该工具用于模块化地验证神经符号程序，本文确定了 '' 嵌入间隙 '' 作为关键问题之一，Vehicle 提供了方便的语言用于指定神经网络的 '' 问题空间 '' 属性，并声明它们与 '' 嵌入空间
PDF6 months ago
多候选猜测解码
大型语言模型在各种自然语言处理任务中展现出令人印象深刻的能力，但是自回归生成文本却非常耗时。提高速度的一个方法是进行猜测性解码，即由快速的草稿模型生成候选分段（一系列令牌），然后由目标模型并行验证。然而，候选标记的接受率受到模型、数据集和解
PDF6 months ago
飞机预测性维护的代理神经网络局部稳定性
通过在工业预测性维护领域中验证基于代理神经网络的模型，本研究探索了将经验法和形式方法结合在一个验证流程中的效果，证明了该流程在减少运行时能力和高维度输入输出空间的代理模型验证方面的有效性。
PDF6 months ago
我是一个奇怪的数据集：语言模型的元语言测试
研究中心引用了元语言自我参照的陈述，以及如何使用大型语言模型（LLMs）来处理这种语言现象的新数据集和验证工具的制作和评估。
PDF6 months ago
使用混合马尔可夫逻辑验证嵌入
我们提出了一种基于概率一阶语言的框架，即混合马尔可夫逻辑网络（HMLNs），用于验证学习得到的表示，并通过编码为混合整数线性规划的方式来进行嵌入的验证。我们使用现有的先进求解器测试了该方法，在图神经网络、深度知识追踪和智能辅导系统中展示了其
PDF7 months ago
可解释的天文图像中的天体检测
基于可解释人工智能的方法，自动检测和定位所捕捉到的天体目标，以验证其是否在智能望远镜产生的深空图像中可见。
PDF8 months ago
基于自然语言模型的最小指导下的自主假设验证
通过探索将 AI 用作自动化研究过程中的工具，我们发现在某些情况下，GPT-4 能够在很少的方法论指导下自主地生成和验证假设，但也存在实现自主且具有人类水平研究能力的挑战，这再次强调了继续探索开发通用和自主的 AI 研究者的需求。
PDF8 months ago
第五届自主系统形式化方法国际研讨会论文集
这篇研究论文总结了第五届自主系统形式方法国际研讨会的会议情况和论文接收结果，展示了该会议作为自主系统的形式建模和验证研究领域的知名出版场所的发展趋势。
PDF8 months ago
连接维度：高维控制器的确定可及性
自动化系统越来越多地使用端到端训练的控制器进行实现。本文提出了一种将详尽的闭环验证与高维控制器相连接的方法。我们的关键见解是，高维控制器的行为可以用不同状态空间区域的几个低维控制器来近似。为了平衡逼近和可验证性，我们利用最新的验证感知知识蒸
PDF8 months ago
EMNLP知识增强的语言模型验证
通过使用独立验证器处理语言模型的输出和知识，本研究提出了一种验证方法，以解决语言模型在生成文本时可能存在的错误。结果表明，该验证器可以有效地识别检索和生成错误，使语言模型能够提供更准确的结果。
PDF8 months ago
大型语言模型通过自我批判自我提升的真的有效吗？
几乎不存在自我评估的大型语言模型能够成功地在迭代模式下验证或自我批评其候选解决方案的推理问题中。该研究评估了一种利用大型语言模型进行计划生成和验证的计划系统，发现自我批评似乎削弱了计划生成的性能，并且系统的可靠性受到 LLM 验证器产生的显
PDF9 months ago
LLM 用于 SoC 安全：范式转变
通过整合大型语言模型（LLMs）到 SoC 安全验证范式中，我们在现有 SoC 安全方案的限制性能、全面性和适应性方面的差距中开辟了新的可能性和挑战，旨在实现更高效、可扩展和可适应的方法。
PDF9 months ago
草案和验证：通过自我推理解码实现无损大语言模型的加速
我们提出了一种新颖的推理方案，自我推测解码，用于加速大型语言模型（LLMs），无需辅助模型。该方法通过两个阶段的过程来实现：草稿和验证。草稿阶段以稍低质量但更快的速度生成草稿标记，通过在草稿期间选择性跳过某些中间层来实现。然后，验证阶段使用
PDF10 months ago
动态和控制模型的通用验证框架与证书合成
我们提供了一个对系统规范进行编码和定义相关证明的通用框架，并提出了一种自动化的方法来形式合成控制器和证明，通过利用神经网络的灵活性提供候选控制和证明函数，同时使用 SMT 求解器提供正确性的正式保证，我们通过开发一个原型软件工具对我们的框架
PDF10 months ago
神经网络软件验证的简化 C 语言基准测试 NeuroCodeBench
该研究论文介绍了一种用于神经网络代码验证的基准测试集 NeuroCodeBench，包含 32 个神经网络和 607 个安全属性，主要研究安全关键系统中的神经网络、验证和软件错误。
PDF10 months ago
具分布鲁棒性的不精确神经网络统计验证
为高维自主系统提供行为保证是人工智能安全领域中的一个特别具有挑战性的问题。本文提出了一个基于主动学习、不确定性量化和神经网络验证的新方法，其中的核心是一种称为不精确神经网络的集成技术，它提供了用于引导主动学习的不确定性。通过在多个物理模拟器
PDF10 months ago
基于物理驱动的光谱一致的掌纹验证的联邦学习
通过物理驱动的谱一致联邦学习方法，解决了手掌纹验证领域中不同波段验证的困难和数据隐私问题，并在有限的训练数据下展现出了强大的性能。
PDFa year ago
深度神经网络验证的认证证明检查器
本文介绍了一种基于 Imandra 的 DNN 验证证明检查器的新实现，该实现通过使用 Imandra 的两个关键功能：无限精度实数算术和形式化验证基础设施来提高数字稳定性和验证性能，并在实现验证正确性属性和性能优化方面继续开展工作。
PDFa year ago