- 重审 “一言一语的企业”:走向可解释和本体论立足的语言模型
通过庞大的语言模型,我们探讨了其相对成功不是符号与亚符号之争的反映,而是利用大规模的逆向语言工程的成功自下而上策略的反映。然而,由于其亚符号本质,这些系统对语言的所有了解总是淹没在无意义的数百万个权重之中,这使得这些系统变得无法解释。此外, - PS-CAD: 基于提示和选择的 CAD 重建中的局部几何引导
通过将几何指导引入重建网络中,我们提出了一种名为 PS-CAD 的模型,它逐步重建 CAD 建模序列,并通过提供几何表面的几何信息和平面提示来改进重建的效果。在 DeepCAD 数据集上,PS-CAD 在所有度量指标上都有明显的改进,减少了 - 组合:用于机器学习的自动二值数据集构建
Assemblage 是一个可扩展的基于云的分布式系统,用于获取高质量的二进制语料库,以训练二进制分析的先进模型。它可以通过爬取、配置和构建 Windows PE 二进制文件来获取高质量的二进制语料库,并支持用户发布数据集的 “recipe - 从密度到几何:YOLOv8 实例分割用于优化结构的逆向工程
YOLOv8-TO 是一种新颖的方法,利用 YOLOv8 实例分割模型将拓扑优化结构逆向工程成可解释的几何参数。通过训练自定义的 YOLOv8 模型,YOLOv8-TO 可以自动检测和重构二进制密度分布中的结构组件,大大优于传统的骨架化方法 - 多模态学习用于 WebAssembly 逆向工程
提出了 WasmRev—— 第一个用于 WebAssembly 反向工程的多模态预训练语言模型,通过自监督学习对大规模的多模态语料库进行预训练,包括源代码、代码文档和编译后的 WebAssembly,而不需要标记的数据。WasmRev 包含 - CAD-SIGNet: 使用逐层草图实例引导的注意力从点云中推理 CAD 语言
给定一个三维扫描的物理对象,CAD-SIGNet 模型通过层间交叉注意力和新的 SGA 模块,能够恢复 CAD 模型的设计历史,并提供多种可能的设计选择,从而实现交互式逆向工程。在公开的 CAD 数据集上进行的实验表明,该方法在完整设计历史 - 研究针对设备端模型的白盒攻击
通过反向工程方法从移动设备应 用程序中彻底提取并逆向编译模型,研究了白盒攻击策略对移动设备模型的攻击效果,发现使用白盒策略能够大大提高攻击成功率并减小攻击干扰,强调了开发人员需要谨慎考虑模型部署策略,使用白盒方法评估移动设备模型的安全性。
- 边缘 GPU 中的 CNN 架构提取
通过进行侧信道分析,探索了神经网络在资源受限环境中的容易被逆向工程攻击的脆弱性,并发现神经网络架构可以通过深度学习的侧信道分析轻易被区分。
- 深度 ReLU 网络的逆向工程:一种基于优化的算法
通过凸优化技术和基于采样的方法,本研究提出了一种重建深度 ReLU 网络的新方法,以最小化重建网络输出与目标模型输出之间的差异为目标函数,并在需要时采用 L1 或 L2 正则化来鼓励稀疏或平滑解,为深度 ReLU 网络的反向工程和神经网络可 - 应用于洗涤剂的人工智能逆向工程:基于拉曼光谱学
通过使用数字化工具和分析技术,例如化学计量学、机器学习、拉曼光谱、近红外光谱和质谱等,我们可以快速评估新产品对环境的潜在毒性,并可以精确鉴定和定量洗涤剂产品的成分,从而节省时间并改善污染物鉴定和污染评估的效率。
- 注意力透镜:一种解释机制注意头信息检索机制的工具
利用学习的注意力头特定转换,Attention Lens 将注意力头的输出转化为词汇标记,揭示了注意力头在语言模型中的高度特殊化角色。
- EMNLPCP-BCS: 由控制流图和伪代码指导的二进制代码摘要
通过使用控制流图和伪代码来导向二进制代码摘要的 CP-BCS 框架,在不同二进制优化级别和计算机体系结构上评估后,结果表明 CP-BCS 在逆向工程方面具有显著的改善和效率提升。
- 自动反向工程:从多视图图像创建计算机辅助设计 (CAD) 模型
计算机辅助设计(CAD)模型生成是一项重要任务,提出了一种利用卷积神经网络、多视角池化和基于转换器的 CAD 序列生成器的网络架构,通过大量的模拟输入图片进行训练和优化,成功地从测试图像数据重建有效的 CAD 模型,并表明该网络的一些能力可 - 符号和语言无关的大型语言模型
通过将成功的自底向上策略应用于符号化环境中,我们提出使用具有符号性、语言不可知性和本体论基础的大型语言模型,以在规模上逆向工程语言,从而解决大型语言模型中的难题。
- 一种可扩展的基于点的数据图表值检测方法
通过使用点建议网络,我们提出了一种可扩展的方法来识别语义点,以便从科学文章中反向工程(提取值),特别是数据图表。我们的模型能够准确检测复杂的条形图中的显著点,并且在合成的图表上也表现出很好的性能。
- 基于 GAN 反演的线性收敛算法用于逆向工程欺骗行为
本文提出了一种基于 GAN 和稀疏恢复的欺骗反向工程框架,为此提供了确定性线性收敛保证,并在多个非线性数据集上展示了该方法的优点。
- 面向可解释和语言无关的 LLMs:大规模语言符号逆向工程
本文讨论了大规模语言模型的局限性和其基于深度神经网络的内在架构所造成的影响,提出了使用符号表示和基于底层反向工程重构语言的方法来弥补这些局限性。
- IJCAILTL 本体中介的时间查询的逆向工程
以正线性时态逻辑 LTL 为例,研究了解决给定答案和非答案的情况下构造查询问题的相关问题,关注于设计合适的查询语言以及决策是否存在特定语言的查询来分离给定答案和非答案的复杂性,同时考虑了纯 LTL 查询和通过 LTL 本体中介的查询。
- 深度学习在变量类型恢复中的应用研究
该研究介绍了 DIRTY 模型,它是一种基于 Transformer 的编码器 - 解码器结构,能够利用反编译器生成的变量数据增加反编译代码的可读性。作者通过 Ghidra 反编译器生成数据集并重新训练 DIRTY 模型,证明了 Ghidr - 从对抗样本的指纹中进行逆向工程的对抗性攻击
通过反向工程将对抗样本归类至代表其算法和参数的类中,进而遏制不良者进行相关攻击。