AI 论文速递

最新

模型连接组：一种数据高效语言模型的代际方法
本研究探讨了如何将生物神经网络的代际进化与个体学习结合，以改善人工神经网络的训练过程。提出了一种模型连接组的框架，使人工网络能够在语言处理任务中表现出更优的性能或与人类行为和脑数据更好的对齐，表明此方法在低数据环境下的学习效率显著提高。
PDF3 days ago
利用行动关系结构进行综合学习与规划
本研究解决了现有规划方法在与学习系统结合时搜索算法适应性不足的问题。提出了一种新型的部分空间搜索，通过利用PDDL行动模式中的动作关系结构，提供了更细粒度的搜索视图，并能更早剔除不良动作。实验结果表明，新规划器LazyLifted在最新基准
PDF3 days ago
硬件友好的设备端训练的扰动高效零阶优化
本研究针对零阶优化在硬件平台（如FPGA和ASIC）上面临的高高斯随机数生成需求这一挑战，提出了PeZO框架，设计了随机数重用策略并引入了适应性缩放方法，以降低硬件资源的需求和功耗。实验结果显示，PeZO显著减少了随机数生成所需的逻辑单元和
PDF3 days ago
机器学习中的缓解与检测的密码学视角
本研究探讨了机器学习算法在推理过程中对抗性输入的检测与缓解之间的理论关系，定义了“检测防御”（DbD）和“缓解防御”（DbM）。主要发现是，对于生成学习任务，二者存在明显差异，某些情况下只能通过缓解实现防御，且在缓解阶段使用的样本显著少于初
PDF3 days ago
UD-English-CHILDES：儿童语言互动的金银通用依赖树集合资源
本研究解决了现有儿童语言数据资源中缺乏统一标注的问题，提出了UD-English-CHILDES作为第一个基于CHILDES数据的官方通用依赖树库。该数据集经过验证，并提供了超过100万个银标准句，极大地促进了计算和语言学研究的资源统一性。
PDF3 days ago
数字双胞胎的阴暗面：对人工智能驱动水资源预测的对抗攻击
本研究针对数字双胞胎在水资源预测中的应用，揭示了其在面对对抗攻击时的脆弱性。提出了一种基于学习自动机和随机学习自动机的方法，动态调整扰动以加大对抗攻击的隐蔽性，实验结果显示，这一方法显著提高了预测误差，凸显了人工智能驱动的数字双胞胎在网络安
PDF3 days ago
mrCAD：计算机辅助设计的多模态细化
本文解决了生成AI在进行内容修改时的不足，通过构建mrCAD数据集，提供了一个多模态指令的沟通游戏。研究发现，现有先进的视觉语言模型在处理生成指令时表现优于细化指令，这为分析和建模细化的多模态语言奠定了基础。
PDF3 days ago
第一阶逆向优化的深度物理先验方法
该研究解决了逆向设计优化中存在的从观测解决方案推断系统参数的难题，特别是在许多系统缺乏明确数学表征的情况下。提出了一种名为深度物理先验（DPP）的新方法，通过预训练的辅助神经算子实现了基于梯度的第一阶逆向优化，确保可靠且有意义的解决方案。这
PDF3 days ago
智能水安全：人工智能与区块链增强的数字双胞胎
本研究解决了农村地区水分配系统在实时监测、网络攻击脆弱性和数据处理不可靠等方面的挑战。通过结合LoRaWAN数据采集、机器学习的入侵检测系统以及区块链驱动的数字双胞胎平台，研究提出了一种安全透明的水管理框架。实验结果表明，该系统在保证2秒内
PDF3 days ago
一个生成英语作为第二语言教学活动的平台
本研究针对英语作为外语教学中活动生成的需求，提出了一种基于自然语言处理技术的教育活动生成平台。该平台能够生成各种游戏和语言练习，允许教师在使用前对生成的内容进行审查和编辑，显著提高了教学活动的多样性和实用性。
PDF3 days ago
大语言模型能否学习形式逻辑？一种数据驱动的训练与评估框架
本研究探讨大型语言模型（LLM）的逻辑推理能力，针对传统逻辑证明的训练提供了一种新的数据增强方法。通过合成有效证明和模板转化，研究发现LLM在短证明的推理能力强，但在复杂证明时能力下降，模板转化显著提升了模型的准确性，揭示了其对不同规模模型
PDF3 days ago
跨图像编织上下文：通过聚焦中心视觉链改善视觉-语言模型
本研究解决了视觉-语言模型在处理复杂多图像输入时的性能下降问题。我们提出了一种新颖的聚焦中心视觉链范式，通过聚焦中心数据合成方法生成高质量的数据，构建了一个专为多图像任务设计的大规模数据集VISC-150K。实验结果表明，该方法在不同模型架
PDF3 days ago
随机格上的表征学习
本研究解决了深度神经网络学习的表征不够可解释的问题。提出了将特征视为嵌入数据分布的学习坐标系统的几何视角，采用随机格模型分析其特性。研究结果表明，学习到的特征可以分为上下文、成分和表面特征，提供了对机制可解释性的见解，并指引了未来的研究方向
PDF3 days ago
提示大型语言模型进行代码编辑：挑战与解决方案
本研究解决了开发人员在日常工作流程中与大型语言模型（LLM）进行代码编辑时的具体困难，填补了现有研究的空白。通过对开发人员与一个广泛使用的LLM驱动的代码编辑工具的互动进行多阶段调查，发现了开发人员在使用过程中常常需要重新提示的现象，并提出
PDF3 days ago
基于遵循意识的强化学习的AI换车道推荐系统
本研究解决了半自动驾驶环境中车辆换道推荐的效率问题。提出了一种遵循意识的深度Q网络，该方法考虑了人类驾驶者对推荐行动的部分遵循性，为提升车辆行驶效率提供了新的思路。在CARLA驾驶环境的真实场景中进行评估，显示了显著的效果。
PDF3 days ago
刀锋：用于LLM驱动的算法自动设计与演化的基准套件
本研究解决了当前在LLM驱动的自动算法发现（AAD）领域缺乏标准化基准评估的问题。研究者提出了BLADE框架，以模块化和可扩展的方式，对LLM驱动的AAD方法进行严格的黑箱优化基准测试。通过提供灵活的实验设置和标准化的日志记录，BLADE能
PDF3 days ago
集成流模型
该研究针对传统ODE生成模型在样本质量和训练稳定性方面的不足，提出了一种新的“集成流”方法。该方法直接学习ODE轨迹路径的积分，避免了解析ODE函数的需求，并通过理论证明提升了模型的稳定性和准确性。集成流在多个现有ODE基础模型中表现出更优
PDF3 days ago
时序模型中的因果识别
本研究解决了在含有潜在混杂因素的因果时序图中，因果识别算法的适用性问题。通过提出一个新的界限，作者表明仅根据每个时间步骤的变量数量和任何直接或潜在因果效应的最大时间滞后，就可以确定因果效应的可识别性。这一发现有望简化因果分析在无限时间范围内
PDF3 days ago
用来调节工具代理的模型内部置信度估计的MICE
本研究解决了工具使用代理在执行任务时的置信度校准问题，提出了一种新颖的模型内部置信度估计器（MICE），通过解码语言模型的中间层来评估置信度。研究发现，MICE在工具调用的效率和置信度上显著优于现有基线，具备样本效率高和对新API的零次泛化
PDF3 days ago
LZ惩罚：一种信息论中的自回归语言模型重复惩罚
本研究解决了自回归语言模型中重复问题的缺陷，提出了LZ惩罚以降低重复现象而不损失模型能力。该方法基于LZ77无损压缩算法的编码长度，通过预测-压缩对偶性，LZ惩罚能够使开放源码推理模型在无损能力的情况下采用贪婪解码，并显著降低重复率。
PDF3 days ago