- 线性模块连接的分离
神经网络损失地形的线性模式连接 (或缺乏连接) 是一个有趣的特性,尽管在经验上已经被证实,但还缺乏适当的理论理解。本文通过探讨三个因素(架构、训练策略和底层数据集)对线性模式连接的影响,旨在弥补文献中对当网络展示线性模式连接的系统性研究的不 - 神经形态学仿真设计
通过协同设计算法与架构,分析神经形态计算领域中脉冲神经网络算法和柔性硬件的发展,使用刺猬狩猎模型揭示脉冲算法或架构独立推进该领域所面临的挑战,并倡导战略性的追求以推动神经形态计算的发展。
- VeryFL: 一种嵌入区块链的可验证联邦学习框架
我们设计并开发了一个嵌入以太坊网络的基于区块链的联邦学习框架,该框架提出了一种 FL 与区块链结合的代码实践范例,并且与普通的 FL 训练任务兼容。此外,我们还提出了基于区块链的模型所有权认证架构和模型水印技术来保护模型的知识产权。这些机制 - 具图卷积的等变神经运算符学习
我们提出了一种将系数学习方案与残差操作器层结合起来的通用架构,用于在三维欧几里得空间中学习连续函数之间的映射。通过设计,我们的模型可以保证实现 SE (3)- 等变性。从图谱的观点来看,我们的方法可以被解释为在图上(具有无限多个节点的稠密图 - AAAI使用 Transformer 进行计数和算法推广
机器学习中的算法泛化是指以一种能够概括超出数据分布的方式学习生成数据的底层算法。在本研究中,我们分析了在涉及计数时,不论是隐式还是显式所需的算法泛化。我们展示了标准 Transformer 模型基于的架构决策阻碍了此类任务的超出分布性能。特 - OmniLingo: 听说为基础的语言学习
OmniLingo 是一种基于 Interplanetary Filesystem(IPFS)的架构,用于分发监听和口语语言学习应用程序的数据,着重用户对数据的主权。
- 通过 LLMs 重新思考互联网通信:我们有多接近?
通过研究基于大型语言模型的通信架构,本文重新思考了用户在互联网上的直接通信方式,并讨论了技术实现的现实性、未来研究方向以及相关的研究挑战。
- PatchMixer:重新思考网络设计以提升三维点云理解的泛化性能
本文提出了 PatchMixer 架构,通过处理局部补丁和使用 MLP 聚合补丁特征,将 MLP-Mixer 的思想扩展到 3D 点云中,以提高深度网络架构的泛化性能。
- 自扩展神经网络
我们通过自然梯度的方法,动态地扩展神经网络的宽度和深度,以降低训练过程中的损失。对于不确定合适的网络架构尺寸的问题,我们提出了一种自动收缩神经网络的方法。
- 建筑思考
本文考虑了建筑这一术语的演变历史及其在不同阶段引入的定义和相关区分,最终给出涵盖所有三个阶段的建筑定义,并重新思考了从认知建筑到建筑学普遍存在的三个关键问题。
- 移动应用的视觉 Transformer:简要概述
本文研究提出了一些专门为移动设备设计的 ViT 架构,分析了移动应用场景下 ViT 网络所面临的挑战,旨在为未来的研究方向提供基础,并选择最佳的 ViT 视觉架构以适用于移动设备。
- ICML信息瓶颈如何帮助深度学习?
本文提出了深度学习中信息瓶颈的学习理论模型,证明控制信息瓶颈是控制深度学习泛化误差的一种方式,并通过一系列实验展示了信息瓶颈程度与泛化误差的相关性。
- 锐度感知最小化导致低秩特征
Sharpness-aware minimization (SAM) method can reduce feature ranks in various types of neural networks, and the phenomen - 生成型智能体中总结的角色:初步视角
掌握总结能力是生成智能体最基础和不可或缺的能力,在不同场景下展现生成智能体的重要性,为未来的研究提供启示。
- 迈向自由计算架构:Metaverse 中生成虚拟建筑的深度学习综述
该综述评估了使用深度生成模型(DGM)生成三维物体的最新方法,重点关注于建筑形式的虚拟环境中生成建筑的可能性,从离散光子生成、2D 图像生成 3D 模型到条件参数生成等等,同时指出了生成 3D 形状和参数化控制中未被探索的问题,其中数据限制 - AI-in-the-Loop - 基于人机交互界面的 AI 应用影响
研究表明,通过在人工智能架构设计期间使用人机交互,可以轻松创建嵌入式应用程序的轻量级网络架构,从而减少资源需求,提高人工智能开发的效率并实现更可靠和可解释的人工智能应用。
- 序数回归的单模分布
提出了两种新的方法,一种是通过新的架构来实现偏好的单峰分布,另一种则通过利用映射的概念来建立新的损失函数,以促进单峰性,实践结果表明新架构获得了最佳性能,并且新损失项在维持高单峰性的同时具有很强的竞争力。
- 未完成的建筑:人工智能的视角
本文探讨了最近出现的 DALL-E (AI 工具) 在完成古代寺庙和建筑立面的工作中的应用,分析了该领域中尚未发展完全的图形组合构图思想。
- 元界:需求、架构、标准、现状、挑战与展望
本文介绍了 Metaverse 的要求、架构、标准、挑战和解决方案。具体来说,我们提供了 Metaverse 的架构和要求,与 Metaverse 有关的不同标准,并介绍了近期的状况、难题,如 AI 和 Metaverse 的整合、Meta - 回归语言循环模型
使用稍微优化的递归单元、架构、目标和优化算法结合,可以在小数据集和 enwik8 动态评估上建立新的语言建模现有技术水平。