深度神经网络架构中的数值系统:综述
本文对深度神经网络在计算机视觉领域中的重要应用指标进行全面分析,发现能耗与批次大小和架构无关,准确度和推断时间在双曲线关系中,能源约束是最大可实现准确度和模型复杂度的上限,操作次数是推断时间的可靠估计。
May, 2016
研究了深度学习模型性能评估中忽略的数据点特征和难度对测试集准确性的影响,通过用已有的心理测量学方法对人类的反应模式进行建模来估计难度,实验结果发现难度对于测试的结果有重要影响,同时易于学习的实例被模型学得更快。
Feb, 2017
本文综述了目前深度神经网络的应用及其在计算机视觉、语音识别、机器人等AI任务中的高精度表现,同时也阐述了深度神经网络大规模部署所面临的高算力成本和能效问题,并提出了硬件设计、算法优化等多种解决方案以提高能效和算力,最后对比了各种深度神经网络的设计指标并展示了很多发展资源。
Mar, 2017
本文旨在探讨深度神经网络以及与之相关的0-1混合整数线性规划模型,并描述了一种有效的边界紧缩技术,旨在促进其解决方案。文中还介绍了0-1混合整数线性规划模型在特征可视化和对抗样本构建中的可能应用,并针对手写数字识别这一已知的测试用例,报告了关于使用最先进的混合整数线性规划求解器在小规模DNN上的计算性能的初步结果。
Dec, 2017
使用数字序列预测任务评估神经网络模型解决算法问题的能力,并通过数字级和数字级问题的提供的两种数字序列预测问题类型,定义其复杂性和难度。实验结果表明,我们的数字序列预测问题有效地评估了机器学习模型的计算能力,并且没有解决通用斐波那契,算术或几何序列生成问题,表示队列自动机或图灵机的复杂性。
May, 2018
本研究分析了当前用于图像识别的大多数深度神经网络 (DNN) 的性能指标,包括识别准确率、模型复杂度、计算复杂度、内存使用和推断时间等,并通过在两种不同计算机架构上的实验来测量指标,以帮助研究者们了解目前已经研究探索的解决方案及其未来发展方向,并帮助从业者选择最适合其资源限制的 DNN 架构。
Oct, 2018
本文介绍了使用较低的精度来训练深度神经网络的成功实践,通过引入基于块的操作和浮点随机取整等技术,成功地实现了在 8 位浮点数下对多种深度学习模型和数据集进行了精确的训练。这些新技术为新一代硬件训练平台奠定了基础,并具有提高 2-4 倍吞吐量的潜力。
Dec, 2018
本文从深度卷积神经网络的内在分类入手,将现有研究成果归纳为七大类,即空间利用、深度、多路径、宽度、特征图利用、通道增强和注意力,同时介绍CNN组件的基础理解、当前挑战和应用领域。
Jan, 2019
本论文探讨在视觉领域中,使用最新的神经网络能否正确识别数量较大或较小的物品;研究结果表明,使用数值偏好的神经网络模型在数量辨别中表现最佳,但在转移实验中表现不佳。
Mar, 2023
本文回顾了近年来关于深度学习在数学领域的研究,认为当前即使是最先进的深度学习模型在面对简单的数学和算术任务时也表现出较大局限性。
Mar, 2023