BriefGPT.xyz
Ask
alpha
关键词
neural gpu
搜索结果 - 4
ICLR
现代神经网络结构的图灵完备性
本文讲述了研究者探讨替代循环神经网络的新架构(如基于注意力或卷积的架构)的计算能力,通过研究 Transformer 和 Neural GPU 的计算能力,发现这两种模型都可以纯粹依靠计算和访问数据的内部密集表示而成为图灵完备的,而不需要外
→
PDF
5 years ago
改进基于神经网络 GPU 的算法学习架构
介绍一种提高训练效率和泛化能力的神经 GPU 算法,该算法利用新的技术和对活动存储结构的对角门技术来学习十进制乘法。
PDF
7 years ago
神经 GPU 的扩展和限制
本文介绍了两种方式来改进神经 GPU 模型,包括设计课程和增加模型大小,在 10 进制表示下解决所有算术操作并学习执行多操作数算术表达式,同时调查其故障模式与对手示例相似。
PDF
8 years ago
神经 GPU 学习算法
本研究提出一种神经网络结构 —— 神经 GPU 来解决 Neural Turing Machine 中存在的训练难题,实现了对于尺寸不确定的输入进行算法训练,并能成功地推广到更长的算法实例中。通过参数共享放松、少量的 dropout 和渐变
→
PDF
9 years ago
Prev
Next