BriefGPT.xyz
Ask
alpha
关键词
global patterns
搜索结果 - 3
AttentionViz: Transformer 注意力的全局视图
本文介绍了一种新的可视化技术,旨在帮助研究人员理解转换器中的自我注意机制,并演示了基于 query-key 嵌入的交互式可视化工具 AttentionViz,以改进模型的理解和提供关于查询 - 键交互的新见解。
PDF
a year ago
通过相对位置对知识图谱进行文本生成的图结构建模
本文介绍了 Graformer,一种新颖的基于 Transformer 的编码器 - 解码器体系结构,用于图形到文本的生成。使用我们新颖的图形自我关注,节点的编码依赖于输入图中的所有节点,促进了全局模式的检测。通过学习不同关注头的节点之间的
→
PDF
4 years ago
全球思考,本地行动:高维时间序列预测的深度神经网络方法
本文提出了一种能够全局认知并在本地进行校准的深度预测模型 DeepGlo, 它是一个混合模型,将全局矩阵因式分解模型与另一个能够捕捉每个时间序列及相关协变量的局部属性的时间网络相结合,证明了 DeepGlo 对于高维时间序列的预测要比其他方
→
PDF
5 years ago
Prev
Next