BriefGPT.xyz
Ask
alpha
关键词
average-hard attention
搜索结果 - 1
平均困难注意力变换器是恒定深度均匀阈值电路
该论文研究了 Transformers 模型在自然语言处理任务中的应用,并发现它们与常深度门电路之间的关系,通过两个假设(平均难度的注意力和对内部计算相对于输入长度的对数精度)。研究表明,平均难度的注意力 Transformers 可以识别
→
PDF
a year ago
Prev
Next