BriefGPT.xyz
Ask
alpha
关键词
representational capabilities
搜索结果 - 2
Transformer 和循环体系结构在表示能力上的区别
通过实验和理论分析比较了 Transformer 和 RNN 在不同任务上的表征能力、模型大小以及性能差异。
PDF
23 days ago
ACL
大型语言模型中的数字大小比较效应
本文研究大型语言模型(LLMs)是否能够准确地表示数字,并发现尽管缺少直接支持这些表示的神经电路,不同结构的 LLMs 中存在着类似于人类语言使用者的数字表示,这证明了使用行为基准理解 LLMs 的实用性,并为今后关于 LLMs 数字表示和
→
PDF
a year ago
Prev
Next