BriefGPT.xyz
Ask
alpha
关键词
interpretable components
搜索结果 - 3
使用稀疏自编码器解释注意力层输出
稀疏自编码器被应用于解释训练好的 Transformer 模型的内部激活值,发现它们能够找到一种稀疏而可解释的分解表示,从而帮助研究人员更详细地解释模型行为,并深化对电路语义的理解。
PDF
15 days ago
通过解耦位置和上下文揭示 Transformer 中的隐藏几何结构
通过将训练后的 Transformer 的隐藏状态或嵌入分解成可解释的组件,本文介绍了一种简单而有信息量的方法,揭示了输入格式在上下文学习和算术任务中的结构洞察。
PDF
9 months ago
非参数回归中基于组合核搜索的结构发现
本文提出一种通过组合基本核函数来寻找最优核函数的方法,使得拟合函数能够分解为易于理解的部分,从而实现对时间序列数据的长程外推,并在多种预测任务上表现出色。
PDF
11 years ago
Prev
Next