BriefGPT.xyz
Ask
alpha
关键词
prediction process
搜索结果 - 4
基于散乱数据逼近的观测特定解释
本研究介绍了观测特定解释的定义,通过为每个数据点分配与其在预测过程中的重要性成比例的分数。这种解释涉及对感兴趣的黑匣子模型中最具影响力的观测的识别。通过利用正交匹配追踪算法构建散乱数据逼近的代理模型来估计这些解释的建议方法。该方法在模拟和真
→
PDF
3 months ago
LM 透明工具:用于分析 Transformer 语言模型的交互工具
我们提出了 LM 透明工具(LM-TT),这是一种用于分析基于 Transformer 的语言模型内部机制的开源交互式工具包。与以往专注于决策过程的独立部分的工具不同,我们的框架旨在使整个预测过程透明化,并允许从顶层表示到模型非常细粒度的部
→
PDF
3 months ago
从人类行为角度探索语言模型
基于人类行为学视角,我们探究了大型语言模型(LLMs)的预测过程和内部机制,通过将 LLMs 的值与眼动测量结果相关联,发现 LLMs 表现出与基于 RNN 的语言模型不同的预测模式。此外,随着前馈网络(FFN layers)的升级,记忆和
→
PDF
9 months ago
EMNLP
变压器前馈层通过在词汇空间中促进概念来建立预测
通过反向工程变压器模型中的前馈神经网络层的运算过程,分析其词汇空间中的更新,控制预测结果,提高计算效率。
PDF
2 years ago
Prev
Next