BriefGPT.xyz
Ask
alpha
关键词
hidden state vectors
搜索结果 - 2
未来视角:从单个隐藏状态预测后续标记
利用隐藏状态向量进行预测模型,使用线性逼近和因果干预方法对 GPT-J-6B 网络中的隐藏状态进行评估,发现某些层的单一隐藏状态可以以超过 48% 的准确率近似模型输出,并提出了 “未来镜头” 可视化方法来呈现 Transformer 状态
→
PDF
8 months ago
神经阅读器隐藏状态向量中的紧急预测结构
通过对阅读理解神经网络架构进行实验,我们证实了隐藏状态向量中出现 “预测结构” 的现象,表明隐藏状态向量表示包含语义属性(谓词)和常量实体标识符的原子公式。
PDF
8 years ago
Prev
Next