BriefGPT.xyz
Ask
alpha
关键词
distance-based predictors
搜索结果 - 1
EMNLP
基於 GPT-2 注意力模式的熵和距離預測器,預測閱讀時間超過 GPT-2 驚奇值
本文探讨了 Transformer-based 大型语言模型的自我注意力机制在认知建模领域中的作用,提出了基于熵和距离的预测器,并证明了在使用与 GPT-2 语言模型相关的数据进行回归实验时,距离预测器相较于基于 surprisal 的预测
→
PDF
2 years ago
Prev
Next