关键词autoregressive neural language models
搜索结果 - 3
- 隐蔽的洞:语言模型的拓扑学问题
通过研究基于原始文本数据训练的自回归神经语言模型中出现的表示流形的拓扑属性,我们引入计算代数拓扑学的工具,使用其作为拓扑复杂度的度量标准(称为穿孔),以研究 GPT 的拓扑结构随深度和时间的演变,与门控循环模型进行比较,发现门控循环模型表现 - ACL太大而无法失败:较大规模的语言模型对痴呆相关语言异常的诱导具有不成比例的抵抗力
神经网络的内在评估指标,困惑度(PPL),被广泛用于理解自回归神经语言模型(NLMs)的行为。该研究探索了一种新型的双向注意力头切除方法,其呈现了与人脑研究中认知和大脑储备概念相关的特性,暗示了转换器模型中的注意机制可能与神经退行性疾病和衰 - EMNLP自回归语言模型中的增量解析状态探测
本研究评估了自回归神经语言模型在句法上对语法结构维护能力的学习程度,提出了几种用于从自回归语言模型中提取不完全的句法结构的探测器,并发现这些探测器可用于预测模型对于可疑前缀的偏好、对模型的表现进行因果干预,从而表明自回归神经语言模型的下一词