BriefGPT.xyz
Ask
alpha
关键词
calm
搜索结果 - 2
语言模型中的循环学习:数据优化方法在文本游戏中进行推荐行为的学习
通过更新大型语言模型(LLMs)在基于文本游戏学习过程中的使用以减少对人类注释游戏的依赖性,提高 LLMs 的性能,并研究了从游戏中训练的模型到其他游戏的可迁移性。
PDF
8 months ago
基于能力的语言模型分析
本文提出了 CALM 实验框架并使用梯度基于对抗攻击的方法对语言模型的内部表示进行破坏性实验,以评估其在执行特定任务时使用每个表示的能力。在对 BERT 等 LM 执行对应关系提示任务的案例研究中,发现 LM 在执行每个任务时所利用的表示高
→
PDF
a year ago
Prev
Next