关键词model behavior
搜索结果 - 49
  • 助人良侣还是斐然促进者?研究角色对语言模型行为的影响
    PDF4 days ago
  • 使用稀疏自编码器解释注意力层输出
    PDF11 days ago
  • 针对性负训练实现语言模型的最小目标更新
    PDF17 days ago
  • 语言模型中的拒绝是由单方向引发的
    PDF19 days ago
  • 通过近似展开的差分训练数据归因
    PDF2 months ago
  • COIG-CQIA:中文指导微调只需一切皆优质
    PDF3 months ago
  • 企业中的提示工程实践探索
    PDF4 months ago
  • 信息流路径:大规模自动解释语言模型
    PDF4 months ago
  • 我的答案是 C”:指令调整的语言模型中的首词概率与文本答案不匹配
    PDF4 months ago
  • ControlLM: 为语言模型打造多样化个性
    PDF5 months ago
  • 交叉熵 vs. 标签平滑:神经崩溃视角
    PDF5 months ago
  • Patchscope:语言模型隐藏表示的统一检查框架
    PDF6 months ago
  • 通过对比激活添加驾驭 Llama 2
    PDF7 months ago
  • 深度神经网络的学会与遗忘:通过梯度投影最小化遗忘干扰
    PDF7 months ago
  • 寻找的子空间是否是这个?子空间激活修补的可解释性幻觉
    PDF7 months ago
  • 通过概念瓶颈解读预训练语言模型
    PDF8 months ago
  • 亲爱的,告诉我出了什么问题”,通过合作生成实现文本鉴别模型的全球解释
    PDF8 months ago
  • 语言模型中事实性回忆机制的表征
    PDF8 months ago
  • 预测不确定性的模型无关变量重要性:一种基于熵的方法
    PDF9 months ago
  • EMNLP基于方法的地基和全面发展:跨模态和跨语言连接研究的一种方法论
    PDF9 months ago
Prev