关键词steering vectors
搜索结果 - 5
  • 无副作用的驾驶:提高语言模型的部署后控制
    PDF15 days ago
  • 大型语言模型的个性化引导:通过双向偏好优化实现多功能引导向量
    PDFa month ago
  • 用均值居中改进语言模型中的激活引导
    PDF7 months ago
  • 激活增加:不经优化的引导语言模型
    PDFa year ago
  • ACL从预训练语言模型中提取潜在的操纵向量
    PDF2 years ago
Prev
Next