关键词scaling behaviors
搜索结果 - 4
  • 数据混合的高效实现:语言模型预训练的双变量缩放法
    PDFa month ago
  • 基于 PPO 的 RLHF 的 N + 实现细节:TL;DR 摘要的案例研究
    PDF3 months ago
  • 将红队化的语言模型减少危害:方法、扩展行为与经验教训
    PDF2 years ago
  • 路由语言模型的统一缩放定律
    PDF2 years ago
Prev
Next