关键词reinforced self-training
搜索结果 - 4
  • ReST-MCTS*: LLM 自训练通过过程奖励引导的树搜索
    PDFa month ago
  • CVPR利用自我训练大型语言模型改进视觉程序合成与视觉强化
    PDF3 months ago
  • 强化自训练(ReST)的语言建模
    PDFa year ago
  • 机器阅读理解的稳健领域自适应
    PDF2 years ago
Prev
Next