关键词preference fine-tuning
搜索结果 - 1
  • LLM 的偏好微调应利用次优的,符合策略的数据
    PDF3 months ago
Prev
Next