关键词rl-tuned model
搜索结果 - 1
  • VLRM:视觉语言模型用作图像字幕的奖励模型
    PDF3 months ago
Prev
Next