关键词fine-grained reward modeling
搜索结果 - 2
  • ViGoR: 用细粒度的奖励建模提高大型视觉语言模型的视觉关联能力
    PDF5 months ago
  • 逐步强化
    PDF8 months ago
Prev
Next