关键词multi-round interactions
搜索结果 - 3
  • Reflect-RL: 用于语言模型的两人在线强化学习微调
    PDF5 months ago
  • 透过最优控制的镜头看待提示工程
    PDF8 months ago
  • CVPR用于高效交互式视频物体分割的记忆聚合网络
    PDF4 years ago
Prev
Next