关键词multi-step tasks
搜索结果 - 7
- 多步任务中的智能提问优化:融合人类反馈和偏好对齐PDF5 months ago
- 使用工作流和行动计划提高任务导向对话的泛化能力PDFa year ago
- 利用关系抽象进行推理的学习PDF2 years ago
- 高效稳定的多步稀疏奖励强化学习的抽象演示和自适应探索PDF2 years ago
- 基于用户和任务的对话系统引导PDF2 years ago
- 通过示范向自回归语言模型教授复杂任务PDF3 years ago
- 理解机器人学习过程中教师凝视模式PDF5 years ago
Prev
Next