BriefGPT.xyz
Ask
alpha
关键词
dialog manager
搜索结果 - 1
ACL
从弱演示中学习对话策略
本研究提出一种基于 Deep Q-learning from Demonstrations 的 Reinforced Fine-tune Learning 方法,利用 labeled、reduced-labeled 和 unlabeled
→
PDF
4 years ago
Prev
Next