关键词distributional constraints
搜索结果 - 3
- 离线不平衡数据集的强化学习
通过在分布式的约束条件如 onservative Q-learning 基础上引入信息检索过程,有效地减轻了失衡数据集所带来的挑战,我们提出了一种新颖的离线强化学习方法,并在不同程度失衡的数据集上的几个任务中评估了其优劣。
- 使用分布式约束在神经对话模型中生成更有趣的回复
提出了一种简单而有效的方法,在生成会话等输出多样化任务时引入分布式约束的辅助信息,通过利用语法、主题模型和语义相似性来生成更具内容丰富性的响应,实验证明这种方法可以生成精细的响应,且不牺牲可信度。
- 带软多样性约束的委员会选举规则
提出了一个基于软界限的多样化委员会选择的实用多项式时间算法。