Jun, 2024

利用强化学习在图表示上进行对话代理的知识获取

TL;DR我们开发了一个人工智能代理,通过与其他代理进行对话来积极增加其知识库,并通过识别新的集成信念周围的图模式来生成对话响应,我们展示了在交互中可以使用强化学习来学习选择有效的图形模式,而无需依赖明确的用户反馈,并在这一背景下,我们的研究证明了利用用户作为信息来源的可行性。