Jan, 2024

优化领域聊天机器人的 RAG 强化学习

TL;DR通过采用基于 RAG 的 RL 优化方法,使用信息熵损失函数构建了一个使用 FAQ 数据回答用户查询的聊天机器人,该模型在检索准确性和领域外查询检测方面表现显著优于通用公开嵌入模型,同时能实现成本节省和细微的准确性改善。