KDDDec, 2021

客户支持机器人中的上下文强化学习应用

TL;DR本文讨论了使用上下文赌博机(CB)的微软虚拟代理的实现情况,包括基于神经 - 线性赌博机(NLB)的意图消岐和基于一组多臂赌博机(MAB)的上下文推荐。我们的解决方案已经落地生产并通过 A/B 测试证实了业务指标的改进,包括问题解决率相对增加了 12%以上,转移到人工操作员的相对减少了 4%以上。