Jun, 2019

推断虚拟代理行为及其参数

TL;DR该研究提出了一种通用方法,允许代理根据交互历史推断出行为类型及其对应的概率分布,维护每种行为类型的参数估计,并通过不断更新参数估计来提高性能。