Sep, 2022

利用K均值算法高效搜索主动推理策略空间

TL;DR本文提出了一种用向量空间嵌入法来进行政策选择的方法,并使用k-means聚类算法选择代表点,以在目标取向的图遍历问题中实现了更高效的政策选择。