Sep, 2023

支持向量机中节点选择的强化学习

TL;DR使用一种新颖的双模拟技术,通过强化学习模型从整个树状态中选择节点,借助图神经网络生成基于路径的概率分布,将节点选择建模为概率分布,训练模型以实现高质量的节点选择策略,并在严格时间约束下,在多个基准测试中显示出显著的性能改进。