BriefGPT.xyz
Ask
alpha
关键词
unbiased reward function
搜索结果 - 1
IJCAI
DenseLight:大规模交通信号的高效密集反馈控制
本研究提出利用无偏奖励函数提供密集反馈信息和非本地增强交通信号控制智能体更好地预测交通状况以实现更精确的交通控制的新型增强学习交通信号控制(TSC)方法,并经过了大量实验和消融研究验证其性能优于先进的基线方法。
PDF
a year ago
Prev
Next